مثيلات Amazon EC2 P5

مثيلات عالية الأداء مستندة إلى وحدة معالجة الرسومات للتعليم العميق وتطبيقات الحوسبة عالية الأداء

ما سبب أهمية مثيلات Amazon EC2 P5؟

مثيلات P5 المستندة إلى Amazon Elastic Compute Cloud‏ (Amazon EC2)، والمدعومة بوحدات NVIDIA H100 Tensor Core GPUs، ومثيلات P5e وP5en المدعومة من وحدات NVIDIA P5en Tensor Core GPUs توفر أعلى أداء في Amazon H200 لتطبيقات التعليم العميق (DL) وتطبيقات الحوسبة عالية الأداء (HPC). فهي تساعدك على تسريع وقت الوصول إلى الحل بنسبة تصل إلى 4 أضعاف مقارنة بمثيلات EC2 من الجيل السابق المستندة إلى وحدة معالجة الرسومات (GPU)، وتقليل تكلفة تدريب نماذج تعلّم الآلة (ML) بنسبة تصل إلى 40%. تساعدك هذه المثيلات على تكرار الحلول بوتيرة أسرع والوصول إلى السوق بسرعة أكبر. يمكنك استخدام مثيلات P5 وP5e وP5en للتدريب ونشر نماذج اللغة الكبيرة (LLMs) المعقدة بشكل متزايد ونماذج الانتشار التي تساعد على تشغيل تطبيقات الذكاء الاصطناعي (AI) المولّد الأكثر تطلبًا. وتشمل هذه التطبيقات الإجابة عن الأسئلة، وتوليد التعليمات البرمجية، وتوليد الفيديو والصور، والتعرف على الكلام. يمكنك أيضًا استخدام مثيلات P5 وP5e لنشر تطبيقات الحوسبة عالية الأداء (HPC) المطلوبة على نطاق واسع لاكتشاف المستحضرات الدوائية والتحليل الزلزالي والتنبؤ بالطقس والنمذجة المالية.

ولتحقيق هذه التحسينات في الأداء والتوفير في التكاليف، تُكمّل مثيلات P5 وP5e وحدات معالجة الرسومات من نوع NVIDIA P5e Tensor Core بأداء وحدة NVIDIA H100 and H200 Tensor Core GPUs الأعلى بمقدار الضعف مقارنة بوحدات المعالجة المركزية (CPU)، وذاكرة النظام الأعلى بمقدار الضعف، ومساحة التخزين المحلية الأعلى بمقدار أربعة أضعاف مقارنة بالمثيلات المستندة إلى وحدة معالجة الرسومات من الجيل السابق. تقوم مثيلات P5en بإقران وحدات معالجة الرسومات NVIDIA H200 Tensor Core GPUs مع وحدة المعالجة المركزية Intel Sapphire Rapids CPU عالية الأداء، مما يتيح Gen5 PCIe بين وحدة المعالجة المركزية (CPU) ووحدة معالجة الرسومات (GPU). توفر مثيلات P5en ما يصل إلى 4 أضعاف عرض النطاق الترددي بين وحدة المعالجة المركزية (CPU) ووحدة معالجة الرسومات (GPU) وزمن انتقال أقل للشبكة مقارنة بمثيلات P5e وP5 وبالتالي تحسين أداء التدريب الموزع. يوفر دعم مثيلات P5 وP5e ما يصل إلى 3200 جيجابت في الثانية من الشبكات باستخدام الجيل الثاني من Elastic Fabric Adapter‏ (EFA). يُظهر P5en، مع الجيل الثالث من EFA باستخدام Nitro v5، تحسنًا يصل إلى 35% في وقت الاستجابة مقارنة بـ P5 الذي يستخدم الجيل السابق من EFA وNitro. يساعد ذلك على تحسين أداء الاتصالات الجماعية لأعباء العمل التدريبية الموزعة مثل التعليم العميق والذكاء الاصطناعي المولّد ومعالجة البيانات في الوقت الفعلي وتطبيقات الحوسبة عالية الأداء (HPC). لتوفير حوسبة واسعة النطاق في زمن انتقال منخفض، يتم نشر هذه المثيلات في Amazon EC2 UltraClusters التي تتيح توسيع نطاق ما يصل إلى 20000 وحدة معالجة رسومات H100 أو H200 متصلة بشبكة غير قابلة للحظر بحجم بيتابت. يمكن لمثيلات P5 وP5e وP5en في مجموعات P5en UltraClusters تقديم ما يصل إلى 20 إكسافلوب من قدرة الحوسبة الإجمالية - وهو أداء يعادل أداء الكمبيوتر العملاق.

مثيلات Amazon EC2 P5

الفوائد

تدريب نماذج معلمات 100B+ على نطاق واسع

يمكن لمثيلات P5 وP5e وP5en تدريب نماذج الذكاء الاصطناعي المولّد الكبيرة جدًا على نطاق واسع وتقديم ما يصل إلى 4 أضعاف أداء مثيلات الجيل السابق القائمة على وحدة معالجة الرسومات (GPU).

تقليل الوقت المستغرق في الحل والتكرار بشكل أسرع

تقلل مثيلات P5 وP5e وP5en من أوقات التدريب ووقت الحل من أسابيع إلى بضعة أيام فقط. يساعدك هذا على التكرار بوتيرة أسرع والوصول إلى السوق بسرعة أكبر.

خفض تكاليف البنية التحتية للتعليم العميق والحوسبة عالية الأداء

توفر مثيلات P5 وP5e وP5en ما يصل إلى 40% من تكاليف التدريب على التعليم العميق (DL) والبنية التحتية للحوسبة عالية الأداء (HPC) مقارنةً بمثيلات EC2 من الجيل السابق المستندة إلى وحدة معالجة الرسومات (GPU).

شغِّل التدريب الموزع الحوسبة عالية الأداء باستخدام حوسبة exascale

توفر مثيلات P5 وP5e وP5en ما يصل إلى 3200 جيجابت في الثانية من شبكات EFA. تُنشَر هذه المثيلات في EC2 UltraClusters وتوفر 20 إكسافلوب من إمكانات الحوسبة الإجمالية.

المزايا

NVIDIA H100 وH200 Tensor Core GPUs

توفر مثيلات P5 ما يصل إلى 8 وحدات من وحدات معالجة الرسومات من نوع NVIDIA H100 بإجمالي ذاكرة HBM3 GPU تصل إلى 640 جيجابايت لكل مثيل. توفر مثيلات P5e وP5en ما يصل إلى 8 وحدات NVIDIA P5en GPUs بإجمالي ذاكرة GPU H200 تصل إلى 1128 وحدة HBM3e GPU لكل مثيل. تدعم كلا توعي المثيلات ما يصل إلى 900 جيجابت/ثانية من التوصيل البيني لوحدة معالجة الرسومات NVSwitch GPU (يبلغ إجمالي عرض النطاق ثنائي الأقسام 3.6 تيرابايت/ثانية في كل مثيل)، بحيث يمكن لكل وحدة من وحدات معالجة الرسومات (GPU) الاتصال بكل وحدة معالجة رسومات أخرى في المثيل نفسه بزمن استجابة أحادي الخطوة.

تعليمات محرك المحوِّل وDPX الجديدة

تحتوي وحدات معالجة الرسومات NVIDIA H100 وH200 على محرك محول جديد يدير بذكاء ويختار ديناميكيًا بين حسابات FP8 و16 بت. تساعد هذه الميزة على تقديم عمليات تسريع فائقة للتدريب على التعليم العميق على نماذج اللغة الكبيرة (LLMs) مقارنة بوحدات معالجة الرسومات من نوع A100 من الجيل السابق. بالنسبة لأحمال عمل الحوسبة عالية الأداء (HPC)، تحتوي وحدات معالجة الرسومات NVIDIA H100 وH200 على تعليمات DPX جديدة تزيد من تسريع خوارزميات البرمجة الديناميكية مقارنة بوحدات معالجة الرسومات A100.

شبكات عالية الأداء

تقدم مثيلات P5 وP5e وP5en ما يصل إلى 3200 جيجابت في الثانية من شبكات EFA. تقترن EFA أيضًا بـ NVIDIA GPUDirect RDMA لتمكين اتصال وحدة معالجة رسومات إلى وحدة معالجة رسومات أخرى (GPU-to-GPU) بزمن استجابة منخفض بين الخوادم مع وجود تجاوز في نظام التشغيل.

وحدة التخزين عالية الأداء

مثيلات P5 وP5e وP5en تدعم أنظمة ملفات Amazon FSx for Lustre حتى تتمكن من الوصول إلى البيانات التي تتميز بمعدل نقل يبلغ المئات من الجيجابايت/في الثانية وبملايين من عمليات الإدخال/الإخراج في الثانية (IOPS) المطلوبة لتلبية أعباء عمل التعليم العميق والحوسبة عالية الأداء واسعة النطاق. يدعم كل مثيل أيضًا ما يصل إلى 30 تيرابايت من مساحة تخزين NVMe SSD المحلية للوصول السريع إلى مجموعات البيانات الكبيرة. يمكنك أيضًا استخدام مساحة تخزين افتراضية غير محدودة وفعالة من حيث التكلفة باستخدام خدمة التخزين البسيطة في Amazon‏ (Amazon S3).

شهادات العملاء

في ما يلي بعض الأمثلة عن كيفية تحقيق العملاء والشركاء لأهداف أعمالهم باستخدام مثيلات Amazon EC2 P4.

Anthropic

تبني شركة Anthropic أنظمة ذكاء اصطناعي موثوقة وقابلة للتفسير والتوجيه وسيتاح لها عديد من الفرص لخلق قيمة تجارية ومنفعة عامة.

في Anthropic، نعمل على بناء أنظمة ذكاء اصطناعي موثوقة وقابلة للتفسير والتوجيه. على الرغم من تميز أنظمة الذكاء الاصطناعي العامة الكبيرة اليوم بفوائد كبيرة، فإنها يمكن أيضًا أن تكون غير متوقعة وغير موثوقة ومبهمة. هدفنا هو إحراز تقدم في هذه المشكلات ونشر الأنظمة التي يجدها الناس مفيدة. منظمتنا هي واحدة من المنظمات القليلة في العالم التي تبني نماذج تأسيسية في أبحاث التعليم العميق. هذه النماذج معقدة للغاية، ولتطوير هذه النماذج المتطورة والتدريب عليها، نحتاج إلى توزيعها بكفاءة عبر مجموعات كبيرة من وحدات معالجة الرسومات. نحن نستخدم مثيلات Amazon EC2 P4 على نطاق واسع اليوم، كما أننا متحمسون لإطلاق مثيلات P5. حيث نتوقع أنها ستقدم فوائد كبيرة فيما يخص السعر والأداء مقارنة بمثيلات P4d، وأنها ستكون متاحة على النطاق الضخم المطلوب لبناء الجيل التالي من نماذج اللغات الكبيرة والمنتجات ذات الصلة.

Tom Brown، المؤسس الشريك (Cofounder) لشركة Anthropic
Cohere

تمكِّن Cohere، الشركة الرائدة في مجال الذكاء الاصطناعي اللغوي، كل مطور وشركة من بناء منتجات رائعة باستخدام تقنية معالجة اللغة الطبيعية (NLP) الرائدة عالميًا مع الحفاظ على خصوصية البيانات وأمانها

تتولى Cohere المسؤولية في مساعدة كل شركة على تسخير قوة الذكاء الاصطناعي اللغوي لاستكشاف المعلومات وتوليدها والبحث عنها والتعامل معها بطريقة طبيعية وبسيطة، ونشرها عبر منصات سحابية متعددة في بيئة البيانات التي تناسب كل عميل بشكل أفضل. ستطلق مثيلات Amazon EC2 P5 التي تعمل بوحدة NVIDIA H100 العنان لقدرة الشركات على الإنشاء والنمو والتوسع بشكل أسرع من خلال قوتها الحاسوبية إلى جانب إمكانات LLM الحديثة وقدرات الذكاء الاصطناعي المولّد من Cohere.

Aidan Gomez، المدير التنفيذي (CEO) لشركة Cohere
Hugging Face

تتولى شركة Hugging Face مهمة إضفاء الطابع الديمقراطي على التعلّم الآلي الجيد.

بصفتنا مجتمع المصادر المفتوحة الأسرع نموًا للتعلّم الآلي، نقدم الآن أكثر من 150,000 نموذج مُدرَّب سابقًا و25000 مجموعة بيانات على منصتنا لمعالجة اللغة الطبيعية والرؤية الحاسوبية وعلم الأحياء والتعليم بواسطة التعزيز والمزيد. ومع التقدم الكبير في نماذج اللغة الكبيرة والذكاء الاصطناعي المولّد، فإننا نعمل مع AWS لبناء نماذج مستقبلية مفتوحة المصدر والإسهام بها. نحن نتطلع إلى استخدام مثيلات Amazon EC2 P5 عبر Amazon SageMaker على نطاق واسع في UltraClusters مع EFA لتسريع عملية توفير نماذج الذكاء الاصطناعي الأساسية الجديدة للجميع.

Julien Chaumond، مدير التكنولوجيا التنفيذي والمؤسس الشريك (CTO and Cofounder) في شركة Hugging Face

تفاصيل المنتج

حجم المثيل	وحدات المعالجة المركزية الافتراضية (vCPU)	ذاكرة المثيل (تيرابايت)	وحدة معالجة الرسوميات (GPU)	ذاكرة وحدة معالجة الرسومات (GPU)	النطاق الترددي للشبكة (جيجابت في الثانية)	GPUDirect RDMA	وحدة معالجة الرسوم (GPU) من نظير إلى نظير	سعة تخزين المثيل (تيرابايت)	عرض نطاق EBS (جيجابت في الثانية)
p5.48xlarge	192	2	8 H100	640 جيجابايت HBM3	EFA بسرعة 3200 جيجابت في الثانية	نعم	NVSwitch بسرعة 900 جيجابايت في الثانية	8 x 3.84 NVMe SSD	80
p5e.48xlarge	192	2	8 H200	1128 جيجابايت HBM3e	EFA بسرعة 3200 جيجابت في الثانية	نعم	NVSwitch بسرعة 900 جيجابايت في الثانية	8 x 3.84 NVMe SSD	80
p5en.48xlarge	192	2	8 H200	1128 GB HBM3e	EFA بسرعة 3200 جيجابت في الثانية	نعم	NVSwitch بسرعة 900 جيجابايت في الثانية	8 x‏ 3.84 NVMe SSD	100

بدء حالات استخدام تعلم الآلة (ML)

استخدم SageMaker

SageMaker هو خدمة مُدارة بالكامل لبناء نماذج التعلم الآلي وتدريبها وتوزيعها. باستخدام SageMaker HyperPod، يمكنك بسهولة التوسع إلى عشرات أو مئات أو آلاف وحدات معالجة الرسومات (GPUs) لتدريب نموذج بسرعة على أي نطاق دون القلق بشأن إعداد مجموعات التدريب المرنة وإدارتها.

استخدم DLAMI أو حاويات التعليم العميق

DLAMI توفر لممارسي تعلم الآلة والباحثين البنية التحتية والأدوات لتسريع التعليم العميق في السحابة، على أي نطاق. حاويات التعلم العميق هي صور Docker مثبتة سابقًا باستخدام أُطر عمل التعليم العميق لتبسيط نشر بيئات التعلم الآلي المخصصة من خلال السماح لك بتخطي العملية المعقدة لبناء بيئاتك وتحسينها من البداية.

استخدم Amazon EKS أو Amazon ECS

إذا كنت تفضل إدارة أعباء العمل المعتمدة على الحاويات من خلال خدمات تكوين الحاويات وتنسيقها وإدارتها المؤتمتة، فيمكنك نشر مثيلات P5 وP5e وP5en باستخدام Amazon EKS أو Amazon ECS.

بدء حالات استخدام الحوسبة عالية الأداء (HPC)

مثيلات P5 وP5e وP5en هي منصة مثالية لتشغيل عمليات المحاكاة الهندسية والمالية الحوسبية والتحليل الزلزالي ووضع النماذج الجزيئية والعلوم الوراثية والعرض وغيرها من أعباء عمل الحوسبة عالية الأداء المستندة إلى وحدات معالجة الرسومات. في أغلب الأحيان تتطلب تطبيقات الحوسبة عالية الأداء أداءً شبكيًا عاليًا وتخزينًا سريعًا وكميات كبيرة من الذاكرة وإمكانات حوسبة عالية أو تتطلبها كلها معًا. الأنواع الثلاثة تدعم شبكة EFA التي تمكّن تطبيقات الحوسبة عالية الأداء (HPC) باستخدام واجهة تمرير الرسائل (MPI) للتوسع إلى الآلاف من وحدات معالجة الرسومات (GPUs). تساعد AWS Batch وAWS ParallelCluster مطوري الحوسبة عالية الأداء على إنشاء تطبيقات الحوسبة عالية الأداء الموزعة وتوسيع نطاقها بسرعة.

تعرّف على المزيد

ابدأ باستخدام AWS

الخطوة 1 - اشترك للحصول على حساب AWS

الوصول على الفور إلى الطبقة المجانية من AWS.

تعرّف على المزيد

الخطوة 2 - تعلم مع برامج تعليمية مدتها 10 دقائق

استكشف وتعلَّم من خلال برامج تعليمية بسيطة.

تعرّف على المزيد

الخطوة 3 - ابدأ البناء مع AWS

ابدأ في الإنشاء باستخدام أدلة مُفصَّلة خطوة بخطوة لمساعدتك في إطلاق مشروع AWS الخاص بك.

تعرّف على المزيد

تحديد تفضيلات ملفات تعريف الارتباط

مثيلات Amazon EC2 P5

مثيلات عالية الأداء مستندة إلى وحدة معالجة الرسومات للتعليم العميق وتطبيقات الحوسبة عالية الأداء

ما سبب أهمية مثيلات Amazon EC2 P5؟

مثيلات Amazon EC2 P5

الفوائد

تدريب نماذج معلمات 100B+ على نطاق واسع

تقليل الوقت المستغرق في الحل والتكرار بشكل أسرع

خفض تكاليف البنية التحتية للتعليم العميق والحوسبة عالية الأداء

شغِّل التدريب الموزع الحوسبة عالية الأداء باستخدام حوسبة exascale

المزايا

NVIDIA H100 وH200 Tensor Core GPUs

تعليمات محرك المحوِّل وDPX الجديدة

شبكات عالية الأداء

وحدة التخزين عالية الأداء

شهادات العملاء

Anthropic

Cohere

Hugging Face

تفاصيل المنتج

بدء حالات استخدام تعلم الآلة (ML)

استخدم SageMaker

استخدم DLAMI أو حاويات التعليم العميق

استخدم Amazon EKS أو Amazon ECS

بدء حالات استخدام الحوسبة عالية الأداء (HPC)

ابدأ باستخدام AWS

الخطوة 1 - اشترك للحصول على حساب AWS

الخطوة 2 - تعلم مع برامج تعليمية مدتها 10 دقائق

الخطوة 3 - ابدأ البناء مع AWS

انتهاء دعم Internet Explorer