مثيلات Amazon EC2 P5
مثيلات عالية الأداء مستندة إلى وحدة معالجة الرسومات للتعليم العميق وتطبيقات الحوسبة عالية الأداء
توفر مثيلات P5 المستندة إلى سحابة الحوسبة المرنة لـ Amazon (Amazon EC2)، والمدعومة بأحدث وحدات معالجة الرسومات من نوع NVIDIA H100 Tensor Core، أعلى أداء في Amazon EC2 للتعليم العميق (DL) وتطبيقات الحوسبة عالية الأداء (HPC). فهي تساعدك على تسريع وقت الوصول إلى الحل بنسبة تصل إلى 6 أضعاف مقارنة بمثيلات EC2 المستندة إلى وحدة معالجة الرسومات من الجيل السابق، وتقليل تكلفة تدريب نماذج تعلّم الآلة بنسبة تصل إلى 40%. تساعدك مثيلات P5 على تكرار الحلول بوتيرة أسرع والوصول إلى السوق بسرعة أكبر. يمكنك استخدام مثيلات P5 للتدريب ونشر نماذج اللغة الكبيرة (LLMs) المعقدة بشكل متزايد ونماذج الانتشار التي تساعد على تشغيل تطبيقات الذكاء الاصطناعي (AI) المولّد الأكثر تطلبًا. وتشمل هذه التطبيقات الإجابة عن الأسئلة، وتوليد التعليمات البرمجية، وتوليد الفيديو والصور، والتعرف على الكلام. يمكنك أيضًا استخدام مثيلات P5 لنشر تطبيقات HPC المطلوبة على نطاق واسع لاكتشاف المستحضرات الدوائية والتحليل الزلزالي والتنبؤ بالطقس والنمذجة المالية.
ولتحقيق هذه التحسينات في الأداء والتوفير في التكاليف، تُكمّل مثيلات P5 وحدات معالجة الرسومات من نوع NVIDIA H100 Tensor Core بأداء وحدة المعالجة المركزية الأعلى بمقدار الضعف، وذاكرة النظام الأعلى بمقدار الضعف، ومساحة التخزين المحلية الأعلى بمقدار أربعة أضعاف مقارنة بالمثيلات المستندة إلى وحدة معالجة الرسومات من الجيل السابق. إنها توفر إمكانات توسيع رائدة في السوق للتدريب الموزع وأعباء عمل HPC المقترنة بإحكام مع ما يصل إلى 3200 جيجابت في الثانية من الشبكات باستخدام Elastic Fabric Adapter (EFAv2) من الجيل الثاني. لتوفير حوسبة واسعة النطاق بزمن استجابة منخفض، تُنشَر مثيلات P5 في Amazon EC2 UltraClusters حيث تتيح توسيع نطاق ما يصل إلى 20,000 وحدة من وحدات معالجة الرسومات H100. وهي متصلة بشبكة غير محظورة على نطاق بيتابت. توفر مثيلات P5 في EC2 UltraClusters ما يصل إلى 20 إكسافلوب من إمكانات الحوسبة الإجمالية—وهو أداء يعادل أداء الكمبيوتر العملاق.
الفوائد
تدريب نماذج معلمات 100B+ على نطاق واسع
يمكن لمثيلات P5 تدريب نماذج الذكاء الاصطناعي المولّد الكبيرة جدًا على نطاق واسع وتوفير ما يصل إلى 6 أضعاف أداء مثيلات EC2 المستندة إلى وحدة معالجة الرسومات من الجيل السابق.
تقليل الوقت المستغرق في الحل والتكرار بشكل أسرع
تقلل مثيلات P5 من أوقات التدريب ووقت الحل من أسابيع إلى بضعة أيام فقط. يساعدك هذا على التكرار بوتيرة أسرع والوصول إلى السوق بسرعة أكبر.
خفض تكاليف البنية التحتية للتعليم العميق والحوسبة عالية الأداء
توفر مثيلات P5 ما يصل إلى 40% من تكاليف التدريب على التعليم العميق والبنية التحتية للحوسبة عالية الأداء مقارنةً بمثيلات EC2 المستندة إلى وحدة معالجة الرسومات من الجيل السابق.
شغِّل التدريب الموزع الحوسبة عالية الأداء باستخدام حوسبة exascale
توفر مثيلات P5 ما يصل إلى 3200 جيجابت في الثانية من شبكات EFAv2. تُنشَر هذه المثيلات في EC2 UltraClusters وتوفر 20 إكسافلوب من إمكانات الحوسبة الإجمالية.
الميزات
وحدات معالجة الرسومات من نوع NVIDIA H100 Tensor Core
توفر مثيلات P5 ما يصل إلى 8 وحدات من وحدات معالجة الرسومات من نوع NVIDIA H100 بإجمالي ذاكرة HBM3 GPU تصل إلى 640 جيجابايت لكل مثيل. تدعم مثيلات P5 ما يصل إلى 900 جيجابت/ثانية من التوصيل البيني لوحدة معالجة الرسومات NVSwitch (يبلغ إجمالي عرض النطاق ثنائي الأقسام 3.6 تيرابايت/ثانية في كل مثيل)، بحيث يمكن لكل وحدة من وحدات معالجة الرسومات الاتصال بكل وحدة معالجة رسومات أخرى في المثيل نفسه بزمن استجابة أحادي الخطوة.
تعليمات محرك المحوِّل وDPX الجديدة
تحتوي وحدات معالجة الرسومات من نوع NVIDIA H100 على محرك محوِّل جديد يدير حسابات FP8 و16 بت بذكاء ويختار بينها ديناميكيًا. تساعد هذه الميزة على تقديم عمليات تسريع فائقة للتدريب على التعليم العميق على نماذج اللغة الكبيرة (LLMs) مقارنة بوحدات معالجة الرسومات من نوع A100 من الجيل السابق. بالنسبة إلى أعباء عمل الحوسبة عالية الأداء، تحتوي وحدات معالجة الرسومات من نوع NVIDIA H100 على تعليمات DPX جديدة تزيد من سرعة خوارزميات البرمجة الديناميكية مقارنة بوحدات معالجة الرسومات من نوع A100.
شبكات عالية الأداء
توفر مثيلات P5 ما يصل إلى 3200 جيجابت في الثانية من شبكات EFAv2. توفر شبكات EFAv2 تحسينًا يصل إلى 50% في أداء الاتصالات الجماعية لأعباء عمل التدريب الموزع. تقترن EFAv2 أيضًا بـ NVIDIA GPUDirect RDMA لتمكين اتصال وحدة معالجة رسومات إلى وحدة معالجة رسومات أخرى بزمن استجابة منخفض بين الخوادم مع وجود تجاوز في نظام التشغيل.
وحدة التخزين عالية الأداء
تدعم مثيلات P5 أنظمة ملفات Amazon FSx for Lustre حتى تتمكن من الوصول إلى البيانات التي تتميز بمعدل نقل يبلغ المئات من الجيجابايت/في الثانية وبملايين من عمليات الإدخال/الإخراج في الثانية (IOPS) المطلوبة لتلبية أعباء عمل التعليم العميق والحوسبة عالية الأداء واسعة النطاق. يدعم كل مثيل P5 أيضًا ما يصل إلى 30 تيرابايت من مساحة تخزين NVMe SSD المحلية للوصول السريع إلى مجموعات البيانات الكبيرة. يمكنك أيضًا استخدام مساحة تخزين افتراضية غير محدودة وفعالة من حيث التكلفة باستخدام خدمة التخزين البسيطة في Amazon (Amazon S3).
مجموعات EC2 UltraClusters من الجيل الثاني
تُنشَر مثيلات P5 في مجموعات EC2 UltraClusters من الجيل الثاني، التي توفر بنية شبكة تتيح إمكانية التوسع بشكل أكبر وتقليل قفزات الشبكة عبر الكتلة وتوفير زمن استجابة أقل مقارنة بالجيل السابق من UltraClusters. يمكن لمثيلات P5 في UltraClusters توسيع النطاق لما يصل إلى 20,000 وحدة معالجة رسومات من نوع H100 متصلة بشبكة على نطاق petabit وتوفير 20 إكسافلوب من إمكانات الحوسبة الإجمالية.
التكامل السلس مع خدمات AWS الأخرى
يمكن نشر مثيلات P5 باستخدام AWS Deep Learning AMI (DLAMI) وحاويات التعليم العميق. وهي متوفرة من خلال الخدمات المُدارة مثل Amazon SageMaker وخدمة Kubernetes المرنة بـ Amazon (Amazon EKS) وخدمة الحاويات المرنة بـ Amazon (Amazon ECS) و AWS Batch والمزيد.
قصص العملاء
تبني شركة Anthropic أنظمة ذكاء اصطناعي موثوقة وقابلة للتفسير والتوجيه وسيتاح لها عديد من الفرص لخلق قيمة تجارية ومنفعة عامة.
"في Anthropic، نعمل على بناء أنظمة ذكاء اصطناعي موثوقة وقابلة للتفسير والتوجيه. على الرغم من تميز أنظمة الذكاء الاصطناعي العامة الكبيرة اليوم بفوائد كبيرة، فإنها يمكن أيضًا أن تكون غير متوقعة وغير موثوقة ومبهمة. هدفنا هو إحراز تقدم في هذه المشكلات ونشر الأنظمة التي يجدها الناس مفيدة. منظمتنا هي واحدة من المنظمات القليلة في العالم التي تبني نماذج تأسيسية في أبحاث التعليم العميق. هذه النماذج معقدة للغاية، ولتطوير هذه النماذج المتطورة والتدريب عليها، نحتاج إلى توزيعها بكفاءة عبر مجموعات كبيرة من وحدات معالجة الرسومات. نحن نستخدم مثيلات Amazon EC2 P4 على نطاق واسع اليوم، كما أننا متحمسون لإطلاق مثيلات P5. حيث نتوقع أنها ستقدم فوائد كبيرة فيما يخص السعر والأداء مقارنة بمثيلات P4d، وأنها ستكون متاحة على النطاق الضخم المطلوب لبناء الجيل التالي من نماذج اللغات الكبيرة والمنتجات ذات الصلة".
Tom Brown، المؤسس الشريك (Cofounder) لشركة Anthropic
تمكِّن Cohere، الشركة الرائدة في مجال الذكاء الاصطناعي اللغوي، كل مطور وشركة من بناء منتجات رائعة باستخدام تقنية معالجة اللغة الطبيعية (NLP) الرائدة عالميًا مع الحفاظ على خصوصية البيانات وأمانها
"تتولى Cohere المسؤولية في مساعدة كل شركة على تسخير قوة الذكاء الاصطناعي اللغوي لاستكشاف المعلومات وتوليدها والبحث عنها والتعامل معها بطريقة طبيعية وبسيطة، ونشرها عبر منصات سحابية متعددة في بيئة البيانات التي تناسب كل عميل بشكل أفضل. ستطلق مثيلات Amazon EC2 P5 التي تعمل بوحدة NVIDIA H100 العنان لقدرة الشركات على الإنشاء والنمو والتوسع بشكل أسرع من خلال قوتها الحاسوبية إلى جانب إمكانات LLM الحديثة وقدرات الذكاء الاصطناعي المولّد من Cohere".
Aidan Gomez، المدير التنفيذي (CEO) لشركة Cohere
تتولى شركة Hugging Face مهمة إضفاء الطابع الديمقراطي على التعلّم الآلي الجيد.
"بصفتنا مجتمع المصادر المفتوحة الأسرع نموًا للتعلّم الآلي، نقدم الآن أكثر من 150,000 نموذج مُدرَّب سابقًا و25,000 مجموعة بيانات على منصتنا لمعالجة اللغة الطبيعية والرؤية الحاسوبية وعلم الأحياء والتعليم بواسطة التعزيز والمزيد. ومع التقدم الكبير في نماذج اللغة الكبيرة والذكاء الاصطناعي المولّد، فإننا نعمل مع AWS لبناء نماذج مستقبلية مفتوحة المصدر والإسهام بها. نحن نتطلع إلى استخدام مثيلات Amazon EC2 P5 عبر Amazon SageMaker على نطاق واسع في UltraClusters مع EFA لتسريع عملية توفير نماذج الذكاء الاصطناعي الأساسية الجديدة للجميع".
Julien Chaumond، مدير التكنولوجيا التنفيذي والمؤسس الشريك (CTO and Cofounder) في شركة Hugging Face
تفاصيل المنتج
حجم المثيل | وحدة المعالجة المركزية الافتراضية (vCPU) | ذاكرة المثيل (تيرابايت) | وحدة معالجة الرسومات - H100 | ذاكرة وحدة معالجة الرسومات | عرض نطاق الشبكة | GPUDirectRDMA | وحدة معالجة الرسوم من نظير إلى نظير | سعة تخزين المثيل (تيرابايت) | عرض نطاق EBS (جيجابت في الثانية) |
p5.48xlarge |
192 |
2 |
8 |
ذاكرة HBM3 بسعة 640 جيجابايت |
EFAv2 بسرعة 3200 جيجابت في الثانية |
نعم |
NVSwitch بسرعة 900 جيجابايت في الثانية |
8 x 3.84 NVMe SSD |
80 |
*الأسعار المعروضة تخص Linux/Unix في منطقة AWS بشرق الولايات المتحدة (فيرجينيا الشمالية) وتم تقريبها إلى أقرب سنت. للاطلاع على تفاصيل التسعير الكاملة، راجع تسعير Amazon EC2.
ابدأ استخدام مثيلات P5 للتعلم الآلي
استخدم SageMaker
SageMaker هو خدمة مُدارة بالكامل لبناء نماذج التعلم الآلي وتدريبها وتوزيعها. عند استخدامها مع مثيلات P5، يمكنك التوسع بسهولة إلى العشرات أو المئات أو الآلاف من وحدات معالجة الرسوم لتدريب نموذج بسرعة على أي نطاق من دون القلق بشأن إعداد مجموعات ومسارات للبيانات.
استخدم DLAMI أو حاويات التعليم العميق
توفر DLAMI لممارسي التعلم الآلي والباحثين البنية التحتية والأدوات لتسريع التعليم العميق في السحابة، على أي نطاق. حاويات التعلم العميق هي صور Docker مثبتة سابقًا باستخدام أُطر عمل التعليم العميق لتبسيط نشر بيئات التعلم الآلي المخصصة من خلال السماح لك بتخطي العملية المعقدة لبناء بيئاتك وتحسينها من البداية.
استخدم Amazon EKS أو Amazon ECS
إذا كنت تفضل إدارة أعباء العمل المعتمدة على الحاويات من خلال خدمات تكوين الحاويات وتنسيقها وإدارتها المؤتمتة، فيمكنك نشر مثيلات P5 باستخدام Amazon EKS أو Amazon ECS.
ابدأ استخدام مثيلات P5 للحوسبة عالية الأداء
مثيلات P5 هي منصة مثالية لتشغيل عمليات المحاكاة الهندسية والمالية الحوسبية والتحليل الزلزالي ووضع النماذج الجزيئية والعلوم الوراثية والعرض وغيرها من أعباء عمل الحوسبة عالية الأداء المستندة إلى وحدات معالجة الرسومات. في أغلب الأحيان تتطلب تطبيقات الحوسبة عالية الأداء أداءً شبكيًا عاليًا وتخزينًا سريعًا وكميات كبيرة من الذاكرة وإمكانات حوسبة عالية أو تتطلبها كلها معًا. تدعم مثيلات P5 شبكة EFAv2 التي تمكّن تطبيقات الحوسبة عالية الأداء باستخدام واجهة تمرير الرسائل (MPI) للتوسع إلى الآلاف من وحدات معالجة الرسومات. تساعد AWS Batch وAWS ParallelCluster مطوري الحوسبة عالية الأداء على إنشاء تطبيقات الحوسبة عالية الأداء الموزعة وتوسيع نطاقها بسرعة.
تعرّف على المزيد »
بدء استخدام AWS
اشترك للحصول على حساب AWS
تمتع بالوصول الفوري إلى الطبقة المجانية من AWS.
التعلم مع برامج تعليمية مدتها 10 دقائق
استكشف وتعلَّم مع برامج تعليمية بسيطة.
بدء الإنشاء في وحدة التحكم
ابدأ في الإنشاء باستخدام توجيهات مُفصَّله خطوة بخطوة لمساعدتك على إطلاق مشروع AWS.