Phiên bản Amazon EC2 G5

Các phiên bản dựa trên GPU hiệu năng cao dành cho các ứng dụng có yêu cầu cao về đồ họa và suy luận máy học

Phiên bản Amazon EC2 G5 là phiên bản dựa trên GPU của NVIDIA thế hệ mới nhất có thể được sử dụng cho nhiều trường hợp sử dụng có yêu cầu cao về đồ họa và máy học. Phiên bản này mang lại hiệu năng tốt hơn tới 3 lần cho các ứng dụng chuyên sâu về đồ họa và suy luận máy học cũng như hiệu năng đào tạo máy học cao hơn tới 3,3 lần so với phiên bản Amazon EC2 G4dn.

Khách hàng có thể sử dụng phiên bản G5 cho các ứng dụng có yêu cầu cao về đồ họa như máy trạm từ xa, kết xuất video và chơi game để tạo ra đồ họa có độ chính xác cao theo thời gian thực. Với phiên bản G5, khách hàng máy học có được cơ sở hạ tầng hiệu năng cao và tiết kiệm chi phí để đào tạo và triển khai các mô hình lớn hơn và tinh vi hơn dành cho xử lý ngôn ngữ tự nhiên, thị giác máy tính và các trường hợp sử dụng công cụ khuyến nghị.

Phiên bản G5 lên tới 8 GPU NVIDIA A10G Tensor Core và bộ xử lý AMD EPYC thế hệ thứ hai. Chúng cũng hỗ trợ lên đến 192 vCPU, băng thông mạng lên đến 100 Gbps và dung lượng lưu trữ SSD NVMe cục bộ lên đến 7,6 TB.

Phiên bản Amazon EC2 G5 mới (1:20)

Lợi ích

Hiệu năng cao cho các ứng dụng có yêu cầu cao về đồ họa

Phiên bản G5 cung cấp hiệu năng đồ họa cao hơn tới 3 lần và tỷ lệ giá/hiệu năng tốt hơn tới 40% so với phiên bản G4dn. Chúng có nhiều lõi dò tia hơn bất kỳ phiên bản EC2 dựa trên GPU nào khác, sở hữu bộ nhớ 24 GB cho mỗi GPU và hỗ trợ công nghệ NVIDIA RTX. Vì thế đây chính là lựa chọn lý tưởng để nhanh chóng kết xuất các cảnh chân thực, chạy máy trạm ảo mạnh mẽ và hỗ trợ các ứng dụng nặng về đồ họa với độ chân thật cao hơn.

Hiệu năng cao và tiết kiệm chi phí cho suy luận ML

Phiên bản G5 cung cấp hiệu năng cao hơn tới 3 lần và tỷ lệ giá/hiệu năng tốt hơn tới 40% cho suy luận máy học so với phiên bản G4dn. Đây là một giải pháp hiệu năng cao và tiết kiệm chi phí cho những khách hàng muốn sử dụng các thư viện NVIDIA như TensorRT, CUDA và cuDNN để chạy các ứng dụng ML.

Đào tạo tiết kiệm chi phí cho các mô hình ML có độ phức tạp vừa phải

Phiên bản G5 đưa ra chi phí đào tạo thấp hơn tới 15% so với phiên bản Amazon EC2 P3. Chúng cũng cung cấp hiệu năng cao hơn tới 3,3 lần cho hoạt động đào tạo ML so với các phiên bản G4dn. Nhờ vậy, phiên bản này chính là giải pháp tiết kiệm chi phí để đào tạo các mô hình máy học một nút và có độ phức tạp vừa phải dành cho xử lý ngôn ngữ tự nhiên, thị giác máy tính và các trường hợp sử dụng công cụ khuyến nghị.

Tối đa hóa hiệu quả tài nguyên

Phiên bản G5 được xây dựng trên Hệ thống AWS Nitro, một sự kết hợp giữa phần cứng chuyên dụng và phần mềm giám sát máy ảo gọn nhẹ, hội tụ hầu như tất cả các tài nguyên điện toán và bộ nhớ của phần cứng lưu trữ vào phiên bản của bạn để có được hiệu năng tổng thể và tính bảo mật tốt hơn. Với các phiên bản G5, hệ thống Nitro cung cấp GPU ở chế độ passthrough, cung cấp hiệu năng tương đương với bare metal.

Tính năng

GPU NVIDIA A10G Tensor Core trên AWS

Các phiên bản G5 là phiên bản đầu tiên trên đám mây có GPU NVIDIA A10G Tensor Core mang lại hiệu năng cao cho các ứng dụng có yêu cầu cao về đồ họa và máy học. Mỗi phiên bản có đến 8 GPU A10G Tensor Core đi kèm với 80 lõi dò tia và bộ nhớ 24 GB cho mỗi GPU. Chúng cũng cung cấp 320 NVIDIA Tensor Core thế hệ thứ ba, đạt hiệu suất lên đến 250 TOPS nhằm mang lại hiệu năng cao cho khối lượng công việc ML.

Trình điều khiển NVIDIA

Phiên bản G5 cung cấp trình điều khiển NVIDIA RTX Enterprise và trò chơi cho khách hàng mà không tính thêm phí. Trình điều khiển NVIDIA RTX Enterprise có thể được sử dụng để cung cấp máy trạm ảo chất lượng cao cho một loạt các khối lượng công việc có yêu cầu cao về đồ họa. Trình điều khiển trò chơi NVIDIA cung cấp đồ họa tuyệt đỉnh và hỗ trợ điện toán cho hoạt động phát triển trò chơi. Các phiên bản G5 cũng hỗ trợ các thư viện CUDA, cuDNN, NVENC, TensorRT, cuBLAS, OpenCL, DirectX 11/12, Vulkan 1.1 và OpenGL 4.5.

Kết nối mạng và lưu trữ với hiệu năng cao

Các phiên bản G5 đi kèm với thông lượng mạng lên đến 100 Gbps cho phép các phiên bản này hỗ trợ nhu cầu về độ trễ thấp của suy luận máy học và các ứng dụng có yêu cầu cao về đồ họa. Bộ nhớ 24 GB cho mỗi GPU cùng với hỗ trợ dung lượng lưu trữ SSD NVMe cục bộ lên đến 7,6 TB cho phép lưu trữ cục bộ các mô hình và tập dữ liệu lớn để đào tạo và suy luận máy học hiệu năng cao. Phiên bản G5 cũng có thể lưu trữ cục bộ các tệp video lớn, qua đó tăng hiệu năng đồ họa và khả năng kết xuất các tệp video lớn hơn và phức tạp hơn.

Được phát triển trên hệ thống AWS Nitro

Phiên bản G5 được xây dựng trên Hệ thống AWS Nitro, hệ thống này là một tập hợp đa dạng các khối dựng, giúp giảm tải nhiều chức năng ảo hóa truyền thống sang phần cứng và phần mềm chuyên dụng để mang lại hiệu năng cao, độ sẵn sàng cao và độ bảo mật cao, đồng thời giảm tổng chi phí ảo hóa.

Chi tiết sản phẩm

  Kích cỡ phiên bản GPU Bộ nhớ GPU (GiB) vCPU Bộ nhớ (GiB) Ổ lưu trữ (GB) Băng thông mạng (Gbps) Băng thông EBS (Gbps) Giá theo yêu cầu/giờ* ISP 1 năm hiệu quả theo giờ (Linux) ISP 3 năm hiệu quả theo giờ (Linux)
Máy ảo (VM) một GPU g5.xlarge 1 24 4 16 1x250 Lên tới 10 Lên đến 3,5 1,006 USD 0,604 USD 0,402 USD
g5.2xlarge 1 24 8 32 1x450 Lên tới 10 Lên đến 3,5 1,212 USD 0,727 USD 0,485 USD
g5.4xlarge 1 24 16 64 1x600 Lên tới 25 8 1,624 USD 0,974 USD 0,650 USD
g5.8xlarge 1 24 32 128 1x900 25 16 2,448 USD 1,469 USD 0,979 USD
g5.16xlarge 1 24 64 256 1x1900 25 16 4,096 USD 2,458 USD 1,638 USD
                       
Máy ảo (VM) nhiều GPU g5.12xlarge 4 96 48 192 1x3800 40 16 5,672 USD 3,403 USD 2,269 USD
g5.24xlarge 4 96 96 384 1x3800 50 19 8,144 USD 4,886 USD 3,258 USD
g5.48xlarge 8 192 192 768 2x3800 100 19 16,288 USD 9,773 USD 6,515 USD

* Mức giá trình bày ở trên dành cho Khu vực AWS Miền Đông Hoa Kỳ (Bắc Virginia). Các mức giá cho phiên bản đặt trước 1 năm và 3 năm là dành cho các tùy chọn thanh toán "Trả trước một phần" hoặc "Không trả trước" đối với phiên bản không có tùy chọn Trả trước một phần.

Chứng thực từ khách hàng

Logo của Athenascope

Athenascope sử dụng những phát triển tiên tiến về thị giác máy tính và trí tuệ nhân tạo để phân tích lối chơi và tự động hiển thị những khoảnh khắc trò chơi hấp dẫn nhất để tạo ra các video nổi bật cho người chơi trò chơi và nhà sáng tạo nội dung.

"Để tạo ra trải nghiệm video liền mạch, phân tích video có độ trễ thấp bằng cách sử dụng các mô hình CV của chúng tôi là mục tiêu cơ bản đối với chúng tôi. Phiên bản Amazon EC2 G5 giúp cải thiện 30% tỷ lệ giá/hiệu năng so với các hoạt động triển khai trước đây với phiên bản G4dn".

Chris Kirmse, Giám đốc điều hành kiêm Nhà sáng lập, Athenascope

Netflix

Netflix là một trong những dịch vụ giải trí trực tuyến hàng đầu thế giới với 214 triệu thành viên trả phí tại hơn 190 quốc gia thưởng thức phim truyền hình dài tập, phim tài liệu và phim truyện thuộc nhiều thể loại và ngôn ngữ. 

"Xây dựng một studio trên đám mây để sáng tạo nội dung hoạt hình, kỹ xảo điện ảnh và phim chuyển thể cho người xem là ưu tiên hàng đầu đối với chúng tôi. Chúng tôi muốn cung cấp cho các nghệ sĩ khả năng linh hoạt để truy cập máy trạm bất cứ khi nào và ở bất cứ nơi nào họ cần. Chúng tôi không ngừng tìm cách giúp các nghệ sĩ của mình đổi mới bằng cách cung cấp cho họ quyền truy cập vào các máy trạm mạnh mẽ hơn".

Stephen Kowalski, Giám đốc kỹ thuật cơ sở hạ tầng sản xuất kỹ thuật số, Netflix

"Với phiên bản Amazon EC2 G5 mới, chúng tôi có thể cung cấp các máy trạm đồ họa cao cấp hơn để cung cấp hiệu năng cao hơn đến 3 lần so với máy trạm có phiên bản EC2 G4dn. Với phiên bản G5, các nhà sáng tạo nội dung có thể thoải mái tạo ra nội dung phức tạp và chân thực hơn cho người xem của chúng tôi".

Ben Tucker, Trưởng bộ phận kỹ thuật, Kỹ thuật hệ thống sản xuất hoạt hình, Netflix

Varjo
"Đối với các ứng dụng VR/XR cao cấp, phiên bản Amazon EC2 G5 có tác động rất lớn. Chúng tôi có thể chạy các ứng dụng chuyên nghiệp ở độ phân giải của mắt người đặc trưng của Varjo với tốc độ khung hình gấp ba lần so với các phiên bản G4dn được sử dụng trước đây, cung cấp cho khách hàng chất lượng trải nghiệm chưa từng thấy trước đây khi phát trực tuyến từ máy chủ". 

Urho Konttori, Nhà sáng lập và Giám đốc công nghệ, Varjo

Đọc nghiên cứu điển hình »

Bắt đầu

AMI học sâu của AWS (DLAMI) và Bộ chứa học sâu (DLC) của AWS

AMI học sâu của AWS (DLAMI) và Bộ chứa học sâu (DLC) của AWS cung cấp cho các nhà khoa học dữ liệu, chuyên viên ML và nhà nghiên cứu những hình ảnh máy và bộ chứa được cài đặt sẵn với các khung học sâu để giúp họ dễ dàng bắt đầu sử dụng bằng cách cho phép bỏ qua quá trình xây dựng và tối ưu hóa môi trường phần mềm phức tạp ngay từ đầu. SDK của SynapseAI dành cho trình tăng tốc Gaudi được tích hợp vào các AMI học sâu và DLC của AWS, cho phép bạn nhanh chóng bắt đầu sử dụng các phiên bản DL1.

Dịch vụ Kubernetes linh hoạt (EKS) hoặc Dịch vụ bộ chứa linh hoạt (ECS) của Amazon

Những khách hàng muốn quản lý khối lượng công việc trong bộ chứa của riêng họ thông qua các dịch vụ điều phối bộ chứa có thể triển khai các phiên bản DL1 với Amazon EKS hoặc ECS.

Tài nguyên bổ sung

Bản mẫu: Đào tạo các mô hình học sâu bằng phiên bản Amazon EC2 DL1 (2:03)
Giới thiệu các phiên bản Amazon EC2 DL1 (3:41)
So sánh chi phí đào tạo Amazon EC2 DL1 (0:50)
Bắt đầu dễ dàng với phiên bản Amazon EC2 DL1 (0:49)

Tài liệu về Habana® Gaudi® v0.15

Truy cập tài liệu »

Diễn đàn nhà phát triển Habana®

Truy cập diễn đàn »

Kho lưu trữ GitHub Habana®

Truy cập GitHub »

Tài nguyên

Bảng dữ liệu

GPU NVIDIA A10G Tensor Core: Điện toán và đồ họa tăng tốc cho đám mây AWS

Bắt đầu sử dụng AWS

Đăng ký tài khoản AWS

Đăng ký tài khoản AWS

Nhận quyền sử dụng ngay lập tức Bậc miễn phí của AWS.

Tìm hiểu qua hướng dẫn từng bước đơn giản

Tìm hiểu bằng hướng dẫn 10 phút

Khám phá và tìm hiểu bằng những hướng dẫn đơn giản.

Bắt đầu xây dựng với EC2 trong bảng điều khiển

Bắt đầu dựng trong bảng điều khiển

Bắt đầu dựng với các hướng dẫn từng bước để giúp bạn khởi tạo dự án AWS của mình.