Tổng quan

Với AWS HealthOmics, bạn chỉ phải trả tiền cho những gì bạn sử dụng. Bạn bị tính phí dựa trên lượng dữ liệu lưu trữ và phiên bản điện toán mà bạn sử dụng để xử lý quy trình làm việc của mình. Với AWS HealthOmics, bạn có thể lưu trữ các đối tượng dữ liệu trình tự và tham chiếu hoặc dữ liệu biến thể và chú giải. Bạn cũng có thể chạy quy trình làm việc tin sinh học để phân tích và chuyển đổi dữ liệu bộ gen, dữ liệu phiên mã và những dữ liệu omics khác. AWS HealthOmics được tối ưu hóa để lưu trữ và điện toán dữ liệu omics và kết hợp với các dịch vụ khác của AWS như Amazon SageMaker, Dịch vụ lưu trữ đơn giản (S3) của Amazon và Amazon Athena.

Bậc miễn phí

Khi tham gia Bậc miễn phí của AWS, bạn có thể bắt đầu sử dụng AWS HealthOmics miễn phí. Bậc miễn phí của bạn bắt đầu từ tháng đầu tiên khi bạn tạo tài nguyên AWS HealthOmics đầu tiên. Chi tiết về Bậc miễn phí cho AWS HealthOmics có trong bảng bên dưới.

 

Sử dụng Bậc miễn phí mỗi tháng trong 2 tháng đầu tiên

Lưu trữ AWS HealthOmics 1.500 gigabase-tháng trong lớp lưu trữ ở trạng thái hoạt động và 1.500 gigabase-tháng trong lớp lưu trữ ở trạng thái lưu trữ
Quy trình làm việc AWS HealthOmics

275 giờ sử dụng phiên bản omics.m.xlarge hoặc các phiên bản điện toán tương đương và 49.000 GB-giờ đối với kho lưu trữ tác vụ chạy

Phân tích AWS HealthOmics 200 gigabyte/tháng

Khách hàng của AWS sẽ nhận được tổng cộng 100 GB dung lượng dữ liệu truyền ra đến Internet miễn phí hằng tháng cho toàn bộ Dịch vụ và Khu vực của AWS (ngoại trừ Trung Quốc và GovCloud).

Giá của dung lượng lưu trữ AWS HealthOmics

Khi lưu trữ trình tự bộ gen trong kho lưu trữ AWS HealthOmics, bạn sẽ thanh toán cho dung lượng lưu trữ theo số gigabase mỗi tháng. Một gigabase tương đương với một tỷ base từ các tệp trình tự đã nhập của bạn (chẳng hạn như FASTQ, BAM và CRAM). Kho lưu trữ AWS HealthOmics lưu trữ base, điểm chất lượng, bắt cặp trình tự và các siêu dữ liệu khác từ tệp nguồn của bạn. Bạn thanh toán cho mỗi gigabase được lưu trữ, do đó bạn không cần phải bận tâm về định dạng hoặc kỹ thuật nén tệp tối ưu. AWS HealthOmics sẽ thay bạn xử lý toàn bộ những tác vụ đó.

Đối tượng trình tự được gọi là tập phục vụ việc đọc, tương đương với tệp FASTQ, BAM hoặc CRAM về mặt logic. Kho lưu trữ AWS HealthOmics mang đến một lớp lưu trữ ở trạng thái hoạt động và một lớp lưu trữ ở trạng thái lưu trữ cho các tập phục vụ việc đọc của bạn. Chi phí lưu trữ mỗi tháng cho các tập phục vụ việc đọc trong lớp ở trạng thái lưu trữ sẽ thấp hơn so với các tập phục vụ việc đọc trong lớp ở trạng thái hoạt động. Bạn có thể truy cập các tập phục vụ việc đọc trong lớp ở trạng thái hoạt động trong vài mili giây. Tuy nhiên, bạn cần kích hoạt các tập phục vụ việc đọc trong bậc lưu trữ trước thì mới có thể truy cập chúng. Nếu bạn không truy cập các tập phục vụ việc đọc trong 30 ngày, chúng sẽ tự động được chuyển sang lớp lưu trữ ở trạng thái lưu trữ tốn ít chi phí hơn cho đến khi được kích hoạt trở lại.

Chúng tôi không áp dụng phí nhập các tập phục vụ việc đọc. Dữ liệu trong kho lưu trữ AWS HealthOmics bị tính phí thời hạn lưu trữ tối thiểu là 30 ngày, đồng thời dữ liệu bị xóa trước thời hạn 30 ngày sẽ phát sinh phí theo tỷ lệ tương đương với phí lưu trữ cho các ngày còn lại. Dung lượng lưu trữ AWS HealthOmics được thiết kế cho dữ liệu tồn tại lâu dài nhưng không được truy cập thường xuyên và được giữ lại trong nhiều năm.

Có hai cách để truy cập dữ liệu lưu trữ AWS HealthOmics: Thông qua đọc, ghi và cập nhật qua API của HealthOmics và đọc qua API S3.  Khi truy cập qua HealthOmics API, bạn trả phí cho các yêu cầu GET được thực hiện cho các đối tượng tập phục vụ việc đọc. Mọi loại yêu cầu HealthOmics khác đối với tập phục vụ việc đọc đều miễn phí. Khi truy cập qua API S3, bạn cần trả phí riêng cho các yêu cầu COPY và LIST từ mọi loại yêu cầu khác.  

Định giá phân tích AWS HealthOmics

Dịch vụ phân tích AWS HealthOmics giúp bạn chuẩn bị dữ liệu biến thể của bộ gen và chú giải bộ gen để sử dụng với bộ dịch vụ máy học và phân tích AWS phong phú, chẳng hạn như Amazon Athena và Amazon SageMaker. Bạn có thể lưu trữ lượng dữ liệu biến thể của bộ gen bất kỳ và chỉ thanh toán cho những gì bạn lưu trữ. Kích thước dữ liệu được định nghĩa là kích thước dữ liệu đã chuyển đổi. Tuy nhiên, khi bạn truy vấn và phân tích dữ liệu trong các dịch vụ khác, bạn sẽ phải thanh toán phí khi sử dụng những dịch vụ đó.

Dữ liệu trong dịch vụ phân tích của AWS HealthOmics bị tính phí thời hạn lưu trữ tối thiểu là 30 ngày. Dữ liệu bị xóa trước thời hạn 30 ngày sẽ phát sinh phí theo tỷ lệ tương đương với phí lưu trữ cho các ngày còn lại.

Giá của quy trình làm việc AWS HealthOmics Ready2Run

Quy trình làm việc Ready2Run là quy trình làm việc được tạo sẵn đã được đóng gói bởi các công ty phần mềm bên thứ ba trong ngành công nghiệp cùng các quy trình nguồn mở. Bạn chỉ cần sử dụng quy trình làm việc Ready2Run để xử lý dữ liệu của bạn với các quy trình làm việc được sử dụng phổ biến nhất như Germline và GATK-BP. Quy trình làm việc Ready2Run được tính theo từng lần chạy, nghĩa là bạn phải trả cùng một mức giá cho mỗi quy trình làm việc. Để xem thông tin chi tiết về từng quy trình làm việc Ready2Run, hãy truy cập bảng điều khiển HealthOmics.

 

Giá của quy trình công việc riêng tư AWS HealthOmics

Quy trình làm việc riêng tư cho phép bạn sử dụng các kịch bản tin sinh học của riêng mình được viết bằng các ngôn ngữ quy trình làm việc được sử dụng phổ biến nhất. Bạn có thể chạy quy trình làm việc riêng tư với một lần thực hiện. Bạn chỉ thanh toán cho những gì mình yêu cầu và bị tính phí riêng cho các loại phiên bản phục vụ ngành khoa học liên quan đến sinh học (omics) và kho lưu trữ tác vụ chạy. Tất cả các tác vụ trong quy trình làm việc của bạn được ánh xạ đến phiên bản phù hợp nhất với những tài nguyên đã xác định thuộc các tác vụ đó. Ví dụ: một tác vụ được xác định sử dụng 8 CPU và 60 GB RAM sẽ ánh xạ đến loại phiên bản omics.r.2xlarge để thực thi. Đối với kho lưu trữ tác vụ chạy, bạn có thể chọn hệ thống tệp được cung cấp thống kê với thông lượng hệ thống tệp lớn hơn hoặc hệ thống tệp có khả năng điều chỉnh quy mô động.

 

Truyền dữ liệu

Bạn trả tiền cho tất cả băng thông từ HealthOmics. Phí truyền dữ liệu không áp dụng cho dữ liệu được truyền sang bất kỳ dịch vụ AWS nào trong cùng Khu vực AWS dưới dạng kho dữ liệu. Giá bên dưới căn cứ theo dữ liệu được truyền "in" và "out" của AWS HealthOmics (qua mạng Internet công cộng)†††. Tìm hiểu thêm về giá của AWS Direct Connect. Nếu bạn có nhu cầu truyền dữ liệu vượt quá 500 TB/tháng, vui lòng liên hệ với chúng tôi.

 

Region
Region

Các bậc giá có tính đến mức sử dụng tổng hợp của bạn cho tác vụ Truyền dữ liệu đi lên Internet đối với tất cả các dịch vụ AWS.

 ††† Dữ liệu truyền đi có thể khác với dữ liệu mà ứng dụng của bạn nhận được trong trường hợp bạn dừng kết nối sớm, ví dụ: nếu bạn yêu cầu đối tượng 10 GB và dừng kết nối sau khi nhận được 2 GB dữ liệu đầu tiên. AWS HealthOmics sẽ cố gắng dừng việc phát trực tuyến dữ liệu. Tuy nhiên, việc này không xảy ra ngay lập tức. Ở ví dụ này, Dữ liệu truyền đi có thể bằng 3 GB (nhiều hơn 1 GB so với 2 GB bạn đã nhận). Vì vậy, bạn sẽ bị tính phí cho 3 GB Dữ liệu truyền đi.

 

Ví dụ định giá

Ví dụ 1

Một sáng kiến giải trình tự quần thể đang bắt tay vào giải trình tự các cá thể từ ngân hàng sinh học đã thu thập được. Sáng kiến này được chọn triển khai tại Khu vực Miền Tây Châu Âu (Ireland). Họ tiến hành giải trình tự 100.000 cá thể, mỗi cá thể có 130 gigabase, 50 gigabyte, sau đó lưu trữ dữ liệu giải trình tự thô trong kho lưu trữ AWS HealthOmics. Trong 5 năm kế tiếp, dữ liệu này vẫn nằm trong lớp lưu trữ ở trạng thái lưu trữ sau 30 ngày kể từ khi nhập và được truy cập trung bình hai lần khi chuyển sang lớp lưu trữ ở trạng thái hoạt động trong 30 ngày. Họ sử dụng API S3 để truy cập các tệp. Mỗi bộ gen được tải xuống thành 500 phần, tạo ra 500 lệnh gọi API GET. Tổng chi phí trong 5 năm cho một bộ gen là:
Lớp lưu trữ ở trạng thái hoạt động: 0,005769 USD gigabase/tháng * 130 gigabase * 90 ngày = 2,22 USD
Lớp lưu trữ ở trạng thái lưu trữ: 0,001154 USD gigabase/tháng * 130 gigabase * (1825 – 90) ngày = 8,56 USD.
API GET S3: 0,0004 USD / 1.000 lệnh gọi API * (2 * 500 lệnh gọi API) = 0,0004 USD
Tổng chi phí trong 5 năm: 2,22 USD + 8,56 USD + 0,0004 USD = 10,78 USD (hoặc 2,15 USD/năm)

Ví dụ 2

Một nhà khoa học tin sinh học muốn chạy một quy trình làm việc Nextflow trong quy trình làm việc của AWS HealthOmics tại Khu vực Miền Đông Hoa Kỳ (Bắc Virginia). Quy trình làm việc của nhà khoa học đó gồm ba tác vụ. Tác vụ đầu tiên đặt trước 16 vCPU và bộ nhớ 30 GB, đồng thời cần 3 giờ để chạy tác vụ. Tác vụ thứ hai đặt trước 32 vCPU và bộ nhớ 160 GB, đồng thời cần 2 giờ để chạy tác vụ. Tác vụ thứ ba đặt trước 4 vCPU và bộ nhớ 10 GB, đồng thời cần 10 phút để chạy tác vụ. Khách hàng này đăng ký quy trình làm việc và thực hiện lệnh gọi API StartRun với hệ thống tệp mặc định có kích thước 1200 GB. Tổng thể chi phí của nhà khoa học là:
Tác vụ 1 (omics.c.4xlarge): 0,9180 USD/giờ * 3 giờ = 2,754 USD
Tác vụ 2 (omics.r.8xlarge):
2,7216 USD/giờ * 2 giờ = 5,4432 USD
Tác vụ 3 (omics.m.xlarge): 0,2592 USD/giờ * 1/6 giờ = 0,0432 USD
Kho lưu trữ tác vụ chạy tĩnh: 0,0001918 USD/GB-giờ * (1.200 GB * (3 giờ + 2 giờ + 1/6 giờ)) = 1,18916 USD
Tổng: 9,42956 USD

Ví dụ 3

Một nhà khoa học tin sinh học đang phát triển quy trình làm việc WDL mới trong AWS HealthOmics ở Khu vực Miền Đông Hoa Kỳ (Bắc Virginia). Quy trình làm việc của nhà khoa học đó gồm hai tác vụ. Tác vụ đầu tiên đặt trước 16 vCPU và bộ nhớ 30 GB, đồng thời cần 3,5 giờ để chạy tác vụ. Tác vụ thứ hai đặt trước 32 vCPU và bộ nhớ 160 GB, đồng thời cần 2,25 giờ để chạy tác vụ. Khách hàng này đăng ký quy trình làm việc và thực hiện lệnh gọi API StartRun với hệ thống tệp linh động. Trong 5,75 giờ chạy quy trình làm việc, hệ thống tệp mở rộng tuyến tính từ 0GB lên 1.043GB, tổng cộng là 3000 GB-giờ dung lượng lưu trữ tệp. Tổng thể chi phí của nhà khoa học là:
Tác vụ 1 (omics.c.4xlarge): 0,9180 USD/giờ * 3,5 giờ = 3,213 USD
Tác vụ 2 (omics.r.8xlarge):
2,7216 USD/giờ * 2,25 giờ = 6,1236 USD
Kho lưu trữ tác vụ chạy động: 0,0004110/GB-giờ* 3.000 GB-giờ = 1,233 USD
Tổng: 10,5696 USD

Ví dụ 4

Một nhà khoa học dữ liệu có 3.202 tệp định dạng lệnh gọi biến thể (VCF) và muốn phân tích số tệp này trong Amazon Athena tại Khu vực Miền Đông Hoa Kỳ (Bắc Virginia). Nhà khoa học đó tạo một kho lưu trữ biến thể và tải nhập những tệp này bằng cách sử dụng các API của AWS HealthOmics. Dữ liệu đã tải nhập có kích thước 1,5 TB. Trong tháng tiếp theo, nhà khoa học thực thi 1.000 truy vấn trong Athena, tính tần số alen cho các quần thể nhận diện được khác nhau, mỗi quần thể tốn trung bình 50 GB. Tổng thể chi phí hàng tháng của nhà khoa học là:
Kho lưu trữ biến thể: 0,035 USD GB/tháng * (1.024 GB/TB * 1,5 TB) = 53,76 USD
Amazon Athena: 5 USD/TB * 1.000 * 50/1.024 = 244,14 USD

Ví dụ 5

Một nhà khoa học điện toán muốn chạy GATK-BP Germline fq2vcf cho quy trình làm việc 30x gene Ready2Run ở Khu vực Miền Đông Hoa Kỳ (Bắc Virginia) cho 3 mẫu. Khách hàng nhập dữ liệu của mình và thực hiện lệnh gọi API StartRun cho mỗi mẫu. Chi phí cho 3 lần chạy là:
GATK-BP Germline fq2vcf cho quy trình làm việc 30x genome Ready2Run: 10,00 USD/lần chạy * 3 = 30,00 USD
Tổng cộng: 30,00 USD

Tài nguyên định giá khác

Công cụ tính giá AWS

Dễ dàng tính phí hàng tháng của bạn với AWS

Trung tâm tài nguyên kinh tế đám mây

Liên hệ với các chuyên gia AWS để được báo giá riêng