概觀
AWS HealthOmics 藉助全受管生物資訊和藥物探索基礎設施,該基礎設施專為處理大規模工作流程和儲存而設計,協助客戶加速科學突破。使用 HealthOmics,您只需依用量付費,而且沒有 HealthOmics 授權成本。
HealthOmics 提供兩種類型的工作流程。私有工作流程是使用者定義的自訂工作流程,可讓您使用以最常用工作流程語言所編寫的專屬生物資訊學指令碼。私有工作流程的定價依據每次執行請求的運算和檔案系統資源確定。Ready2Run 工作流程是在常見的產業分析基礎上預先建置的生物資訊管道,您每次執行只需支付固定成本。
HealthOmics 提供兩種類型的儲存。參考存放區和序列存放區是用於使用分層、壓縮和中繼資料型錄的物件資料存放區,以經濟高效的方式來儲存和整理生物資訊資料。依據存放的物件大小和資料層定價。變體和註解存放區是零 ETL 存放區,可從生物資訊資料中擷取關鍵資料,以針對搜尋和同類群組建立最佳化資料湖。依據擷取資訊的儲存大小定價。
您可以視需要將工作流程和資料存放區一起使用或單獨使用。如果您願意簽訂三年期或五年期用量,請聯絡我們獲取折扣價。
依類型探索定價
使用 AWS HealthOmics 時,您只需依用量付費。依以下類型探索定價。
免費方案
您可以透過 AWS 免費方案,免費開始使用 AWS HealthOmics。註冊後,AWS 新客戶即享多達 275 個小時的 omics.m.xlarge (或同等) 執行個體和 49,000 GB (每小時) 的執行儲存,用於執行私有工作流程;序列存放區中 1,500 GB 的作用中和儲存空間,以及變體存放區中 200 GB-月的儲存空間。除 AWS GovCloud (美國) 區域之外,您在其他所有區域的免費方案用量都按月計算,並自動套用到帳單;而未使用的閱讀用量不會轉入下個月。限制條件適用;如需更多詳細資訊,請參閱條款。
前 2 個月的每月免費方案用量 |
|
HealthOmics 工作流程 | 私有工作流程︰omics.m.xlarge 執行個體或同等運算執行個體 275 個小時,以及 49,000 GB (每小時) 執行儲存 |
HealthOmics 資料存放區 | 序列存放區︰作用中儲存類別為 1,500 Gb (每月),封存儲存類別為 1,500 Gb (每月) 變體存放區:200 Gb (每月) |
AWS 客戶每月可免費將 100 GB (彙總所有 AWS 服務和區域 (中國和 GovCloud 除外) 的用量) 資料傳出至網際網路。
私有工作流程定價
私有工作流程是您根據選擇的工作流程語言定義的自訂工作流程,以執行生物資訊或藥物發現管道。成本有兩個元件:工作流程任務執行個體和執行儲存。
依據工作流程每項任務使用的 omics 執行個體計費。工作流程中的每項任務會映射至最小的可用 omics 執行個體,以滿足任務請求的 vCPU、記憶體和/或 GPU。例如,定義為使用 8 個 CPU 和 60 GiB RAM 的任務,會對應至 omics.r.2xlarge 執行個體類型以供執行。HealthOmics 始終會準確佈建請求的資源。在此範例中,8 個 CPU 和 60 GiB 的 RAM 將可用於任務。任務以 1 秒的增量計費;但是,每項任務的最低帳單閾值為 60 秒。如果您沒有為任務指定 vCPU 或記憶體,HealthOmics 會自動為這些任務佈建最小的可用執行個體類型 omics.c.large。此外,您無需支付與資料暫存關聯的運算費用 (即匯入和匯出),也沒有跨可用區域費用。
對於執行儲存,您可以選擇具有較高檔案系統輸送量的統計佈建檔案系統,或是可動態擴展的檔案系統。靜態執行儲存提供以下大小:1200 GiB、2400 GiB,然後以 2400 GiB 為增量,最低佈建大小為 1200 GiB。動態執行儲存可擴展用量,並且沒有最低儲存佈建要求。
只有執行處於執行中狀態時,才會收取資源費用。處於待處理、起始或停止狀態中的執行不會產生任何費用。針對取消或失敗的執行,依據取消或失敗之前使用的所有資源計費。
您可以在 AWS 帳單檢視每次執行的總成本,以便快速、輕鬆地確定成本。HealthOmics 還提供開放原始碼執行分析工具,以協助您最佳化執行資源、成本與效能。如果您計劃大規模執行生產工作流程,並願意簽訂三年期或五年期用量,請聯絡我們獲取折扣價。
Ready2Run 工作流程定價
Ready2Run 工作流程是由產業領先的第三方軟體公司 (例如 NVIDIA、Sentieon、Element Biosciences 和 Ultima) 以及常見的開放原始碼管道 (例如 Broad Institute 的 GATK 工作流程和 AlphaFold 的蛋白質結構預測) 設計的預先設定工作流程。您只需使用 Ready2Run 工作流程即可處理資料,無需管理軟體工具或工作流程指令碼。Ready2Run 工作流程依每次執行計費,無論執行時間如何,執行成功完成時,都會向您收取相同的固定費用。如果執行在第一個小時內取消或無法成功完成,依每次執行費用會根據使用的第一小時按比例計算。執行時間超過 1 小時,將依執行的完整價格計費。Sentieon Ready2Run 工作流程需要從 Sentieon 購買單獨訂閱。Sentieon 會自動提供兩週免費訂閱,首次使用 Sentieon Ready2Run 的使用者無需額外付費。若要檢視可用 Ready2Run 工作流程的詳細資訊,包括輸入參數、工作流程圖表和預估執行時間,請造訪 HealthOmics 主控台。
資料存放區定價
HealthOmics 資料存放區是受管的可查找、可存取、可互操作和可重複使用 (FAIR) 儲存,適用於具有自動資料壓縮性和最佳化變體/註解查詢性的大規模範例資料。
序列存放區透過用量驅動的分層和壓縮來節省成本。存放的物件會依讀取集分組,以進行整理和實現可查找性。若您將資料存放在序列存放區,則按每月每 GB 付費。1 Gb (gigabase) 表示所匯入序列檔案 (例如 FASTQ、BAM 和 CRAM) 中的 10 億個基底。由於帳單按 Gb 計費,因此您無須擔心最佳檔案格式或壓縮技術。AWS HealthOmics 可為您最佳化此計費。序列存放區中的資料可透過兩種方式存取:1/ 透過讀取、寫入和更新 HealthOmics API,以及透過 S3 API 讀取。若是透過 HealthOmics API 存取,您需要為讀取集物件產生的 GET 請求付費。讀取集的所有其他 HealthOmics 請求類型則免費。2/ 透過 S3 清單和 get API。若要透過 S3 API 存取,COPY 和 LIST 請求會與所有其他請求類型分開計費。若要了解 HealthOmics 序列存放區與替代儲存選項的成本比較,請參閱我們的部落格:https://aws.amazon.com/blogs/industries/store-omics-data-cost-effectively-at-any-scale-with-aws-healthomics/
變體和註解存放區使用零 ETL 來準備變體和註解資料,以便使用 Amazon Athena 和 Amazon SageMaker 等 AWS 服務來進行查詢、同類群組整合及分析。擷取的檔案由 HealthOmics 處理,並轉換為查詢最佳化格式。您可以存放任意數量的變體和註解資料,並且只需依存放的資料量付費。計費資料大小依據擷取和轉換後的資料大小來定義。變體和註解存放區中的資料通常透過其他 AWS 服務存取。若您在其他服務中查詢和分析資料,需支付這些服務的使用費用。
存放在 AWS HealthOmics 資料存放區中的資料需支付 30 天最低儲存費用,30 天內刪除的資料會依比例計費,等同與剩餘儲存天數的費用。
定價範例
-
定價範例 #1:具有靜態執行儲存的私有工作流程
在美國東部 (維吉尼亞北部) 地區,一位生物資訊學科學家想在 AWS HealthOmics 工作流程中執行 Nextflow 工作流程。她的工作流程中有三項任務。第一項任務是保留 16 個 vCPU 和 30 GB 記憶體,執行時間為 3 小時。第二項任務是保留 32 個 vCPU 和 160 GB 記憶體,執行時間為 2 小時。第三項任務是保留 4 個 vCPU 和 10 GB 記憶體,執行時間為 10 分鐘。該客戶註冊工作流程,並透過預設的 1200 GB 檔案系統呼叫 StartRun API。整體成本如下:
任務 1 (omics.c.4xlarge)︰0.9180 USD/小時 * 3 小時 = 2.754 USD
任務 2 (omics.r.8xlarge)︰2.7216 USD/小時 * 2 小時 = 5.4432 USD
任務 3 (omics.m.xlarge)︰0.2592 USD/小時 * 1/6 小時 = 0.0432 USD
靜態執行儲存︰0.0001918 USD/GB-小時 * (1200GB*(3 小時 +2 小時 + 1/6 小時)) = 1.18916 USD
總計:9.42956 USD -
定價範例 #2:具有動態執行儲存的私有工作流程
在美國東部 (維吉尼亞北部) 地區,一位生物資訊學科學家正在 AWS HealthOmics 中開發新的 WDL 工作流程。她的工作流程中有兩項任務。第一項任務是保留 16 個 vCPU 和 30 GB 記憶體,執行時間為 3.5 小時。第二項任務是保留 32 個 vCPU 和 160 GB 記憶體,執行時間為 2.25 小時。該客戶註冊工作流程,並透過預設的動態檔案系統呼叫 StartRun API。在 5.75 小時的工作流程執行過程中,檔案系統從 0 GB 線性增長至 1043 GB,總共 3000 GB/小時的檔案儲存空間。整體成本如下:
任務 1 (omics.c.4xlarge):0.9180 USD/小時 * 3.5 小時 = 3.213 USD
任務 2 (omics.r.8xlarge):2.7216 USD/小時 * 2.25 小時 = 6.1236 USD
動態執行儲存:0.0004110 USD/GB/小時 * 3,000 GB/小時 = 1.233 USD
總計:10.5696 USD -
定價範例 #3:Ready2Run 工作流程
一位計算科學家希望在美國東部 (維吉尼亞北部) 區域,針對 30 倍的基因體 Ready2Run 工作流程執行 GATK-BP Germline fq2vcf,以取得 3 個樣本。客戶輸入其資料,並針對每個樣本呼叫 StartRun API。3 次執行的成本如下:
用於 30 倍基因體 Ready2Run 工作流程的 GATK-BP Germline fq2vcf:10.00 USD/執行 * 3 = 30.00 USD
總計:30.00 USD -
定價範例 #4:序列存放區
群體測序計畫開始對收集在人體生物資料庫中的個人進行測序。該計畫選擇在西歐 (愛爾蘭) 地區執行此工作。其針對每 130 Gb、50 Gb 的 100,000 名個人進行測序,並將原始測序資料存放在 AWS HealthOmics 儲存體中。在接下來的五年中,這些資料在匯入 30 天過後會保留於封存儲存類別,並且在轉換為作用中儲存類別 30 天中平均受到兩次存取。他們使用 S3 API 來存取檔案。每個基因組分為 500 個部分下載,產生 500 次 GET API 呼叫。單個基因組的五年期總成本為:
作用中儲存類別:0.005769 USD Gb/月 * 130 Gb * 90 天 = 2.22 USD
封存儲存類別:0.001154 USD Gb/月 * 130 Gb * (1825 – 90) 天 = 8.56 USD。
S3 GET API:0.0004 USD/1000 個 API 呼叫 * (2 * 500 個 API 呼叫) = 0.0004 USD
5 年期總成本:2.22 USD + 8.56 USD + 0.0004 USD = 10.78 USD (或 2.15 USD/年)
-
定價範例 #5:變體存放區
在美國東部 (維吉尼亞北部) 地區,一位資料科學家想使用 Amazon Athena 分析 3,202 個變體呼叫格式 (VCF) 檔案。他先建立了變體存放區,然後使用 AWS HealthOmics API 擷取這些檔案。擷取到的資料大小為 1.5 TB。在接下來的一個月中,他使用 Athena 執行了 1,000 次查詢,針對不同子群體計算對偶基因頻率,平均每次耗用 50 GB。每月整體成本如下:
變體存放區:0.035 USD GB/月 * (1024 GB/TB * 1.5 TB) = 53.76 USD
Amazon Athena:5 USD / TB * 1000 * 50 / 1024 = 244.14 USD
資料傳輸定價
您將支付 HealthOmics 所有傳出頻寬的費用。資料傳輸費不適用於傳輸到與資料存放區在同一 AWS 區域內的任何 AWS 服務的資料。以下定價是根據 AWS HealthOmics 資料量的「傳入」和「傳出」來計算 (透過公有網際網路)†††。進一步了解 AWS Direct Connect 定價。超過 500TB/月的資料傳輸,請聯絡我們。
費率層級考慮了所有 AWS 服務將資料傳送到網際網路的彙總使用量。
††† 在您提前終止連線的情況下,傳出的資料可能和您的應用程式收到的資料不同,例如,如果您請求 10 GB 的物件並在收到前 2 GB 資料後終止連線。AWS HealthOmics 嘗試停止串流資料,但無法立即執行。在此範例中,傳出的資料可能為 3 GB (比您收到的 2 GB 大 1 GB)。因此,將針對傳出的 3 GB 資料向您收費。