Обзор

В AWS HealthOmics вы платите только за то, что реально используете. Плата взимается в зависимости от объема хранимых данных и количества вычислительных инстансов, используемых вами для обработки рабочего потока. В AWS HealthOmics можно хранить объекты данных геномных последовательностей и эталонных данных или варианты и аннотационные данные. Можно также запускать рабочие потоки по биоинформатике для анализа и преобразования геномных, транскриптомных и других омических данных. AWS HealthOmics оптимизирован под хранение и обработку омических данных и работает с другими службами AWS, такими как Amazon SageMaker, Amazon Simple Storage Service (S3) и Amazon Athena.

Уровень бесплатного пользования

В рамках уровня бесплатного пользования AWS можно начать работу с сервисом AWS HealthOmics бесплатно. Уровень бесплатного пользования начинается с первого месяца создания вами своего первого ресурса AWS HealthOmics. Подробные сведения об уровне бесплатного пользования AWS HealthOmics приведены в таблице ниже.

 

Ежемесячное использование уровня бесплатного пользования в течение первых 2 месяцев

Хранилище AWS HealthOmics 1500 гигабаз в месяц в классе активного хранения и 1500 гигабаз в месяц в классе архивного хранения
Рабочие процессы AWS HealthOmics

275 часов работы инстанса omics.m.xlarge или эквивалентных вычислительных инстансов и 49 000 ГБ-часов хранилища запусков

Аналитика AWS HealthOmics 200 гигабайт в месяц

Клиенты AWS имеют возможность каждый месяц передавать в Интернет 100 ГБ исходящих данных совокупно для всех сервисов и регионов AWS (за исключением Китая и GovCloud).

Цены на хранилище AWS HealthOmics

При использовании хранилища AWS HealthOmics для геномных последовательностей вы платите за хранение определенного количества гигабаз в месяц. 1 гигабаза – это 1 млрд пар оснований из импортированных вами файлов последовательностей (например, FASTQ, BAM или CRAM). В хранилище AWS HealthOmics хранятся основания, показатели качества, участки выравнивания и другие метаданные из исходных файлов. Вы платите за гигабазы хранимой информации, поэтому вам не нужно беспокоиться об оптимальных форматах файлов или методах сжатия. Обо всем этом за вас позаботится AWS HealthOmics.

Объекты последовательностей называются читаемыми множествами и логически эквивалентны файлам FASTQ, BAM или CRAM. Хранилище AWS HealthOmics предоставляет под ваши читаемые множества классы активного и архивного хранения. Месячная плата за хранение читаемых множеств в архивном классе ниже, чем в активном классе. Доступ к читаемым множествам из активного класса происходит за миллисекунды, в то время как перед получением доступа к читаемым множествам из архивного уровня их нужно активировать. Если в течение 30 дней обращений к читаемым множествам не было, они автоматически перемещаются в более дешевый класс архивного хранения до тех пор, пока их снова не активируют.

Плата за импорт читаемых множеств не взимается. Минимальный оплачиваемый срок хранения в хранилище AWS HealthOmics составляет 30 дней. За данные, которые были удалены до истечения 30-дневного срока, взимается плата, пропорциональная стоимости хранения за оставшиеся дни. Хранилище AWS HealthOmics предназначено для данных долговременного (в течение нескольких лет) хранения и нечастого доступа.

Существует два способа доступа к данным хранилища AWS HealthOmics: чтение, запись и обновление с помощью API HealthOmics и чтение через API S3.  В случае доступа через API HealthOmics плата взимается за GET-запросы к объектам читаемых множеств. Другие типы запросов HealthOmics к читаемым множествам являются бесплатными. В случае доступа через API S3 плата за запросы COPY и LIST взимается отдельно от других типов запросов.  

Цены на аналитику AWS HealthOmics

Аналитика AWS HealthOmics помогает вам готовить данные о геномных вариантах и геномные аннотации для использования в целом ряде сервисов аналитики и машинного обучения AWS, например Amazon Athena и Amazon SageMaker. Вы можете хранить любое количество данных о геномных вариантах и платить только за то, что храните. Размер данных определяется как размер преобразованных данных. Впрочем, при запросах к другим службам и проведении анализа данных в них вы платите за использование этих служб.

Минимальный оплачиваемый срок хранения аналитических данных в AWS HealthOmics составляет 30 дней. За данные, которые были удалены до истечения 30-дневного срока, взимается плата пропорциональная стоимости хранения за оставшиеся дни.

Цены на рабочие процессы AWS HealthOmics Ready2Run

Рабочие процессы Ready2Run – это готовые рабочие процессы, упакованные сторонними отраслевыми компаниями-разработчиками программного обеспечения и конвейерами с открытым исходным кодом. Вы можете просто использовать рабочие процессы Ready2Run для обработки данных с помощью наиболее часто используемых рабочих процессов, таких как Germline и GATK-BP. Рабочие процессы Ready2Run оплачиваются отдельно, то есть за каждый рабочий процесс взимается одинаковая цена. Чтобы просмотреть подробную информацию о каждом рабочем процессе Ready2Run, посетите консоль HealthOmics.

 

Цены на частные рабочие процессы AWS HealthOmics

Частные рабочие процессы позволяют использовать собственные сценарии биоинформатики, написанные на наиболее часто используемых языках рабочих процессов. Частные рабочие процессы можно запускать одним выполнением. Вы платите только за запросы. Счета выставляются отдельно за типы инстансов Omics и отдельно – за хранилище запусков. Все задачи в вашем рабочем потоке связываются с инстансом, который лучше всего подходит для заданных в них ресурсов. Например, задача, для выполнения которой требуется 8 процессоров и 60 ГБ оперативной памяти, будет связана с типом инстанса omics.r.2xlarge. Чтобы хранить данные для запуска, можно выбрать статистически подготовленную файловую систему с большей пропускной способностью такой системы или динамически масштабируемую файловую систему.

 

Передача данных

Вы платите за всю пропускную способность HealthOmics. Плата за передачу данных не распространяется на данные, переданные в какие-либо сервисы AWS в том же регионе AWS, что и хранилище данных. Приведенные ниже цены основаны на передаче данных в хранилище AWS HealthOmics или из него (через общедоступный Интернет)†††. Подробнее о ценах на AWS Direct Connect. Если объем передачи данных превышает 500 ТБ в месяц, свяжитесь с нами.

 

Region
Region

Уровни расценок учитывают совокупное использование исходящей передачи данных в Интернет всеми сервисами AWS.

 ††† Объем передачи исходящих данных может отличаться от объема, полученного вашим приложением, в случае предварительного прерывания подключения с вашей стороны, например, если вы запросите объект размером 10 ГБ и прервете подключение после получения первых 2 ГБ данных. AWS HealthOmics пытается остановить передачу данных, однако это не происходит незамедлительно. В приведенном примере объем исходящих данных будет равен 3 ГБ (на 1 ГБ больше, чем 2 ГБ, которые вы получили). В таком случае придется оплатить передачу 3 ГБ данных.

 

Примеры расчета цен

Пример №1

В рамках инициативы по секвенированию населения начинается секвенирование людей из собранного биобанка. Провести его решено на западе ЕС (в Ирландии). Секвенируются 100 000 человек с получением 130 гигабаз (50 гигабайт) на каждого и хранением необработанных данных секвенирования в хранилище AWS HealthOmics. Через 30 дней после импорта они на 5 лет отправляются в класс архивного хранения. К ним обращаются в среднем дважды, и тогда они на 30 дней переходят в класс активного хранения. Для доступа к файлам используются API S3. Все геномы загружаются в 500 частях, генерируя 500 вызовов API GET. Общая стоимость за один геном в течение 5 лет составляет:
Класс активного хранения: 0,005769 USD гигабаз/месяц * 130 гигабаз * 90 дней = 2,22 USD
Класс архивного хранения: 0,001154 USD гигабаз/месяц * 130 гигабаз * (1825 – 90) дней = 8,56 USD.
API S3 GET: 0,0004 USD / 1000 вызовов API * (2 * 500 вызовов API) = 0,0004 USD
Общая стоимость за 5 лет: 2,22 USD + 8,56 USD + 0,0004 USD = 10,78 USD (или 2,15 USD в год)

Пример 2

Ученая-биоинформатик хочет запустить рабочий поток Nextflow в рабочих потоках AWS HealthOmics на Востоке США (Северная Вирджиния). Ее рабочий поток состоит из 3 задач. Под первую резервируется 16 vCPU, 30 ГБ памяти и 3 часа работы. Под вторую требуется 32 vCPU, 160 ГБ памяти и 2 часа работы. Под третью резервируется 4 виртуальных ЦП и 10 ГБ памяти, а ее выполнение занимает 10 минут. Клиент регистрирует рабочий поток и вызывает API StartRun с файловой системой по умолчанию (1200 ГБ). Общие расходы вычисляются так:
Задача №1 (omics.c.4xlarge): 0,9180 USD/час * 3 часа = 2,754 USD
Задача №2 (omics.r.8xlarge):
2,7216 USD/час * 2 часа = 5,4432 USD
Задача №3 (omics.m.xlarge): 0,2592 USD/час * 1/6 часа = 0,0432 USD
Статическое хранилище: 0,0001918/ГБ в час * (1200 ГБ * (3 часа+2 часа+1/6 часа)) = 1,18916 USD
Итого: 9,42956 USD

Пример 3

Специалист по биоинформатике разрабатывает новый рабочий процесс WDL на основе AWS HealthOmics в регионе Восток США (Северная Вирджиния). Этот рабочий процесс состоит из двух задач. Под первую резервируется 16 виртуальных ЦП и 30 ГБ памяти, а ее выполнение занимает 3,5 часа. Для второй нужно 32 виртуальных ЦП, 160 ГБ памяти и 2,25 часа работы. Клиент регистрирует рабочий поток и вызывает API StartRun с динамической файловой системой. В течение 5,75 часов работы размер файловой системы линейно растет с 0 ГБ до 1043 ГБ, что составляет совокупно 3000 ГБ-ч использования файлового хранилища. Общие расходы вычисляются так:
Задача №1 (omics.c.4xlarge): 0,9180 USD/час * 3,5 часа = 3,213 USD
Задача №2 (omics.r.8xlarge):
2,7216 USD/час * 2,25 часа = 6,1236 USD
Динамическое хранилище: 0,0004110 USD/ГБ-ч * 3000 ГБ-ч = 1,233 USD
Итого: 10,5696 USD

Пример 4

У специалиста по анализу данных есть 3202 файла в формате VCF (формат варианта вызова), которые он хочет проанализировать с помощью Amazon Athena в регионе Восток США (Северная Вирджиния). Он создает хранилище вариантов и загружает эти файлы с использованием AWS HealthOmics API. Размер загруженных файлов составляет 1,5 ТБ. В течение следующего месяца он обрабатывает в Athena 1000 запросов по расчету частоты аллелей для различных подсовокупностей, каждый из которых в среднем занимает 50 ГБ. Его общие ежемесячные расходы составляют:
Хранилище вариантов: 0,035 USD ГБ/месяц * (1024 ГБ/ТБ * 1,5 ТБ) = 53,76 USD
Amazon Athena: 5 USD/ТБ * 1000 * 50/1024 = 244,14 USD

Пример 5

Специалист по вычислениям хочет запустить 30-кратный рабочий процесс геномных вычислений Ready2Run на GATK-BP Germline fq2vcf в регионе Восток США (Северная Вирджиния) для 3 образцов. Клиент вводит свои данные и вызывает API StartRun для каждого образца. Стоимость трех запусков составляет:
Рабочий процесс GATK-BP Germline fq2vcf для 30-кратного генома Ready2Run: 10,00 USD/запуск * 3 = 30,00 USD
Всего: 30,00 USD

Дополнительные ресурсы по ценам

Калькулятор цен AWS

Простой расчет ежемесячных расходов на AWS

Центр ресурсов по облачной экономике

Связаться со специалистами AWS и получить индивидуальное предложение