Цена на Amazon Bedrock
Обзор цен
Amazon Bedrock – это полностью управляемый сервис, который предоставляет большой набор высокопроизводительных базовых моделей (FM) через единый API и широкий набор полезных возможностей для создания приложений на основе генеративного искусственного интеллекта, поддерживая безопасность, конфиденциальность и ответственный подход к ИИ.
За вывод и настройку модели с использованием Amazon Bedrock с вас будет взиматься плата. Вы можете выбрать один из двух тарифных планов за вывод модели: 1. По запросу и в пакетном режиме. Вы платите только по мере использования модели и не берете на себя каких-либо обязательств по сроку использования. 2. За выделенную пропускную способность. В этом режиме обеспечивается достаточная пропускная способность для удовлетворения требований приложения к производительности в обмен на обязательства по сроку использования.
Модели формирования цен
Продвинутые инструменты
Сведения о ценах
Цены зависят от формы предоставления, поставщика и модели. Выберите поставщика модели, чтобы увидеть подробные цены.
Amazon Bedrock представляет избранные базовые модели (FM) от ведущих поставщиков решений на базе искусственного интеллекта, таких как Anthropic, Meta, Mistral AI и Amazon, для пакетного анализа по цене на 50 % ниже по сравнению с ценами на выводы по запросу. См. список моделей здесь.
-
AI21 Labs
-
Amazon
-
Anthropic
-
Cohere
-
Meta Llama
-
Mistral AI
-
Stability AI
-
Импорт пользовательских моделей
-
AI21 Labs
-
AI21 Labs
Цены по требованию
Модели AI21 Labs Цена за 1000 входящих токенов Цена за 1000 исходящих токенов Jamba 1.5 Large 0,002 USD 0,008 USD Jamba 1.5 Mini 0,0002 USD 0,0004 USD Jurassic-2 Mid 0,0125 USD 0,0125 USD Jurassic-2 Ultra 0,0188 USD 0,0188 USD Jamba-Instruct 0,0005 USD 0,0007 USD -
Amazon
-
Amazon
-
Anthropic
-
Anthropic
Цены по требованию и для пакетного режима
Регион: Восток США (Северная Вирджиния) и Запад США (Орегон)
Модели Anthropic Цена за 1000 входящих токенов Цена за 1000 исходящих токенов Цена за 1000 входящих токенов (пакет) Цена за 1000 исходящих токенов (пакет) Claude 3.5 Sonnet**
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 3.5 Haiku
0,001 USD
0,005 USD
0,0005 USD
0,0025 USD
Claude 3 Opus*
0,015 USD
0,075 USD
0,0075 USD
0,0375 USD
Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 2.1
0,008 USD
0,024 USD
Н/П
Н/П
Claude 2.0
0,008 USD
0,024 USD
Н/П
Н/П
Claude Instant
0,0008 USD
0,0024 USD
Н/П
Н/П
* Сервис Claude 3 Opus доступен в регионе «Запад США (Орегон)». ** Цены на Claude 3.5 Sonnet применимы к каждой версии Claude 3.5 Sonnet (версий 1 и 2) – Claude 3.5 Sonnet версии 2 в настоящее время доступна в регионе «Запад США (Орегон)». Регион: Европа (Лондон)
Модели Anthropic Цена за 1000 входящих токенов Цена за 1000 исходящих токенов Цена за 1000 входящих токенов (пакет) Цена за 1000 исходящих токенов (пакет) Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD 0,0075 USD Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD 0,000625 USD
Регион: Европа (Цюрих)
Модели Anthropic Цена за 1000 входящих токенов Цена за 1000 исходящих токенов Цена за 1000 входящих токенов (пакет) Цена за 1000 исходящих токенов (пакет) Claude 3.5 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Регион: Южная Америка (Сан-Паулу)
Модели Anthropic Цена за 1000 входящих токенов Цена за 1000 исходящих токенов Цена за 1000 входящих токенов (пакет) Цена за 1000 исходящих токенов (пакет) Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Регион: Канада (Центральная)
Модели Anthropic Цена за 1000 входящих токенов Цена за 1000 исходящих токенов Цена за 1000 входящих токенов (пакет) Цена за 1000 исходящих токенов (пакет) Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Регион: Азиатско-Тихоокеанский (Мумбаи)
Модели Anthropic Цена за 1000 входящих токенов Цена за 1000 исходящих токенов Цена за 1000 входящих токенов (пакет) Цена за 1000 исходящих токенов (пакет) Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Регион: Азиатско-Тихоокеанский (Сидней)
Модели Anthropic Цена за 1000 входящих токенов Цена за 1000 исходящих токенов Цена за 1000 входящих токенов (пакет) Цена за 1000 исходящих токенов (пакет) Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Регион: Азиатско-Тихоокеанский (Токио)
Модели Anthropic Цена за 1000 входящих токенов Цена за 1000 исходящих токенов Цена за 1000 входящих токенов (пакет) Цена за 1000 исходящих токенов (пакет) Claude Instant
0,0008 USD
0,0024 USD
Н/П
Н/П
Claude 2.0/2.1
0,008 USD
0,024 USD
Н/П
Н/П
Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Claude 3.5 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Регион: Азиатско-Тихоокеанский (Сингапур)
Модели Anthropic Цена за 1000 входящих токенов Цена за 1000 исходящих токенов Цена за 1000 входящих токенов (пакет) Цена за 1000 исходящих токенов (пакет) Claude Instant
0,0008 USD
0,0024 USD
0,0004 USD
0,0012 USD
Claude 2.0/2.1
0,008 USD
0,024 USD
0,004 USD
0,012 USD
Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Claude 3.5 Sonnet
0,003 USD
0,015 USD
Н/П
Н/П
Регион: Европа (Париж)
Модели Anthropic Цена за 1000 входящих токенов Цена за 1000 исходящих токенов Цена за 1000 входящих токенов (пакет) Цена за 1000 исходящих токенов (пакет) Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Регион: Европа (Франкфурт)
Модели Anthropic Цена за 1000 входящих токенов Цена за 1000 исходящих токенов Цена за 1000 входящих токенов (пакет) Цена за 1000 исходящих токенов (пакет) Claude Instant
0,0008 USD
0,0024 USD
Н/П
Н/П
Claude 2.0/2.1
0,008 USD
0,024 USD
Н/П
Н/П
Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 3.5 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Регион: Азиатско-Тихоокеанский (Сеул)
Модели Anthropic Цена за 1000 входящих токенов Цена за 1000 исходящих токенов Цена за 1000 входящих токенов (пакет) Цена за 1000 исходящих токенов (пакет) Claude 3.5 Sonnet
0,003 USD
0,015 USD
Н/П
Н/П
Claude 3 Haiku
0,00025 USD
0,00125 USD
Н/П
Н/П
Регион: Восток США (Огайо)
Модели Anthropic Цена за 1000 входящих токенов Цена за 1000 исходящих токенов Цена за 1000 входящих токенов (пакет) Цена за 1000 исходящих токенов (пакет) Claude 3.5 Sonnet
0,003 USD
0,015 USD
Н/П
Н/П
Claude 3 Haiku
0,00025 USD
0,00125 USD
Н/П
Н/П
Цены на выделенную пропускную способность
Регион: Восток США (Северная Вирджиния) и Запад США (Орегон)
Модели Anthropic Цена за час работы за модель
без подпискиЦена за час за элемент модели по подписке на 1 месяц Цена за час за элемент модели по подписке на 6 месяцев Claude Instant
44,00 USD 39,60 USD
22,00 USD
Claude 2.0/2.1
70,00 USD 63,00 USD
35,00 USD
Модели Anthropic Цена за час работы за модель
без подпискиЦена за час за элемент модели по подписке на 1 месяц Цена за час за элемент модели по подписке на 6 месяцев Claude Instant
44,00 USD 39,60 USD
22,00 USD
Claude 2.0/2.1
70,00 USD 63,00 USD
35,00 USD
Регион: Азиатско-Тихоокеанский регион (Токио)
Модели Anthropic Цена за час за элемент модели по подписке на 1 месяц Цена за час за элемент модели по подписке на 6 месяцев Claude Instant
53,00 USD
29,00 USD
Claude 2.0/2.1
86,00 USD
48,00 USD
Регион: Европа (Франкфурт)
Модели Anthropic Цена за час за элемент модели по подписке на 1 месяц Цена за час за элемент модели по подписке на 6 месяцев Claude Instant
49,00 USD
27,00 USD
Claude 2.0/2.1
79,00 USD
44,00 USD
Обратитесь к команде по работе с клиентами AWS для получения более подробной информации об элементах модели.
-
Cohere
-
Cohere
Цены по требованию
Модели Cohere Цена за 1000 входящих токенов Цена за 1000 исходящих токенов Command 0,0015 USD 0,0020 USD Command-Light 0,0003 USD 0,0006 USD Command R+ 0,0030 USD 0,0150 USD Command R 0,0005 USD 0,0015 USD Embed – английский язык 0,0001 USD Н/П Embed – многоязычная 0,0001 USD Н/П Цены на настройку (тонкая настройка)
Модели Cohere Стоимость обучения 1000 токенов Цена хранения каждой индивидуальной модели в месяц Цена вывода для пользовательской модели за каждый элемент модели в час (при условии оплаты за выделенную пропускную способность без подписки) Cohere Command
0,004 USD
1,95 USD
49,50 USD
Cohere Command-Light 0,001 USD 1,95 USD
8,56 USD * Общее количество обученных токенов = количество токенов в корпусе обучающих данных Х количество эпох
Оплата за выделенную пропускную способность
Модели Cohere Цена за час работы за модель
без подпискиЦена за час за элемент модели по подписке на 1 месяц Цена за час за элемент модели по подписке на 6 месяцев
Cohere Command
49,50 USD 39,60 USD
23,77 USD
Cohere Command – Light 8,56 USD 6,85 USD
4,11 USD Embed – английский язык 7,12 USD 6,76 USD
6,41 USD Embed – многоязычная 7,12 USD 6,76 USD
6,41 USD Обратитесь к команде по работе с клиентами AWS или в отдел продаж для получения более подробной информации об элементах модели.
-
Meta Llama
-
Meta Llama
Llama 3.2
Цены по требованию и для пакетного режима
Llama 3.1
Цены по требованию и для пакетного режима
Цены на настройку модели (точная настройка)
Оплата за выделенную пропускную способность
Llama 3
Цены по требованию
Llama 2
Цены по требованию
Регионы: Восток США (Северная Вирджиния) и Запад США (Орегон)
Модели Meta Цена за 1000 входящих токенов Цена за 1000 исходящих токенов Llama 2 Chat (13 млрд)
0,00075 USD
0,001 USD
Llama 2 Chat (70 млрд) 0,00195 USD
0,00256 USD Цены на настройку модели (тонкая настройка)
Модели Meta Стоимость обучения 1000 токенов Цена хранения каждой пользовательской модели* в месяц Цена вывода для пользовательской модели за 1 элемент модели в час (без учета стоимости выделенной пропускной способности) Llama 2, предварительно обученная (13 млрд)
0,00149 USD
1,95 USD
23,50 USD
Llama 2, предварительно обученная (70 млрд) 0,00799 USD
1,95 USD 23,50 USD * Хранение пользовательских моделей = 1,95 USD
Оплата за выделенную пропускную способность
Модели Meta Цена за час за элемент модели по подписке на 1 месяц Цена за час за элемент модели по подписке на 6 месяцев Llama 2, предварительно обученная и Chat (13 млрд)
21,18 USD
13,08 USD
Llama 2, предварительно обученная (70 млрд) 21,18 USD
13,08 USD *Предварительно обученные модели Llama 2 доступны только с выделенной пропускной способностью после настройки.
Обратитесь к команде по работе с клиентами AWS или в отдел продаж для получения более подробной информации об элементах модели.
-
Mistral AI
-
Mistral AI
-
Stability AI
-
Stability AI
Цены по требованию
Модель Stability AI Цена за сгенерированное изображение Stable Image Core 0,04 USD SD3 Large 0,08 USD Stable Image Ultra 0,14 USD Ранее сгенерированные модели изображений, предлагаемые Stability AI, оплачиваются за количество изображений с учетом количества шагов и разрешения изображения.
Модель Stability AI Разрешение изображения Цена за созданное изображение в стандартном качестве (не более 50 шагов) Цена за созданное изображение в превосходном качестве (более 50 шагов) SDXL 1.0 Не более 1024×1024 0,04 USD 0,08 USD Оплата за выделенную пропускную способность
Модель Stability AI Цена за час за элемент модели по подписке на 1 месяц* Цена за час за элемент модели по подписке на 6 месяцев* SDXL 1.0
49,86 USD
46,18 USD
* Включает вывод по базовым и пользовательским моделям
Обратитесь к команде по работе с клиентами AWS или в отдел продаж для получения более подробной информации об элементах модели.
В настоящее время настройка моделей Stability AI (тонкая настройка) в Amazon Bedrock не поддерживается.
-
Импорт пользовательских моделей
-
Импорт пользовательских моделей
-
Llama
-
Llama мультимодальная
-
Mistral
-
Mixtral
-
Flan
-
Llama
-
Регионы: Восток США (Северная Вирджиния) и Запад США (Орегон)
Версия пользовательского модельного блока версия 1.0 Цена за элемент нестандартной модели в минуту* 0,0785 USD Ежемесячная стоимость хранения за элемент нестандартной модели 1,95 USD Настраиваемые модули модели, необходимые для ее размещения, зависят от множества факторов, в частности от архитектуры модели, количества ее параметров и длины контекста. Точное количество необходимых элементов пользовательской модели будет определено во время импорта. Примечание. Для модели Llama 3.1 8B 128 КБ требуются 2 пользовательских модельных блока, а для модели Llama 3.1 70B 128k – 8 специальных моделей. * Оплата выставляется в течение 5 минут. -
Llama мультимодальная
-
Регионы: Восток США (Северная Вирджиния) и Запад США (Орегон)
Версия пользовательского модельного блока версия 1.0 Цена за элемент нестандартной модели в минуту* 0,0785 USD Ежемесячная стоимость хранения за элемент нестандартной модели 1,95 USD Настраиваемые модули модели, необходимые для ее размещения, зависят от множества факторов, в частности от архитектуры модели, количества ее параметров и длины контекста. Точное количество необходимых элементов пользовательской модели будет определено во время импорта. Примечание. Для модели Llama 3.2 11B 128 КБ требуются 4 специализированных модельных устройства. * Оплата выставляется в течение 5 минут. -
Mistral
-
Регионы: Восток США (Северная Вирджиния) и Запад США (Орегон)
Версия пользовательского модельного блока версия 1.0 Цена за элемент нестандартной модели в минуту* 0,0785 USD Ежемесячная стоимость хранения за элемент нестандартной модели 1,95 USD Настраиваемые модули модели, необходимые для ее размещения, зависят от множества факторов, в частности от архитектуры модели, количества ее параметров и длины контекста. Точное количество необходимых элементов пользовательской модели будет определено во время импорта. Примечание. Для модели Mistral 7B 32K требуется 1 специализированная модель. * Оплата выставляется в течение 5 минут. -
Mixtral
-
Регионы: Восток США (Северная Вирджиния) и Запад США (Орегон)
Версия пользовательского модельного блока версия 1.0 Цена за элемент нестандартной модели в минуту* 0,0785 USD Ежемесячная стоимость хранения за элемент нестандартной модели 1,95 USD Настраиваемые модули модели, необходимые для ее размещения, зависят от множества факторов, в частности от архитектуры модели, количества ее параметров и длины контекста. Точное количество необходимых элементов пользовательской модели будет определено во время импорта. Примечание. Для модели Mixtral 8x7B 32K требуются 4 специализированных модельных устройства. * Оплата выставляется в течение 5 минут. -
Flan
-
Регионы: Восток США (Северная Вирджиния) и Запад США (Орегон)
Версия пользовательского модельного блока версия 1.0 Цена за элемент нестандартной модели в минуту* 0,0785 USD Ежемесячная стоимость хранения за элемент нестандартной модели 1,95 USD Настраиваемые модули модели, необходимые для ее размещения, зависят от множества факторов, в частности от архитектуры модели, количества ее параметров и длины контекста. Точное количество необходимых элементов пользовательской модели будет определено во время импорта. Примечание. Для модели Flan-T5 XL 512 требуется 1 специализированная модель. * Оплата выставляется в течение 5 минут.
Цены на инференсы по запросу
Счет выставляется в течение 5 минут, пока копия модели активна, начиная с первого успешного вызова. Максимальный предел пропускной способности и параллелизма для каждой копии модели определяется в процессе ее импорта и зависит от таких факторов, как сочетание токенов ввода/вывода, тип оборудования, размер модели, архитектура, оптимизация логических выводов.Bedrock автоматически масштабирует количество копий модели в зависимости от особенностей использования. Если в течение 5 минут вызова не будет, Bedrock уменьшит масштаб до нуля и снова увеличит его при вызове модели. Во время повторного масштабирования может возникнуть продолжительность холодного запуска (в десятках секунд) в зависимости от размера модели. Bedrock также увеличивает количество копий модели, если объем вывода постоянно превышает пределы параллелизма одной копии модели. Примечание. По умолчанию на каждую импортированную модель приходится не более 3 копий модели на одну учетную запись, которые можно увеличить с помощью Квоты на обслуживание.
-
Расширенные инструменты ценообразования (подробнее)
-
Потоки
-
Ограничения
-
Оценка модели
-
Потоки
-
Потоки Amazon Bedrock
Плата зависит от количества переходов между узлами, необходимых для выполнения приложения. Bedrock Flows учитывает переход узла при каждом его выполнении в вашем рабочем процессе. Стоимость зависит от суммарного количества переходов между узлами во всех ваших потоках.
Все расходы оцениваются ежедневно, и плата за них взимается ежемесячно начиная с 1 февраля 2025 года.
Цена за 1000 переходов узлов 0,035 USD Дополнительная плата
Если в рабочем процессе приложения используются другие сервисы AWS или осуществляется передача данных, может начисляться дополнительная плата. Например, если ваш рабочий процесс использует политику Ограничения для Amazon Bedrock, вам будет выставлен счет за количество текстовых единиц, обработанных политикой.
-
Ограничения
-
Ограничения для Amazon Bedrock
Политика ограничений*
Цена за 1000 текстовых единиц**
Фильтры контента
0,75 USD
Запрещенные темы
1 USD
Контекстная проверка обоснования***
0,1 USD
Фильтр конфиденциальной информации (PII)
0,1 USD
Фильтр конфиденциальной информации (регулярное выражение)
Бесплатно
Фильтры слов
Бесплатно
Цены по требованию
* Каждая политика ограничения опциональна и может быть активирована в зависимости от требований вашего приложения. Плата будет взиматься в зависимости от типа политики, используемой в ограничении. Например, если ограничение настроено с использованием фильтров контента и запрещенных тем, плата за эти две политики будет взиматься, а за фильтры конфиденциальной информации – нет.
** Текстовая единица может содержать до 1000 символов. Если текстовый ввод превышает 1000 символов, он обрабатывается как несколько текстовых единиц, каждая из которых содержит 1000 символов или меньше. Например, если введенный текст содержит 5600 символов, плата будет взиматься за 6 текстовых единиц.*** Контекстная проверка обоснования использует источник данных и запрос, чтобы определить степень соответствия ответа модели источнику данных и запросу. Общее количество текстовых единиц, за которые взимается плата, рассчитывается путем объединения всех символов в источнике, запросе и ответе модели.
Ограничения не поддерживаются для изображений и встраиваний.
-
Оценка модели
-
Оценка модели
За оценку модели взимается плата за вывод, сделанный на основе выбранной модели. Автоматически сгенерированные алгоритмические оценки предоставляются без дополнительной оплаты. В случае оценки с участием человека (собственной рабочей команды) с вас взимается плата за вывод модели и плата в размере 0,21 USD за каждую выполненную человеком задачу.
Модель
Цена за 1000 входящих токенов
Цена за 1000 исходящих токенов
Стоимость выполнения каждой задачи для человека
Модель, выбранная для оценки
На основе выбранной модели
На основе выбранной модели
0,21 USD
Примеры расчета цен
-
AI21 Labs
Разработчик приложения выполняет следующие вызовы API к Amazon Bedrock: запрос к модели Jurassic-2 Mid от AI21 Labs для суммирования вводного потока из 10 000 токенов входного текста в итоговый поток из 2000 токенов.
Общая стоимость = 10 000 токенов / 1000 * 0,0125 USD + 2000 токенов / 1000 * 0,0125 USD = 0,15 USD
-
Amazon
Цены по требованию
Разработчик приложения каждый час выполняет следующие вызовы API к Amazon Bedrock: запрос к модели Amazon Titan Text Lite для суммирования входящего потока из 2000 токенов входящего текста в исходящий поток из 1000 токенов.
Общая стоимость в час = 2000 токенов / 1000 * 0,0003 USD + 1000 токенов / 1000 * 0,0004 USD = 0,001 USD.
Разработчик приложения выполняет следующие вызовы API к Amazon Bedrock: запрос к базовой модели генератора изображений Amazon Titan для создания 1000 изображений размером 1024 × 1024 в стандартном качестве.
Общая стоимость = 1000 изображений * 0,01 USD за изображение = 10 USD
Оплата за настройку (тонкую настройку и непрерывное предварительное обучение)
Разработчик приложения настраивает модель генератора изображений Amazon Titan, используя 1000 пар «изображение – текст». После обучения разработчик использует выделенную для пользовательской модели пропускную способность в течение 1 часа, чтобы оценить производительность модели. Тонко настроенная модель хранится в течение 1 месяца. После оценки разработчик использует выделенную пропускную способность (с подпиской на один месяц) для размещения настраиваемой модели.
Ежемесячные затраты на тонкую настройку вычисляются так: обучение для тонкой настройки (0,005 USD * 500 * 64), где 0,005 USD – цена за просмотренное изображение, 500 – количество шагов, 64 – размер партии плюс хранение пользовательской модели в месяц (1,95 USD) + 1 час анализа пользовательской модели (21 USD) = 160 USD + 1,95 USD + 21 = 182,95 USD
Оплата за выделенную пропускную способность
Разработчик приложения покупает два элемента модели Amazon Titan Text Express с подпиской на один месяц, чтобы использовать ее для обобщения текста.
Общая стоимость в месяц: 2 элемента модели * 18,40 USD/час * 24 часа * 31 день = 27 379,20 USD
Разработчик приложения покупает один элемент модели базовой модели генератора изображений Amazon Titan с подпиской на один месяц.
Общая стоимость = 1 элемент модели * 16,20 USD * 24 часа * 31 день = 12 052,80 USD
-
Anthropic
Цены по требованию
Разработчик приложения выполняет следующие вызовы API к Amazon Bedrock в регионе Запад США (Орегон): запрос к модели Claude от Anthropic для суммирования входящего потока из 11 000 токенов входящего текста в исходящий поток размером 4000 токенов.
Общая стоимость = 11 000 токенов / 1000 * 0,008 USD + 4000 токенов / 1000 * 0,024 USD = 0,088 USD + 0,096 USD = 0,184 USD
Оплата за выделенную пропускную способность
Разработчик приложения покупает один элемент модели Anthropic Claude Instant в регионе Запад США (Орегон).
Общая стоимость в месяц: 1 элемент модели * 39,60 USD * 24 часа * 31 день = 29 462,40 USD
-
Cohere
Цены по требованию
Разработчик приложения выполняет следующие вызовы API к Amazon Bedrock: запрос к модели Command от Cohere для суммирования входящего потока из 6000 токенов входящего текста в исходящий поток размером 2000 токенов.
Общая стоимость = 6000 токенов / 1000 * 0,0015 USD + 2000 токенов / 1000 * 0,0020 USD = 0,013 USD
Разработчик приложения выполняет следующие вызовы API к Amazon Bedrock: запрос к модели Command – Light от Cohere для суммирования входящего потока из 6000 токенов входящего текста в исходящий поток размером 2000 токенов.
Общая стоимость = 6000 токенов / 1000 * 0,0003 USD + 2000 токенов / 1000 * 0,0006 USD = 0,003 USD
Разработчик приложения выполняет следующие вызовы API к Amazon Bedrock: запрос к модели Embed English или Embed Multilingual от Cohere, чтобы создавать вложения для 10 000 токенов входящего потока.
Общая стоимость = 10 000 токенов / 1000 * 0,0001 USD = 0,001 USD
Оплата за настройку (тонкую настройку)
Разработчик приложения настраивает командную модель Cohere, используя 1000 токенов данных. После обучения он использует выделенную для пользовательской модели пропускную способность в течение 1 часа, чтобы оценить производительность модели. Тонко настроенная модель хранится в течение 1 месяца. После оценки разработчик использует выделенную пропускную способность (с подпиской на один месяц) для размещения настраиваемой модели.
В ежемесячную стоимость тонкой настройки входит обучение для тонкой настройки (0,004 USD * 1000), хранение пользовательских моделей в месяц (1,95 USD), один час вывода по пользовательской модели (49,50 USD). Итого: 55,45 USD.
Ежемесячная стоимость выделенной пропускной способности (с подпиской на один месяц) пользовательской модели составляет 39,60 USD
Оплата за выделенную пропускную способность
Разработчик приложения покупает один элемент модели Cohere Command с подпиской на один месяц, чтобы использовать ее для обобщения текста.
Общая стоимость в месяц: 1 элемент модели * 39,60 USD * 24 часа * 31 день = 29 462,40 USD
-
Meta Llama
Цены по требованию
Разработчик приложения выполняет следующие вызовы API к Amazon Bedrock: запрос к модели Llama 2 Chat (13 млрд) от Meta для суммирования входящего потока из 2000 токенов входящего текста в исходящий поток размером 500 токенов.
Общая стоимость = 2000 токенов / 1000 * 0,00075 USD + 500 токенов / 1000 USD * 0,001 USD = 0,002 USD
Оплата за настройку (тонкую настройку)
Разработчик приложения настраивает предварительно обученную модель Llama 2 (70 млрд), используя 1000 токенов данных. После обучения он использует выделенную для пользовательской модели пропускную способность в течение 1 часа, чтобы оценить производительность модели. Тонко настроенная модель хранится в течение 1 месяца. После оценки разработчик использует выделенную пропускную способность (с подпиской на один месяц) для размещения настраиваемой модели.
В ежемесячную стоимость тонкой настройки входит обучение для тонкой настройки (0,00799 USD * 1000), хранение пользовательских моделей в месяц (1,95 USD), один час вывода по пользовательской модели (23,50 USD). Итого: 33,44 USD.
Ежемесячная стоимость выделенной пропускной способности (с подпиской на один месяц) пользовательской модели составляет 21,18 USD
Оплата за выделенную пропускную способность
Разработчик приложения покупает один элемент модели Meta Llama 2 с подпиской на один месяц, чтобы использовать ее для обобщения текста.
Общая стоимость в месяц: 1 элемент модели * 21,18 USD * 24 часа * 31 день = 15 757,92 USD
-
Mistral AI
Цены по требованию
Разработчик приложения каждый час выполняет следующие вызовы API к Amazon Bedrock: запрос к модели Mistral 7B для суммирования входящего потока из 2000 токенов входящего текста в исходящий поток из 1000 токенов.
Общая стоимость в час = 2000 токенов / 1000 * 0,00015 USD + 1000 токенов / 1000 * 0,0002 USD = 0,0005 USD
Разработчик приложения каждый час выполняет следующие вызовы API к Amazon Bedrock: запрос к модели Mixtral 8x7B для суммирования входящего потока из 2000 токенов входящего текста в исходящий поток из 1000 токенов.
Общая стоимость в час = 2000 токенов / 1000 * 0,00045 USD + 1000 токенов / 1000 * 0,0007 USD = 0,0016 USD
Разработчик приложения каждый час выполняет следующие вызовы API к Amazon Bedrock: запрос к модели Mistral Large для суммирования входящего потока размером 2000 токенов входящего текста в исходящий поток размером 1000 токенов.
Общая стоимость в час = 2000 токенов / 1000 * 0,008 USD + 1000 токенов / 1000 * 0,024 USD = 0,04 USD
-
Stability AI
Цены по требованию
Разработчик приложения выполняет следующие вызовы API к Amazon Bedrock: запрос к модели SDXL для создания изображения размером 512 × 512 с величиной шага 70 (премиальное качество).
Общая стоимость = 1 изображение * 0,036 USD за изображение = 0,036 USD
Разработчик приложения выполняет следующие вызовы API к Amazon Bedrock: запрос к модели SDXL 1.0 для создания изображения размером 1024 × 1024 с величиной шага 70 (премиальное качество).
Общая стоимость = 1 изображение * 0,08 USD за изображение = 0,08 USD
Оплата за выделенную пропускную способность
Разработчик приложения покупает один элемент модели SDXL 1.0 с подпиской на один месяц.
Общая стоимость = 1 * 49,86 USD * 24 часа * 31 день = 37 095,84 USD
-
Оценка модели
Оценка модели, пример 1.
Цены на ресурсы по требованию
Разработчик приложения представляет набор данных для оценки модели с участием человека на основе Anthropic Claude 2.1 и Anthropic Claude Instant в регионе AWS «Восток США (Северная Вирджиния)».Этот набор данных содержит 50 запросов, а для оценки каждого сочетания запроса и ответа разработчик требует использовать 1-го сотрудника (это значение указывается в параметре «количество сотрудников на запрос» при создании задания по оценке).
В этом оценочном задании будет 50 задач (по 1 заданию на каждый набор подсказок и ответов на каждого работника). 50 запросов в сумме содержат 5000 входящих токенов, а ответы – 15 тысяч токенов для Anthropic Claude Instant и 20 тысяч токенов для Anthropic Claude 2.1.
Плата за эту работу по оценке модели вычисляется следующим образом:Элемент Количество входящих токенов Цена за 1000 входящих токенов Стоимость входящих потоков Количество исходящих токенов Цена за 1000 исходящих токенов Стоимость исходящих потоков Количество задач для человека Стоимость выполнения каждой задачи для человека Стоимость всех задач для человека Итого Логический вывод Claude Instant 5000 0,0008 USD 0,004 USD 15 000 0,0024 USD 0,036 USD 0,04 USD Логический вывод Claude 2.1 5000 0,008 USD 0,04 USD 20 000 0,024 USD 0,48 USD 0,52 USD Задачи для человека 50 0,21 USD 10,50 USD 10,50 USD Итого 11,06 USD Оценка модели, пример 2.
Цены на ресурсы по требованию
Разработчик приложения представляет набор данных для оценки модели с участием человека на основе Anthropic Claude 2.1 и Anthropic Claude Instant в регионе AWS «Восток США (Северная Вирджиния)».
Этот набор данных содержит 50 запросов, а для оценки каждого сочетания запроса и ответа разработчик требует использовать 2-х сотрудников (это значение указывается в параметре «количество сотрудников на запрос» при создании задания по оценке). Это означает, что задание по оценке будет состоять из 100 задач (по 1 задаче на каждый набор «запрос – ответ» на каждого сотрудника: 2 сотрудника × 50 наборов «запрос – ответ» = 100 задач для человека).
50 запросов в сумме содержат 5000 входящих токенов, а ответы – 15 тысяч токенов для Anthropic Claude Instant и 20 тысяч токенов для Anthropic Claude 2.1.
Плата за эту работу по оценке модели вычисляется следующим образом:
Элемент Количество входящих токенов Цена за 1000 входящих токенов Стоимость входящих потоков Количество исходящих токенов Цена за 1000 исходящих токенов Стоимость исходящих потоков Количество задач для человека Стоимость выполнения каждой задачи для человека Стоимость всех задач для человека Итого Логический вывод Claude Instant 5000 0,0008 USD 0,0040 USD 15 000 0,0024 USD 0,036 USD 0,04 USD Логический вывод Claude 2.1 5000 0,008 USD 0,0400 USD 20 000 0,024 USD 0,48 USD 0,52 USD Задачи для человека 100 0,21 USD 21,00 USD 21,00 USD Итого 21,56 USD -
Ограничения для Amazon Bedrock
Пример 1. Чат-бот службы поддержки
Разработчик приложения создает чат-бота службы поддержки клиентов и использует фильтры контента для блокировки вредоносного контента и запрещенных тем, чтобы отфильтровывать нежелательные запросы и ответы.
Чат-бот обрабатывает 1000 запросов пользователей в час. Каждый пользовательский запрос имеет среднюю длину ввода 200 символов и получает ответ базовой модели размером в 1500 символов.
Каждый пользовательский запрос длиной 200 символов соответствует одной текстовой единице.
Каждый ответ базовой модели длиной 1500 символов соответствует двум текстовым единицам.
Текстовые единицы, обрабатываемые каждый час = (1 + 2) * 1000 запросов = 3000 текстовых единиц
Общая стоимость часов фильтрации контента и запрещенной темы = 3000 * (0,75 USD + 1,00 USD) / 1000 = 5,25 USDПример 2. Обобщение стенограмм колл-центра
Разработчик создает приложение для обобщения стенограмм чатов между пользователями и агентами поддержки. Он использует фильтр конфиденциальной информации для редактирования информации, позволяющей установить личность (PII), в сгенерированных сводках по 10 000 разговоров.
Каждая сгенерированная сводка содержит в среднем 3500 символов, что соответствует 4 текстовым единицам.
Общая стоимость суммирования: 10 000 разговоров = 10 000 * 4 * (0,1 USD/1000) = 4 USDЭлемент Количество входящих токенов Цена за 1000 входящих токенов Стоимость входящих потоков Количество исходящих токенов Цена за 1000 исходящих токенов Стоимость исходящих потоков Количество задач для человека Стоимость выполнения каждой задачи для человека Стоимость всех задач для человека Итого Логический вывод Claude Instant 5000 0,0008 USD 0,004 USD 15 000 0,0024 USD 0,036 USD 0,04 USD Логический вывод Claude 2.1 5000 0,008 USD 0,04 USD 20 000 0,024 USD 0,48 USD 0,52 USD Задачи для человека 100 0,21 USD 21,00 USD 21,00 USD Итого 21,56 USD -
Импорт пользовательских моделей
Пример ценообразования. Разработчик приложения импортирует персонализированную модель типа Llama 3.1 с параметром 8B и длиной последовательности 128 КБ в регионе us-east-1 и удаляет модель через 1 месяц. Для этого необходимы 2 элемента нестандартной модели. Таким образом, цена за минуту составит 0,1570 USD, поскольку требуются 2 элемента пользовательской модели. Стоимость хранения двух моделей на заказ составит 3,90 USD в месяц.
Плата за импорт модели не взимается. Первый успешный вызов осуществлен в 08:03. В это время начинается замер. Окна измерений длительностью 5 минут работают с 08:03 до 08:07, с 08:07 до 08:11 и т. д. Если за любой 5-минутный период был выполнен хотя бы один вызов, окно оплаты будет считаться активным. Если с 08:07 до 08:11 вызова не будет, замер остановится в 08:11. В этом случае счет будет рассчитан следующим образом: 0,1570 USD * 5 минут * 3 окна по пять минут = 2,355 USD.
-
Потоки
Пример. Сводка новостей
Разработчик приложения создает поток с целью автоматизации суммирования новостей для трейдеров. Поток начинается с узла ввода, принимающего массив из 10 местоположений S3 для статей от 10 ведущих информационных агентств (1 переход). Далее узел-итератор проходит по 10 папкам, извлекает по одному файлу из каждого соответствующего местоположения через узел S3-загрузки и вызывает модель суммирования с помощью узла текстового запроса (+ 10 файлов x 3 перехода). Полученные результаты собираются узлом-коллектором, затем сохраняются обратно в S3 через узел S3-хранилища и передаются в узел Output для завершения процесса (+ 3 перехода). Поток запускается каждые полчаса в рабочие дни.
Количество переходов между узлами для выполнения одного потока: 1 + 10 * 3 + 3 = 34 перехода.
Количество запусков потока в месяц: 24 часа * 2 запуска в час * 5 дней * 4 недели = 960 запусков.
Общая ежемесячная стоимость: 34 * 960 * 0,035 USD / 1000 USD = 1,14 USD.Дополнительная плата
Дополнительно в счет будут включены расходы на сервисы AWS, используемые в процессе выполнения потока, включая хранение и извлечение данных через Amazon S3 (узлы загрузки и хранения) и применение модели Amazon Bedrock Foundation (узел текстового запроса).