Precios de Amazon Bedrock
Información general sobre precios
Amazon Bedrock es un servicio totalmente administrado que ofrece una selección de modelos fundacionales (FM) de alto rendimiento a través de una única API, junto con un amplio conjunto de funcionalidades que necesita para crear aplicaciones de IA generativa con seguridad, privacidad e IA responsable.
Con Amazon Bedrock, se le cobrará por la inferencia y personalización del modelo. Puede elegir entre dos precios de planes a modo de inferencia: 1. Bajo demanda y por lotes: este modo le permite usar FM con la modalidad de pago por uso sin compromisos temporales. 2. Rendimiento aprovisionado: este modo le permite aprovisionar un rendimiento suficiente para cumplir con los requisitos de rendimiento de su aplicación a cambio de un compromiso temporal.
Modelos de precios
Herramientas avanzadas
Detalles sobre los precios
El precio depende de la modalidad, el proveedor y el modelo. Seleccione el proveedor del modelo para ver los precios detallados.
Amazon Bedrock ofrece modelos fundacionales (FM) exclusivos de los principales proveedores de inteligencia artificial, como Anthropic, Meta, Mistral AI y Amazon, para la inferencia por lotes a un precio un 50 % más bajo en comparación con los precios de inferencia bajo demanda. Consulte la lista de modelos aquí.
-
AI21 Labs
-
Amazon
-
Anthropic
-
Cohere
-
Meta Llama
-
Mistral AI
-
Stability AI
-
Importación de modelos personalizados
-
AI21 Labs
-
AI21 Labs
Precios bajo demanda
Modelos de AI21 Labs Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida Jamba 1.5 Large 0,002 USD 0,008 USD Jamba 1.5 Mini 0,0002 USD 0,0004 USD Jurassic-2 Mid 0,0125 USD 0,0125 USD Jurassic-2 Ultra 0,0188 USD 0,0188 USD Jamba-Instruct 0,0005 USD 0,0007 USD -
Amazon
-
Amazon
-
Anthropic
-
Anthropic
Precios bajo demanda y por lotes
Región: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)
Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida Precio por cada 1000 tokens de entrada (lote) Precio por cada 1000 tokens de salida (lote) Claude 3.5 Sonnet**
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 3.5 Haiku
0,001 USD
0,005 USD
0,0005 USD
0,0025 USD
Claude 3 Opus*
0,015 USD
0,075 USD
0,0075 USD
0,0375 USD
Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 2.1
0,008 USD
0,024 USD
N/D
N/D
Claude 2.0
0,008 USD
0,024 USD
N/D
N/D
Claude Instant
0,0008 USD
0,0024 USD
N/D
N/D
*Actualmente, Claude 3 Opus se encuentra disponible en la región Oeste de EE. UU. (Oregón) **Los precios de Claude 3.5 Sonnet se aplican a cada versión de Claude 3.5 Sonnet (v1 y v2). Claude 3.5 Sonnet v2 está disponible actualmente en la región del oeste de EE. UU. (Oregón) Región: Europa (Londres)
Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida Precio por cada 1000 tokens de entrada (lote) Precio por cada 1000 tokens de salida (lote) Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD 0,0075 USD Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD 0,000625 USD
Región: Europa (Zúrich)
Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida Precio por cada 1000 tokens de entrada (lote) Precio por cada 1000 tokens de salida (lote) Claude 3.5 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Región: América del Sur (San Pablo)
Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida Precio por cada 1000 tokens de entrada (lote) Precio por cada 1000 tokens de salida (lote) Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Región: Canadá (centro)
Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida Precio por cada 1000 tokens de entrada (lote) Precio por cada 1000 tokens de salida (lote) Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Región: Asia-Pacífico (Bombay)
Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida Precio por cada 1000 tokens de entrada (lote) Precio por cada 1000 tokens de salida (lote) Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Región: Asia-Pacífico (Sídney)
Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida Precio por cada 1000 tokens de entrada (lote) Precio por cada 1000 tokens de salida (lote) Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Región: Asia-Pacífico (Tokio)
Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida Precio por cada 1000 tokens de entrada (lote) Precio por cada 1000 tokens de salida (lote) Claude Instant
0,0008 USD
0,0024 USD
N/D
N/D
Claude 2.0/2.1
0,008 USD
0,024 USD
N/D
N/D
Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Claude 3.5 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Región: Asia-Pacífico (Singapur)
Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida Precio por cada 1000 tokens de entrada (lote) Precio por cada 1000 tokens de salida (lote) Claude Instant
0,0008 USD
0,0024 USD
0,0004 USD
0,0012 USD
Claude 2.0/2.1
0,008 USD
0,024 USD
0,004 USD
0,012 USD
Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Claude 3.5 Sonnet
0,003 USD
0,015 USD
N/D
N/D
Región: Europa (París)
Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida Precio por cada 1000 tokens de entrada (lote) Precio por cada 1000 tokens de salida (lote) Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Región: Europa (Fráncfort)
Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida Precio por cada 1000 tokens de entrada (lote) Precio por cada 1000 tokens de salida (lote) Claude Instant
0,0008 USD
0,0024 USD
N/D
N/D
Claude 2.0/2.1
0,008 USD
0,024 USD
N/D
N/D
Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 3.5 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Región: Asia-Pacífico (Seúl)
Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida Precio por cada 1000 tokens de entrada (lote) Precio por cada 1000 tokens de salida (lote) Claude 3.5 Sonnet
0,003 USD
0,015 USD
N/D
N/D
Claude 3 Haiku
0,00025 USD
0,00125 USD
N/D
N/D
Región: Este de EE. UU. (Ohio)
Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida Precio por cada 1000 tokens de entrada (lote) Precio por cada 1000 tokens de salida (lote) Claude 3.5 Sonnet
0,003 USD
0,015 USD
N/D
N/D
Claude 3 Haiku
0,00025 USD
0,00125 USD
N/D
N/D
Precios del rendimiento aprovisionado
Región: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)
Modelos de Anthropic Precio por hora y modelo
sin compromisoPrecio por hora por unidad de modelo con un compromiso de 1 mes Precio por hora por unidad de modelo con un compromiso de 6 mes Claude Instant
44,00 USD 39,60 USD
22,00 USD
Claude 2.0 y 2.1
70,00 USD 63,00 USD
35,00 USD
Modelos de Anthropic Precio por hora y modelo
sin compromisoPrecio por hora por unidad de modelo con un compromiso de 1 mes Precio por hora por unidad de modelo con un compromiso de 6 mes Claude Instant
44,00 USD 39,60 USD
22,00 USD
Claude 2.0 y 2.1
70,00 USD 63,00 USD
35,00 USD
Región: Asia-Pacífico (Tokio)
Modelos de Anthropic Precio por hora por unidad de modelo con un compromiso de 1 mes Precio por hora por unidad de modelo con un compromiso de 6 mes Claude Instant
53,00 USD
29,00 USD
Claude 2.0/2.1
86,00 USD
48,00 USD
Región: Europa (Fráncfort)
Modelos de Anthropic Precio por hora por unidad de modelo con un compromiso de 1 mes Precio por hora por unidad de modelo con un compromiso de 6 mes Claude Instant
49,00 USD
27,00 USD
Claude 2.0/2.1
79,00 USD
44,00 USD
Póngase en contacto con su equipo de cuentas de AWS para obtener más información sobre las unidades de modelo.
-
Cohere
-
Cohere
Precios bajo demanda
Modelos de Cohere Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida Command 0,0015 USD 0,0020 USD Command-Light 0,0003 USD 0,0006 USD Command R+ 0,0030 USD 0,0150 USD Command R 0,0005 USD 0,0015 USD Embed: inglés 0,0001 USD N/D Embed: multilingüe 0,0001 USD N/D Precios por la personalización (ajuste preciso)
Modelos de Cohere Precio por entrenar 1000 tokens Precio por el almacenamiento mensual de cada modelo personalizado Precio a deducir de un modelo personalizado por unidad de modelo por hora (con precios de rendimiento aprovisionado sin compromiso) Cohere Command
0,004 USD
1,95 USD
49,50 USD
Cohere Command-Light 0,001 USD 1,95 USD
8,56 USD * El total de tokens entrenados es igual a la cantidad de tokens en el corpus de datos de entrenamiento multiplicado por la cantidad de épocas
Precios del rendimiento aprovisionado
Modelos de Cohere Precio por hora y modelo
sin compromisoPrecio por hora por unidad de modelo con un compromiso de 1 mes Precio por hora por unidad de modelo con un compromiso de 6 mes
Cohere Command
49,50 USD 39,60 USD
23,77 USD
Cohere Command: Light 8,56 USD 6,85 USD
4,11 USD Embed: inglés 7,12 USD 6,76 USD
6,41 USD Embed: multilingüe 7,12 USD 6,76 USD
6,41 USD Contacte con su equipo de cuentas o ventas de AWS para obtener más información sobre las unidades de modelo.
-
Meta Llama
-
Meta Llama
Llama 3.2
Precios bajo demanda y por lotes
Llama 3.1
Precios bajo demanda y por lotes
Precios por la personalización del modelo (ajuste preciso)
Precios del rendimiento aprovisionado
Llama 3
Precios bajo demanda
Llama 2
Precios bajo demanda
Región: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)
Modelos de Meta Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida Llama 2 Chat (13B)
0,00075 USD
0,001 USD
Llama 2 Chat (70B) 0,00195 USD
0,00256 USD Precios por la personalización del modelo (ajuste preciso)
Modelos de Meta Precio por entrenar 1000 tokens Precio por el almacenamiento mensual de cada modelo personalizado* Precio por inferencia de un modelo personalizado por 1 unidad de modelo por hora (con precios de rendimiento aprovisionado sin compromiso) Llama 2 Pretrained (13B)
0,00149 USD
1,95 USD
23,50 USD
Llama 2 Pretrained (70B) 0,00799 USD
1,95 USD 23,50 USD * Almacenamiento de modelo personalizado = 1,95 USD
Precios del rendimiento aprovisionado
Modelos de Meta Precio por hora por unidad de modelo con un compromiso de 1 mes Precio por hora por unidad de modelo con un compromiso de 6 mes Llama 2 Pretrained y Chat (13B)
21,18 USD
13,08 USD
Llama 2 Pretrained (70B) 21,18 USD
13,08 USD * Los modelos de Llama 2 Pre-trained solo se encuentran disponibles con un rendimiento aprovisionado después de la personalización.
Póngase en contacto con su equipo de cuentas o ventas de AWS para obtener más información sobre las unidades de modelo.
-
Mistral AI
-
Mistral AI
-
Stability AI
-
Stability AI
Precios bajo demanda
Modelo de Stability AI Precio por imagen generada Stable Image Core 0,04 USD SD3 Large 0,08 USD Stable Image Ultra 0,14 USD Los modelos de imagen de la generación anterior ofrecidos por Stability AI tienen un precio por imagen, en función del número de pasos y de la resolución de la imagen.
Modelo de Stability AI Resolución de imagen Precio por imagen generada de calidad estándar (<=50 pasos) Precio por imagen generada de calidad premium (>50 pasos) SDXL 1.0 Hasta 1024 x 1024 0,04 USD 0,08 USD Precios del rendimiento aprovisionado
Modelo de Stability AI Precio por hora por unidad de modelo con un compromiso de 1 mes* Precio por hora por unidad de modelo con un compromiso de 6 mes* SDXL 1.0
49,86 USD
46,18 USD
*Incluye inferencia para modelos básicos y personalizados
Contacte con su equipo de cuentas o ventas de AWS para obtener más información sobre las unidades de modelo.
Actualmente, la personalización del modelo (ajuste preciso) no es compatible con los modelos de Stability AI en Amazon Bedrock.
-
Importación de modelos personalizados
-
Importación de modelos personalizados
-
Llama
-
Llama multimodal
-
Mistral
-
Mixtral
-
Flan
-
Llama
-
Regiones: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)
Versión de unidad modelo personalizada v1.0 Precio por unidad modelo personalizada por minuto* 0,0785 USD Costo de almacenamiento mensual por unidad de modelos personalizados 1,95 USD Las unidades de modelos personalizados necesarias para alojar un modelo dependen de una variedad de factores, en particular la arquitectura del modelo, el recuento de parámetros del modelo y la longitud del contexto. La cantidad exacta de unidades de modelos personalizados necesarias se determinará en el momento de la importación. Como referencia, el modelo Llama 3.1 8B 128K requiere 2 unidades de modelos personalizados, un modelo Llama 3.1 70B 128k requiere 8 unidades de modelos personalizados. *Facturado en intervalos de 5 minutos -
Llama multimodal
-
Regiones: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)
Versión de unidad modelo personalizada v1.0 Precio por unidad modelo personalizada por minuto* 0,0785 USD Costo de almacenamiento mensual por unidad de modelos personalizados 1,95 USD Las unidades de modelos personalizados necesarias para alojar un modelo dependen de una variedad de factores, en particular la arquitectura del modelo, el recuento de parámetros del modelo y la longitud del contexto. La cantidad exacta de unidades de modelos personalizados necesarias se determinará en el momento de la importación. Como referencia, el modelo Llama 3.2 11B 128K requiere 4 unidades de modelos personalizados. *Facturado en intervalos de 5 minutos -
Mistral
-
Regiones: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)
Versión de unidad modelo personalizada v1.0 Precio por unidad modelo personalizada por minuto* 0,0785 USD Costo de almacenamiento mensual por unidad de modelos personalizados 1,95 USD Las unidades de modelos personalizados necesarias para alojar un modelo dependen de una variedad de factores, en particular la arquitectura del modelo, el recuento de parámetros del modelo y la longitud del contexto. La cantidad exacta de unidades de modelos personalizados necesarias se determinará en el momento de la importación. Como referencia, el modelo Mistral 7B 32K requiere 1 unidad de modelo personalizado. *Facturado en intervalos de 5 minutos -
Mixtral
-
Regiones: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)
Versión de unidad modelo personalizada v1.0 Precio por unidad modelo personalizada por minuto* 0,0785 USD Costo de almacenamiento mensual por unidad de modelos personalizados 1,95 USD Las unidades de modelos personalizados necesarias para alojar un modelo dependen de una variedad de factores, en particular la arquitectura del modelo, el recuento de parámetros del modelo y la longitud del contexto. La cantidad exacta de unidades de modelos personalizados necesarias se determinará en el momento de la importación. Como referencia, el modelo Mixtral 8x7B 32K requiere 4 unidades de modelos personalizados. *Facturado en intervalos de 5 minutos -
Flan
-
Regiones: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)
Versión de unidad modelo personalizada v1.0 Precio por unidad modelo personalizada por minuto* 0,0785 USD Costo de almacenamiento mensual por unidad de modelos personalizados 1,95 USD Las unidades de modelos personalizados necesarias para alojar un modelo dependen de una variedad de factores, en particular la arquitectura del modelo, el recuento de parámetros del modelo y la longitud del contexto. La cantidad exacta de unidades de modelos personalizados necesarias se determinará en el momento de la importación. Como referencia, el modelo Flan-T5 XL 512 requiere 1 unidad de modelo personalizado. *Facturado en intervalos de 5 minutos
Precios de inferencia bajo demanda:
Se le facturará en intervalos de 5 minutos mientras la copia del modelo esté activa a partir de la primera invocación exitosa. El límite máximo de rendimiento y simultaneidad por copia de modelo depende de factores como la combinación de tokens de entrada/salida, el tipo de hardware, el tamaño del modelo, la arquitectura y las optimizaciones de inferencia, y se determina durante el flujo de trabajo de importación del modelo.Bedrock escala automáticamente el número de copias del modelo en función de sus patrones de uso. Si no hay invocaciones durante un período de 5 minutos, Bedrock reducirá la escala a cero y volverá a escalar hacia arriba cuando invoques su modelo. Al reducir la escala, es posible que experimente una duración de arranque en frío (en decenas de segundos) según el tamaño del modelo. Bedrock también aumenta la cantidad de copias del modelo si el volumen de la inferencia supera constantemente los límites de simultaneidad de una sola copia del modelo. Nota: Hay un máximo predeterminado de 3 copias del modelo por cuenta y modelo importado que se puede aumentar mediante Service Quotas.
-
Herramientas avanzadas de precios (detalles)
-
Flujos
-
Barreras de protección
-
Evaluación del modelo
-
Flujos
-
Amazon Bedrock Flows
Se le cobra en función de la cantidad de transiciones de nodo que se requieran para ejecutar su aplicación. Bedrock Flows cuenta una transición de nodo cada vez que se ejecuta un nodo en su flujo de trabajo. Se le cobra por la cantidad total de transiciones de nodo en todos sus flujos.
Todos los cargos se miden a diario y se facturan de forma mensual a partir del 1 de febrero de 2025.
Precio por cada 1000 transiciones de nodo 0,035 USD Cargos adicionales
Puede incurrir en cargos adicionales si la ejecución del flujo de trabajo de su aplicación utiliza otros servicios de AWS o transfiere datos. Por ejemplo, si su flujo de trabajo invoca una política de barrera de protección de Amazon Bedrock, se le facturará por la cantidad de unidades de texto que procese la política.
-
Barreras de protección
-
Barreras de protección de Amazon Bedrock
Política de barreras de protección*
Precio por 1000 unidades de texto**
Filtros de contenido
0,75 USD
Temas denegados
1 USD
Verificación de la base contextual***
0,1 USD
Filtro de información confidencial (PII)
0,1 USD
Filtro de información confidencial (expresión regular)
Gratis
Filtros de palabras
Gratis
Precios bajo demanda
* Cada política de barreras de protección es opcional y se puede habilitar según los requisitos de su aplicación. Se incurrirá en cargos según el tipo de política utilizada en la barrera de protección. Por ejemplo, si una barrera de protección está configurada con filtros de contenido y temas denegados, se cobrarán estas dos políticas, pero no habrá cargos asociados a los filtros de información confidencial.
** Una unidad de texto puede contener hasta 1000 caracteres. Si una entrada de texto tiene más de 1000 caracteres, se procesa como varias unidades de texto, con 1000 caracteres o menos cada una de ellas. Por ejemplo, si una entrada de texto contiene 5600 caracteres, se cobrarán 6 unidades de texto.*** La verificación de base contextual utiliza un origen de referencia y una consulta para determinar si la respuesta del modelo se basa en el origen y es relevante para la consulta. El número total de unidades de texto cobradas se calcula mediante la combinación de todos los caracteres del origen, la consulta y la respuesta del modelo.
Las barreras de protección no son compatibles con imágenes e incrustaciones.
-
Evaluación del modelo
-
Evaluación del modelo
La evaluación del modelo se cobra por la inferencia a partir del modelo que elija. Las puntuaciones algorítmicas generadas automáticamente se proporcionan sin costo adicional. En el caso de la evaluación realizada por humanos a la que lleve a su propio equipo de trabajo, se le cobrará por la inferencia del modelo en la evaluación y un cargo de 0,21 USD por tarea humana completada.
Model
Precio por cada 1000 tokens de entrada
Precio por cada 1000 tokens de salida
Precio por tarea humana
Modelo seleccionado para la evaluación
Basado en el modelo seleccionado
Basado en el modelo seleccionado
0,21 USD
Ejemplos de precios
-
AI21 Labs
Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Jurrasic-2 Mid de AI21 para resumir una entrada de 10 000 tokens de texto de entrada en una salida de 2000 tokens.
Costo total incurrido = 10 000 tokens/1000 * 0,0125 USD + 2000 tokens/1000 * 0,0125 USD = 0,15 USD
-
Amazon
Precios bajo demanda
Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock cada una hora: una solicitud al modelo Amazon Titan Text Lite para resumir una entrada de 2000 tokens de texto de entrada en una salida de 1000 tokens.
Costo total por hora = 2000 tokens/1000 * 0,0003 USD + 1000 tokens/1000 * 0,0004 USD = 0,001 USD
Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo base Amazon Titan Image Generator para generar 1000 imágenes de 1024 x 1024 de tamaño y de calidad estándar.
Costo total incurrido = 1000 imágenes * 0,01 USD por imagen = 10 USD
Precios de la personalización (ajuste preciso y entrenamiento previo continuo)
Un desarrollador de aplicaciones personaliza un modelo de Amazon Titan Image Generator con 1000 pares de imagen y texto. Tras el entrenamiento, el desarrollador utiliza el rendimiento aprovisionado por un modelo personalizado durante 1 hora para evaluar el rendimiento del modelo. El modelo con ajuste preciso se almacena durante 1 mes. Tras la evaluación, el desarrollador utiliza el rendimiento aprovisionado (plazo de compromiso de 1 mes) para alojar el modelo personalizado.
Costo mensual incurrido para realizar el ajuste preciso = entrenamiento del ajuste preciso (0,005 USD * 500 * 64), donde 0,005 USD es el precio por imagen vista, 500 es el número de pasos y 64 es el tamaño del lote + almacenamiento mensual de los modelos personalizados (1,95 USD) + 1 hora de inferencia de modelos personalizados (21 USD) = 160 USD + 1,95 USD + 21 = 182,95 USD
Precios del rendimiento aprovisionado
Un desarrollador de aplicaciones compra dos unidades de modelo de Amazon Titan Text Express con un compromiso de 1 mes para su caso de uso de resúmenes de texto.
Costo total mensual incurrido = 2 unidades de modelo * 18,40 USD/hora * 24 horas* 31 días = 27 379,20 USD
Un desarrollador de aplicaciones compra una unidad de modelo del modelo básico de Amazon Titan Image Generator con un compromiso de 1 mes.
Costo total incurrido = 1 unidad de modelo * 16,20 USD * 24 horas * 31 días = 12 052,80 USD
-
Anthropic
Precios bajo demanda
Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock, en la región Oeste de EE. UU. (Oregón): una solicitud al modelo Claude de Anthropic para resumir una entrada de 11 000 tokens de texto de entrada en una salida de 4000 tokens.
Costo total incurrido =11 000 tokens/1000 * 0,008 USD + 4000 tokens/1000 * 0,024 USD = 0,088 USD + 0,096 USD = 0,184 USD
Precios del rendimiento aprovisionado
Un desarrollador de aplicaciones compra una unidad de modelo de Anthropic Claude Instant en la región Oeste de EE. UU. (Oregón):
Costo total mensual incurrido = 1 unidad de modelo * 39,60 USD * 24 horas * 31 días = 29 462,40 USD
-
Cohere
Precios bajo demanda
Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Command de Cohere para resumir una entrada de 6000 tokens de texto de entrada en una salida de 2000 tokens.
Costo total incurrido = 6000 tokens/1000 * 0,0015 USD + 2000 tokens/1000 * 0,0020 USD = 0,013 USD
Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Command Light de Cohere para resumir una entrada de 6000 tokens de texto de entrada en una salida de 2000 tokens.
Costo total incurrido = 6000 tokens/1000 * 0,0003 USD + 2000 tokens/1000 * 0,0006 USD = 0,003 USD
Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Embed (inglés) o al modelo Embed (multilingüe) de Cohere para generar incrustaciones para 10 000 tokens de entrada.
Costo total incurrido = 10 000 tokens/1000 * 0,0001 USD = 0,001 USD
Precios de la personalización (ajuste preciso)
Un desarrollador de aplicaciones personaliza un modelo Command de Cohere con 1000 tokens de datos. Tras el entrenamiento, utiliza el rendimiento aprovisionado por un modelo personalizado durante 1 hora para evaluar el rendimiento del modelo. El modelo con ajuste preciso se almacena durante 1 mes. Tras la evaluación, el desarrollador utiliza el rendimiento aprovisionado (compromiso de 1 mes) para alojar el modelo personalizado.
Costo mensual incurrido para realizar el ajuste preciso = entrenamiento del ajuste preciso (0,004 USD * 1000) + almacenamiento mensual de los modelos personalizados (1,95 USD) + 1 hora de inferencia de modelos personalizados (49,50 USD) = 55,45 USD
El costo mensual incurrido por el rendimiento aprovisionado (plazo de compromiso de 1 mes) del modelo personalizado es de 39,60 USD
Precios del rendimiento aprovisionado
Un desarrollador de aplicaciones compra una unidad modelo Command de Cohere con un compromiso de 1 mes para su caso de uso de resumen de texto.
Costo total mensual incurrido = 1 unidad de modelo * 39,60 USD * 24 horas * 31 días = 29 462,40 USD
-
Meta Llama
Precios bajo demanda
Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Llama 2 Chat (13B) de Meta para resumir una entrada de 2000 tokens de texto de entrada en una salida de 500 tokens.
Costo total incurrido = 2000 tokens/1000 * 0,00075 USD + 500 tokens/1000 * 0,001 USD = 0,002 USD
Precios de la personalización (ajuste preciso)
Un desarrollador de aplicaciones personaliza el modelo Llama 2 Pretrained (70B) con 1000 tokens de datos. Tras el entrenamiento, utiliza el rendimiento aprovisionado por un modelo personalizado durante 1 hora para evaluar el rendimiento del modelo. El modelo con ajuste preciso se almacena durante 1 mes. Tras la evaluación, el desarrollador utiliza el rendimiento aprovisionado (compromiso de 1 mes) para alojar el modelo personalizado.
Costo mensual incurrido para realizar el ajuste preciso = entrenamiento del ajuste preciso (0,00799 USD * 1000) + almacenamiento mensual de los modelos personalizados (1,95 USD) + 1 hora de inferencia de modelos personalizados (23,50 USD) = 33,44 USD
El costo mensual incurrido por el rendimiento aprovisionado (plazo de compromiso de 1 mes) del modelo personalizado es de 21,18 USD
Precios del rendimiento aprovisionado
Un desarrollador de aplicaciones compra una unidad de modelo Llama 2 de Meta con un compromiso de 1 mes para su caso de uso de resúmenes de texto.
Costo total mensual incurrido = 1 unidad de modelo * 21,18 USD * 24 horas * 31 días = 15 757,92 USD
-
Mistral AI
Precios bajo demanda
Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock cada una hora: una solicitud al modelo Mistral 7B para resumir una entrada de 2000 tokens de texto de entrada en una salida de 1000 tokens.
Costo total por hora = 2000 tokens/1000 * 0,00015 USD + 1000 tokens/1000 * 0,0002 USD = 0,0005 USD
Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock cada una hora: una solicitud al modelo Mixtral 8x7B para resumir una entrada de 2000 tokens de texto de entrada en una salida de 1000 tokens.
Costo total por hora = 2000 tokens/1000 * 0,00045 USD + 1000 tokens/1000 * 0,0007 USD = 0,0016 USD
Un desarrollador de aplicaciones hace las siguientes llamadas a la API a Amazon Bedrock cada hora: una solicitud al modelo Mistral Large para resumir una entrada de 2000 tokens de texto de entrada en una salida de 1000 tokens.
Costo total por hora = 2000 tokens/1000 * 0,008 USD + 1000 tokens/1000 * 0,024 USD = 0,04 USD
-
Stability AI
Precios bajo demanda
Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo SDXL para generar una imagen de 512 x 512 con un tamaño de paso de 70 (calidad premium).
Costo total incurrido = 1 imagen * 0,036 USD por imagen = 0,036 USD
Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo SDXL 1.0 para generar una imagen de 1024 x 1024 con un tamaño de paso de 70 (calidad premium).
Costo total incurrido = 1 imagen * 0,08 USD por imagen = 0,08 USD
Precios del rendimiento aprovisionado
Un desarrollador de aplicaciones compra una unidad de modelo de SDXL 1.0 con un compromiso de 1 mes.
Costo total incurrido = 1 * 49,86 USD * 24 horas * 31 días = 37 095,84 USD
-
Evaluación de modelos
Ejemplo 1 de evaluación del modelo:
Precios bajo demanda
Un desarrollador de aplicaciones envía un conjunto de datos para la evaluación de modelos realizada por humanos mediante Anthropic Claude 2.1 y Anthropic Claude Instant en la región de AWS Este de EE. UU. (Norte de Virginia).El conjunto de datos contiene 50 solicitudes y el desarrollador requiere que un trabajador califique cada conjunto de solicitudes y respuestas (se puede configurar en la creación del trabajo de evaluación como parámetro “trabajadores por solicitud”).
Habrá 50 tareas en este trabajo de evaluación (un conjunto de tareas por cada par de solicitud y respuesta por trabajador). Las 50 solicitudes se combinan en 5000 tokens de entrada, y las respuestas asociadas se combinan en 15 000 tokens para Anthropic Claude Instant y 20 000 tokens para Anthropic Claude 2.1.
Se incurre en los siguientes cargos por este trabajo de evaluación del modelo:Elemento Número de tokens de entrada Precio por cada 1000 tokens de entrada Costo de entrada Número de tokens de salida Precio por cada 1000 tokens de salida Costo de salida Número de tareas humanas Precio por tarea humana Costo de las tareas humanas Total Inferencia de Claude Instant 5000 0,0008 USD 0,004 USD 15 000 0,0024 USD 0,036 USD 0,04 USD Inferencia de Claude 2.1 5000 0,008 USD 0,04 USD 20 000 0,024 USD 0,48 USD 0,52 USD Tareas humanas 50 0,21 USD 10,50 USD 10,50 USD Total 11,06 USD Ejemplo 2 de evaluación del modelo:
Precios bajo demanda
Un desarrollador de aplicaciones envía un conjunto de datos para la evaluación de modelos realizada por humanos mediante Anthropic Claude 2.1 y Anthropic Claude Instant en la región de AWS Este de EE. UU. (Norte de Virginia).
El conjunto de datos contiene 50 solicitudes y el desarrollador requiere que dos trabajadores califiquen cada conjunto de solicitudes y respuestas (se puede configurar en la creación del trabajo de evaluación como parámetro “trabajadores por solicitud”). Este trabajo de evaluación constará de 100 tareas (1 por cada conjunto de solicitud y respuesta por cada trabajador: 2 trabajadores x 50 conjuntos de solicitud y respuesta = 100 tareas humanas).
Las 50 solicitudes se combinan en 5000 tokens de entrada, y las respuestas asociadas se combinan en 15 000 tokens para Anthropic Claude Instant y 20 000 tokens para Anthropic Claude 2.1.
Se incurre en los siguientes cargos por este trabajo de evaluación del modelo:
Elemento Número de tokens de entrada Precio por cada 1000 tokens de entrada Costo de entrada Número de tokens de salida Precio por cada 1000 tokens de salida Costo de salida Número de tareas humanas Precio por tarea humana Costo de las tareas humanas Total Inferencia de Claude Instant 5000 0,0008 USD 0,0040 USD 15 000 0,0024 USD 0,036 USD 0,04 USD Inferencia de Claude 2.1 5000 0,008 USD 0,0400 USD 20 000 0,024 USD 0,48 USD 0,52 USD Tareas humanas 100 0,21 USD 21,00 USD 21,00 USD Total 21,56 USD -
Barreras de protección de Amazon Bedrock
Ejemplo 1: chatbot de atención al cliente
Un desarrollador de aplicaciones crea un chatbot de atención al cliente y usa filtros de contenido para bloquear el contenido dañino y los temas denegados para filtrar las consultas y respuestas no deseadas.
El chatbot atiende 1000 consultas de usuarios por hora. Cada consulta de usuario tiene una longitud de entrada promedio de 200 caracteres y recibe una respuesta del FM de 1500 caracteres.
Cada consulta de usuario de 200 caracteres corresponde a 1 unidad de texto.
Cada respuesta del FM de 1500 caracteres corresponde a 2 unidades de texto.
Unidades de texto procesadas cada hora = (1 + 2) * 1000 consultas = 3000 unidades de texto
Costo total incurrido por hora por los filtros de contenido y el tema denegado = 3000 * (0,75 USD + 1,00 USD) / 1000 = 5,25 USDEjemplo 2: resumen de la transcripción del centro de llamadas
Un desarrollador de aplicaciones crea una aplicación para resumir las transcripciones de los chats entre los usuarios y los agentes de soporte. Utiliza un filtro de información confidencial para eliminar la información de identificación personal (PII) en los resúmenes generados para 10 000 conversaciones.
Cada resumen generado tiene un promedio de 3500 caracteres que corresponden a 4 unidades de texto.
Costo total incurrido para resumir 10 000 conversaciones = 10 000 * 4 * (0,1/1000 USD) = 4 USDElemento Número de tokens de entrada Precio por cada 1000 tokens de entrada Costo de entrada Número de tokens de salida Precio por cada 1000 tokens de salida Costo de salida Número de tareas humanas Precio por tarea humana Costo de las tareas humanas Total Inferencia de Claude Instant 5000 0,0008 USD 0,004 USD 15 000 0,0024 USD 0,036 USD 0,04 USD Inferencia de Claude 2.1 5000 0,008 USD 0,04 USD 20 000 0,024 USD 0,48 USD 0,52 USD Tareas humanas 100 0,21 USD 21,00 USD 21,00 USD Total 21,56 USD -
Importación de modelos personalizados
Ejemplo de precios: Un desarrollador de aplicaciones importa un modelo personalizado tipo Llama 3.1 con un tamaño de parámetro de 8B y una longitud de secuencia de 128 000 en la región us-east-1, y lo elimina después de un mes. Esto requiere 2 unidades de modelos personalizados. Por lo tanto, el precio por minuto será de 0,1570 USD porque se requieren 2 unidades de modelos personalizados. Los costos de almacenamiento del modelo para 2 unidades de modelos personalizados serían de 3,90 USD al mes.
La importación del modelo es gratuita. La primera invocación exitosa es a las 8:03 a. m., momento en el que comienza la medición. Los intervalos de medición de 5 minutos son de 8:03 a. m. a 8:07 a. m.; de 8:07 a. m. a 8:11 a. m., y así sucesivamente. Si hay al menos una invocación durante un período de 5 minutos, el intervalo se considerará activa para la facturación. Si no hay ninguna invocación entre las 8:07 a. m. y las 8:11 a. m., la medición se detendrá a las 8:11 a. m. En este caso, la factura se calcularía de la siguiente manera: 0,1570 USD * 5 minutos * 3 intervalos de cinco minutos = 2,355 USD.
-
Flujos
Ejemplo: resumen de noticias
Un desarrollador de aplicaciones crea un flujo para automatizar el resumen de noticias para los comerciantes. El flujo cuenta con un nodo de entrada que incluye una matriz de 10 ubicaciones de S3 para artículos de 10 agencias de noticias importantes (1 transición de nodo). Luego, utiliza un nodo iterador para recorrer las 10 ubicaciones, recuperar el archivo de cada ubicación de S3 mediante el nodo de recuperación de S3 e invocar un modelo con un nodo de petición a fin de resumir cada archivo (+ 10 archivos x 3 transiciones de nodo). A continuación, recopila todos los resultados mediante un nodo recopilador, escribe los resultados en S3 mediante el nodo de almacenamiento de S3 y los completa en un nodo de salida (+ 3 transiciones de nodo). El desarrollador ejecuta este flujo cada media hora de cada día de la semana.
La cantidad de transiciones de nodo por ejecución de flujo es: 1 + 10*3 + 3 = 34 transiciones de nodo/ejecución de flujo
La cantidad de ejecuciones de flujo por mes es: 24 horas *2* 5 días * 4 semanas = 960 ejecuciones de flujo/mes.
La factura mensual total es: 34 * 960 * 0,035 USD/1000 = 1,14 USDCargos adicionales
La factura también incluirá cargos adicionales por los servicios de AWS que se utilicen en la ejecución del flujo de trabajo, incluidos los usos de Amazon S3 en los nodos de recuperación y almacenamiento, y el uso del modelo fundacional de Amazon Bedrock en el nodo de petición.