Precios de Amazon SageMaker
Información general sobre precios
Amazon SageMaker ayuda a los científicos de datos y a los desarrolladores a preparar, crear, formar e implementar con rapidez modelos de machine learning (ML) de alta calidad al poner a disposición un amplio conjunto de capacidades especialmente creadas para ML. SageMaker admite los principales marcos, kits de herramientas y lenguajes de programación de ML.
Con SageMaker, solo paga por lo que utiliza. Tiene dos opciones para pagar: los precios bajo demanda que no ofrecen tarifas mínimas ni compromisos iniciales y SageMaker Savings Plans, que ofrece un modelo de precios flexible, basado en el uso, a cambio de comprometerse a una cantidad constante de uso.
Nivel gratuito de Amazon SageMaker
Probar Amazon SageMaker Studio es gratis. Como parte del nivel gratuito de AWS, puede comenzar a utilizar Amazon SageMaker de forma gratuita. La capa gratuita comienza el primer mes, al crear el primer recurso de SageMaker. Encuentre información detallada sobre el nivel gratuito de Amazon SageMaker en la tabla que aparece a continuación.
Capacidad de Amazon SageMaker | Uso del nivel gratuito al mes durante los primeros dos meses |
Cuadernos de Studio e instancias de cuaderno | 250 horas de la instancia ml.t3.medium en los cuadernos de Studio o 250 horas de la instancia ml.t2.medium o la instancia ml.t3.medium en instancias de cuaderno |
RStudio en SageMaker | 250 horas de la instancia ml.t3.medium en la aplicación RSession y la instancia ml.t3.medium gratuita para la aplicación RStudioServerPro |
Data Wrangler | 25 horas de la instancia ml.m5.4xlarge |
Almacén de características | 10 millones de unidades de escritura, 10 millones de unidades de lectura, 25 GB de almacenamiento (tienda en línea estándar) |
Formación | 50 horas de instancias m4.xlarge o m5.xlarge |
Amazon SageMaker con TensorBoard | 300 horas de instancias ml.r5.large |
Inferencia en tiempo real | 125 horas de las instancias m4.xlarge o m5.xlarge |
Inferencia sin servidor | 150 000 segundos de duración de inferencia bajo demanda |
Canvas | 160 horas al mes por sesión |
HyperPod | 50 horas de instancia m5.xlarge |
Precios de la modalidad bajo demanda
-
Studio Classic
-
JupyterLab
-
Editor de código
-
RStudio
-
Instancias de cuaderno
-
Procesamiento
-
TensorBoard
-
Data Wrangler
-
Almacén de características
-
Formación
-
MLflow
-
Inferencia en tiempo real
-
Inferencia asíncrona
-
Transformación por lotes
-
Inferencia sin servidor
-
JumpStart
-
Generador de perfiles
-
HyperPod
-
Optimización de inferencias
-
Studio Classic
-
Amazon SageMaker Studio Classic
Studio Classic ofrece cuadernos de Jupyter de un solo paso en nuestra experiencia de IDE heredada. Los recursos de computación subyacentes son completamente elásticos y los blocs de notas se pueden compartir fácilmente con otros, lo que permite que haya una colaboración fluida. Se cobra en función del tipo de instancia que elija, con base en la duración del uso. -
JupyterLab
-
Amazon SageMaker JupyterLab
Inicie JupyterLab totalmente gestionado en cuestión de segundos. Utilice el entorno de desarrollo interactivo basado en la web más reciente para cuadernos, código y datos. Se cobra en función del tipo de instancia que elija, con base en la duración del uso. -
Editor de código
-
Editor de código de Amazon SageMaker
El editor de código, basado en Code-OSS (Visual Studio Code – Open Source), le permite escribir, probar, depurar y ejecutar su código de análisis y machine learning. Está totalmente integrado con SageMaker Studio y es compatible con las extensiones para IDE disponibles en el registro de extensiones Open VSX. -
RStudio
-
RStudio
RStudio ofrece recursos de computación en la nube bajo demanda para acelerar el desarrollo del modelo y mejorar la productividad. Se le cobrará por los tipos de instancias que elija para ejecutar la aplicación RStudio Session y la aplicación RStudio Server Pro.
Aplicación RStudioServerPro
-
Instancias de cuaderno
-
Instancia de cuaderno
Las instancias de cuaderno son instancias de computación que ejecutan la aplicación de cuaderno de Jupyter. Se cobra en función del tipo de instancia que elija, con base en la duración del uso.
-
Procesamiento
-
Procesamiento de Amazon SageMaker
El procesamiento mediante Amazon SageMaker permite ejecutar fácilmente las cargas de trabajo previas al procesamiento, posteriores al procesamiento y de evaluación del modelo en una infraestructura completamente administrada. Se cobra en función del tipo de instancia que elija, con base en la duración del uso.
-
TensorBoard
-
Amazon SageMaker con TensorBoard
Amazon SageMaker con TensorBoard proporciona una experiencia TensorBoard alojada para visualizar y depurar problemas de convergencia de modelos para trabajos de capacitación de Amazon SageMaker.
-
Data Wrangler
-
Amazon SageMaker Data Wrangler
Amazon SageMaker Data Wrangler reduce el tiempo que tarda agregar y preparar los datos para el aprendizaje automático de semanas a minutos. Paga por el tiempo que utiliza para limpiar, explorar y visualizar datos. Los clientes que ejecuten instancias de SageMaker Data Wrangler están sujetos a los precios que se indican a continuación.* Los clientes que ejecuten SageMaker Data Wrangler en instancias de espacio de trabajo de SageMaker Canvas están sujetos a los precios de SageMaker Canvas. Consulte la página de precios de SageMaker Canvas para obtener más información.
Trabajos de Amazon SageMaker Data Wrangler
Un trabajo de Amazon SageMaker Data Wrangler se crea al exportar un flujo de datos de SageMaker Data Wrangler. Con los trabajos de SageMaker Data Wrangler, puede automatizar los flujos de trabajo de preparación de datos. Los trabajos de SageMaker Data Wrangler ayudan a volver a aplicar los flujos de trabajos de preparación de datos en nuevos conjuntos de datos para ahorrar tiempo. Los trabajos se facturan por segundo.
-
Almacén de características
-
Almacén de características de Amazon SageMaker
El almacén de características de Amazon SageMaker es un repositorio central para incorporar, almacenar y proporcionar características para el machine learning. Se le cobrará por las escrituras, las lecturas y el almacenamiento de datos del grupo de características en el Almacén de características de SageMaker, con precios diferentes para el almacenamiento en línea estándar y el almacenamiento en línea en memoria.Para el almacenamiento en línea estándar, el almacenamiento de datos se cobra por GB al mes. En cuanto al rendimiento, puede elegir entre el modo de capacidad aprovisionada o bajo demanda. Para el modo bajo demanda, las escrituras se cobran como unidades de solicitud de escritura por KB y las lecturas se cobran como unidades de solicitud de lectura por 4 KB. Para el modo de capacidad aprovisionada, especifica la capacidad de lectura y escritura que espera que requiera su aplicación. El Almacén de características de Sagemaker cobra una WCU por cada escritura por segundo (hasta 1 KB) y una RCU por cada lectura por segundo (hasta 4 KB). Se le cobrará la capacidad de rendimiento (lecturas y escrituras) que aprovisione en su grupo de características, incluso en los casos donde no utilice toda la capacidad aprovisionada.
Para el almacenamiento en línea en memoria, las escrituras se cobran como unidades de solicitud de escritura por KB con un mínimo de 1 unidad por escritura, las lecturas se cobran como unidades de solicitud de lectura por KB con un mínimo de 1 unidad por lectura, y el almacenamiento de datos se cobra por GB por hora. Hay un cargo mínimo de almacenamiento de datos de 5 GiB (5,37 GB) por hora para la tienda en línea integrada en memoria.
-
Formación
-
Entrenamiento mediante Amazon SageMaker
Amazon SageMaker facilita el entrenamiento de modelos de aprendizaje automático (ML), ya que proporciona todo lo que se necesita para entrenar, ajustar y depurar modelos. Se cobra por el uso del tipo de instancia que elija. Al utilizar Amazon SageMaker Debugger para depurar problemas y monitorear recursos durante el entrenamiento, puede usar reglas integradas para depurar los trabajos de entrenamiento, o bien puede escribir sus propias personalizadas. No se aplican cargos al uso de reglas integradas para depurar los trabajos de entrenamiento. Con respecto a las reglas personalizadas, se cobra en función del tipo de instancia que elija, con base en la duración del uso.
-
MLflow
-
Amazon SageMaker con MLflow
Amazon SageMaker con MLflow permite a los clientes pagar solo por lo que utilizan. Los clientes pagan por los servidores de seguimiento de MLflow en función de los costes de procesamiento y almacenamiento.
Los clientes pagan por el procesamiento en función del tamaño del servidor de seguimiento y la cantidad de horas de funcionamiento. Además, los clientes pagan por los metadatos almacenados en el servidor de seguimiento de MLflow.
-
Inferencia en tiempo real
-
Alojamiento de Amazon SageMaker: inferencia en tiempo real
Amazon SageMaker proporciona inferencia en tiempo real para sus casos de uso que necesitan predicciones en tiempo real. Se cobra por el uso del tipo de instancia que elija. Al utilizar Amazon SageMaker Model Monitor para mantener modelos con un alto nivel de precisión que proporcionan inferencia en tiempo real, puede utilizar reglas integradas para monitorear los modelos, o bien puede escribir sus propias reglas personalizadas. Para las reglas integradas, obtiene hasta 30 horas de monitoreo sin cargos. Se aplican cargos adicionales con base en la duración del uso. Se cobra por separado si utiliza sus propias reglas personalizadas.
-
Inferencia asíncrona
-
Inferencia asíncrona de Amazon SageMaker:
El servicio de inferencia asíncrona de Amazon SageMaker es una opción de inferencia casi en tiempo real que pone en cola las solicitudes entrantes y las procesa de forma asíncrona. Utilice esta opción cuando necesite procesar grandes cargas útiles a medida que llegan los datos o ejecutar modelos que tienen largos tiempos de procesamiento de inferencia y no tienen requisitos de latencia de menos de un segundo. Se le cobra por el tipo de instancia que elija. -
Transformación por lotes
-
Transformación por lotes de Amazon SageMaker
Al utilizar la transformación por lotes de Amazon SageMaker, no es necesario desglosar el conjunto de datos en varios fragmentos ni administrar puntos de enlace en tiempo real. La transformación por lotes de SageMaker permite ejecutar predicciones en conjuntos de datos de lotes grandes o pequeños. Se cobra en función del tipo de instancia que elija, con base en la duración del uso.
-
Inferencia sin servidor
-
Amazon SageMaker Serverless Inference
La inferencia sin servidor de Amazon SageMaker permite desplegar modelos de machine learning para inferencias sin configurar o administrar las infraestructuras subyacentes. Puede utilizar la inferencia sin servidor bajo demanda o agregar la simultaneidad aprovisionada a su punto de conexión para obtener un rendimiento predecible.Con la inferencia sin servidor bajo demanda, solo paga por la capacidad de cálculo utilizada para procesar las solicitudes de inferencia, facturada por milisegundos y por la cantidad de datos procesados. El cargo de computación depende de la configuración de la memoria que elija.
Simultaneidad aprovisionadaSi lo desea, también puede habilitar la simultaneidad aprovisionada para sus puntos de conexión sin servidor. La simultaneidad aprovisionada permite implementar modelos en puntos de conexión sin servidor con un rendimiento predecible y una alta escalabilidad, ya que mantiene los puntos de conexión activos para un número específico de solicitudes simultáneas y un tiempo específico. Al igual que ocurre con la inferencia sin servidor bajo demanda, cuando la simultaneidad aprovisionada está habilitada, paga por la capacidad de cálculo utilizada para procesar las solicitudes de inferencia, facturada por milisegundos y por la cantidad de datos procesados. También paga por el uso de la simultaneidad aprovisionada, en función de la memoria configurada, la duración aprovisionada y la cantidad de simultaneidad habilitada.
-
JumpStart
-
Amazon SageMaker JumpStart
Amazon SageMaker JumpStart le ayuda a iniciarse en el machine learning de forma rápida y sencilla con acceso a colecciones de modelos populares (también conocidas como “zoos de modelos”) con un solo clic. Jumpstart también ofrece soluciones integrales que resuelven casos de uso comunes de ML que se pueden personalizar en función de sus necesidades. El uso de modelos o soluciones JumpStart no conlleva ningún costo adicional. Se le cobrará por las horas subyacentes de las instancias de formación e inferencia utilizadas igual que si las hubiera creado manualmente.
-
Generador de perfiles
-
Generador de perfiles de Amazon SageMaker recopila datos del sistema para la visualización de gráficos de rastros de CPU y GPU de alta resolución. Esta herramienta está diseñada para ayudar a los científicos e ingenieros de datos a identificar los cuellos de botella en el rendimiento relacionados con el hardware en sus modelos de aprendizaje profundo, lo que ahorra tiempo y costos en el entrenamiento integral. Actualmente, Generador de perfiles de Amazon SageMaker solo admite la creación de perfiles de trabajos de entrenamiento utilizando los tipos de instancias de computación de entrenamiento ml.g4dn.12xlarge, ml.p3dn.24xlarge y ml.p4d.24xlarge.
Regiones: Este de EE. UU. (Ohio), Este de EE. UU. (Norte de Virginia), Oeste de EE. UU. (Oregón), Europa (Fráncfort), Europa (Irlanda) e Israel (Tel Aviv).Generador de perfiles de Amazon SageMaker se encuentra actualmente en versión preliminar y está disponible sin costo alguno para los clientes de las regiones compatibles.
-
HyperPod
-
Amazon SageMaker HyperPod
Amazon SageMaker HyperPod está diseñado específicamente para acelerar el desarrollo de modelos fundacionales (FM). Para que el entrenamiento de FM sea más resistente, HyperPod supervisa continuamente el estado del clúster, repara y reemplaza los nodos defectuosos sobre la marcha y guarda los puntos de control frecuentes para reanudar de manera automática el entrenamiento sin perder el progreso. SageMaker HyperPod viene preconfigurado con bibliotecas de entrenamiento distribuidas de SageMaker que le permiten mejorar el rendimiento del entrenamiento de FM y, al mismo tiempo, utilizar al máximo la infraestructura de computación y de red del clústerNota: Los precios de SageMaker HyperPod no cubren los cargos por los servicios conectados a clústeres de HyperPod, como Amazon EKS, Amazon FSx para Lustre y Amazon Simple Storage Service (Amazon S3).
-
Optimización de inferencias
-
El kit de herramientas de optimización de inferencias facilita la implementación de las técnicas de optimización de inferencias más recientes para lograr un rendimiento de costos de última generación (SOTA) en Amazon SageMaker y, al mismo tiempo, ahorrar meses de tiempo para los desarrolladores. Puede elegir entre un menú de técnicas de optimización populares que ofrece SageMaker y ejecutar los trabajos de optimización con antelación, comparar el modelo para determinar las métricas de rendimiento y precisión y, a continuación, implementar el modelo optimizado en un punto de conexión de SageMaker para llevar a cabo inferencias.
Detalles de la instancia
Detalles del producto de la instancia P5 de Amazon SageMaker
Tamaño de la instancia | vCPU | Memoria de la instancia (TiB) | Modelo de GPU | GPU | Memoria total de la GPU (GB) | Memoria por GPU (GB) | Ancho de banda de la red (Gbps) | GPUDirect RDMA | GPU de pares | Almacenamiento de la instancia (TB) | Ancho de banda de EBS (Gbps) |
ml.p5.48xlarge | 192 | 2 | NVIDIA H100 | 8 | 640 HBM3 | 80 | 3200 EFAv2 | Sí | 900 GB/s NVSwitch | 8 x 3,84 NVMe SSD | 80 |
Detalles del producto de la instancia Amazon SageMaker P4d
Tamaño de la instancia | vCPU | Memoria de la instancia (GiB) | Modelo de GPU | GPU | Memoria total de la GPU (GB) | Memoria por GPU (GB) | Ancho de banda de la red (Gbps) | GPUDirect RDMA | GPU de pares | Almacenamiento de instancia (GB) | Ancho de banda de EBS (Gbps) |
ml.p4d.24xlarge | 96 | 1152 | NVIDIA A100 | 8 | 320 HBM 2 | 40 | 400 ENA y EFA | Sí | 600 GB/s NVSwitch | 8 x 1000 NVMe SSD | 19 |
ml.p4de.24xlarge | 96 | 1152 | NVIDIA A100 | 8 | 640 HNM2e | 80 | 400 ENA y EFA | Sí | 600 GB/s NVSwitch | 8 X 1000 NVMe SSD | 19 |
Detalles del producto de la instancia P3 de Amazon SageMaker
Tamaño de la instancia | vCPU | Memoria de la instancia (GiB) | Modelo de GPU | GPU | Memoria total de la GPU (GB) | Memoria por GPU (GB) | Ancho de banda de la red (Gbps) | GPU de pares | Almacenamiento de instancia (GB) | Ancho de banda de EBS (Gbps) |
ml.p3.2xlarge | 8 | 61 | NVIDIA V100 | 1 | 16 | 16 | Hasta 10 | N/D | Solo EBS | 1,5 |
ml.p3.8xlarge | 32 | 244 | NVIDIA V100 | 4 | 64 | 16 | 10 | NVLink | Solo EBS | 7 |
ml.p3.16xlarge | 64 | 488 | NVIDIA V100 | 8 | 128 | 16 | 25 | NVLink | Solo EBS | 14 |
ml.p3dn.24xlarge | 96 | 768 | NVIDIA V100 | 8 | 256 | 32 | 100 | NVLink | 2 x 900 NVMeSSD | 19 |
Detalles del producto de la instancia P2 de Amazon SageMaker
Tamaño de la instancia | vCPU | Memoria de la instancia (GiB) | Modelo de GPU | GPU | Memoria total de la GPU (GB) | Memoria por GPU (GB) | Ancho de banda de la red (Gbps) | Ancho de banda de EBS (Gbps) |
ml.p2.xlarge | 4 | 61 | NVIDIA K80 | 1 | 12 | 12 | Hasta 10 | Alta |
ml.p2.8xlarge | 32 | 488 | NVIDIA K80 | 8 | 96 | 12 | 10 | 10 |
ml.p2.16xlarge | 64 | 732 | NVIDIA K80 | 16 | 192 | 12 | 25 | 20 |
Detalles del producto de la instancia G4 de Amazon SageMaker
Tamaño de la instancia | vCPU | Memoria de la instancia (GiB) | Modelo de GPU | GPU | Memoria total de la GPU (GB) | Memoria por GPU (GB) | Ancho de banda de la red (Gbps) | Almacenamiento de instancia (GB) | Ancho de banda de EBS (Gbps) |
ml.g4dn.xlarge | 4 | 16 | NVIDIA T4 | 1 | 16 | 16 | Hasta 25 | 1 x 125 SSD NVMe | Hasta 3,5 |
ml.g4dn.2xlarge | 8 | 32 | NVIDIA T4 | 1 | 16 | 16 | Hasta 25 | 1 x 125 SSD NVMe | Hasta 3,5 |
ml.g4dn.4xlarge | 16 | 64 | NVIDIA T4 | 1 | 16 | 16 | Hasta 25 | 1 x 125 SSD NVMe | 4,75 |
ml.g4dn.8xlarge | 32 | 128 | NVIDIA T4 | 1 | 16 | 16 | 50 | 1 x 900 SSD NVMe | 9,5 |
ml.g4dn.16xlarge | 64 | 256 | NVIDIA T4 | 1 | 16 | 16 | 50 | 1 x 900 SSD NVMe | 9,5 |
ml.g4dn.12xlarge | 48 | 192 | NVIDIA T4 | 4 | 64 | 16 | 50 | 1 x 900 SSD NVMe | 9,5 |
Detalles del producto de la instancia G5 de Amazon SageMaker
Tamaño de la instancia | vCPU | Memoria de la instancia (GiB) | Modelo de GPU | GPU | Memoria total de la GPU (GB) | Memoria por GPU (GB) | Ancho de banda de la red (Gbps) | Ancho de banda de EBS (Gbps) | Almacenamiento de instancia (GB) |
ml.g5n.xlarge | 4 | 16 | NVIDIA A10G | 1 | 24 | 24 | Hasta 10 | Hasta 3,5 | 1 x 250 |
ml.g5.2xlarge | 8 | 32 | NVIDIA A10G | 1 | 24 | 24 | Hasta 10 | Hasta 3,5 | 1 x 450 |
ml.g5.4xlarge | 16 | 64 | NVIDIA A10G | 1 | 24 | 24 | Hasta 25 | 8 | 1 x 600 |
ml.g5.8xlarge | 32 | 128 | NVIDIA A10G | 1 | 24 | 24 | 25 | 16 | 1 x 900 |
ml.g5.16xlarge | 64 | 256 | NVIDIA A10G | 1 | 24 | 24 | 25 | 16 | 1 x 1900 |
ml.g5.12xlarge | 48 | 192 | NVIDIA A10G | 4 | 96 | 24 | 40 | 16 | 1 x 3800 |
ml.g5.24xlarge | 96 | 384 | NVIDIA A10G | 4 | 96 | 24 | 50 | 19 | 1 x 3800 |
ml.g5.48xlarge | 192 | 768 | NVIDIA A10G | 8 | 192 | 24 | 100 | 19 | 2 x 3800 |
Detalles del producto de la instancia Trn1 de Amazon SageMaker
Tamaño de la instancia | vCPU | Memoria (GiB) | Aceleradores Trainium | Memoria de acelerador total (GB) | Memoria por acelerador (GB) | Almacenamiento de instancia (GB) | Ancho de banda de red (Gbps) | Ancho de banda de EBS (Gbps) |
ml.trn1.2xlarge | 8 | 32 | 1 | 32 | 32 | 1 x 500 SSD NVMe | Hasta 12,5 | Hasta 20 |
ml.trn1.32xlarge | 128 | 512 | 16 | 512 | 32 | 4 x 2000 SSD NVMe | 800 | 80 |
Detalles del producto de la instancia Inf1 de Amazon SageMaker
Tamaño de la instancia | vCPU | Memoria (GiB) | Aceleradores de Inferentia | Memoria de acelerador total (GB) | Memoria por acelerador (GB) | Almacenamiento de la instancia | Interconexión entre aceleradores | Ancho de banda de la red (Gbps) | Ancho de banda de EBS (Gbps) |
ml.inf1.xlarge | 4 | 8 | 1 | 8 | 8 | Solo EBS | N/D | Hasta 25 | Hasta 4,75 |
ml.inf1.2xlarge | 8 | 16 | 1 | 8 | 8 | Solo EBS | N/D | Hasta 25 | Hasta 4,75 |
ml.inf1.6xlarge | 24 | 48 | 4 | 32 | 8 | Solo EBS | Sí | 25 | 4,75 |
ml.inf1.24xlarge | 96 | 192 | 16 | 128 | 8 | Solo EBS | Sí | 100 | 19 |
Detalles del producto de la instancia Inf2 de Amazon SageMaker
Tamaño de la instancia | vCPU | Memoria (GiB) | Aceleradores de Inferentia | Memoria de acelerador total (GB) | Memoria por acelerador (GB) | Almacenamiento de la instancia | Interconexión entre aceleradores | Ancho de banda de la red (Gbps) | Ancho de banda de EBS (Gbps) |
ml.inf2.xlarge | 4 | 16 | 1 | 32 | 32 | Solo EBS | N/D | Hasta 25 | Hasta 10 |
ml.inf2.8xlarge | 32 | 128 | 1 | 32 | 32 | Solo EBS | N/D | Hasta 25 | 10 |
ml.inf2.24xlarge | 96 | 384 | 6 | 196 | 32 | Solo EBS | Sí | 50 | 30 |
ml.inf2.48xlarge | 192 | 768 | 12 | 384 | 32 | Solo EBS | Sí | 100 | 60 |
Amazon SageMaker Studio
Amazon SageMaker Studio es una interfaz web única para el desarrollo completo de machine learning, que ofrece una selección de entornos de desarrollo integrados (IDE) totalmente administrados y herramientas diseñadas específicamente. Puede acceder a SageMaker Studio de forma gratuita. Solo se le cobrará por el procesamiento y el almacenamiento subyacentes que utilice para los diferentes IDE y herramientas de machine learning de SageMaker Studio.
Puede usar muchos servicios de SageMaker Studio, AWS SDK para Python (Boto3) o la interfaz de la línea de comandos de AWS (AWS CLI), incluidos los siguientes:
- Entornos de desarrollo en SageMaker Studio para realizar un desarrollo completo de machine learning con un amplio conjunto de IDE totalmente gestionados, incluidos JupyterLab, un editor de código basado en Code-OSS (Visual Studio Code, código abierto) y RStudio
- SageMaker Pipelines para automatizar y administrar los flujos de trabajo de ML
- SageMaker Autopilot para crear de forma automática modelos de ML con visibilidad completa
- SageMaker Experiments para organizar los trabajos de entrenamiento y las versiones, y hacer un seguimiento de estos
- SageMaker Debugger para depurar anomalías durante la formación
- SageMaker Model Monitor para mantener modelos de alta calidad
- SageMaker Clarify para explicar mejor los modelos de ML y detectar sesgos
- SageMaker JumpStart para implementar de manera fácil soluciones de ML para muchos casos de uso. Es posible que incurra en cargos de otros servicios de AWS utilizados en la solución por las llamadas a la API subyacentes realizadas por Amazon SageMaker en su nombre.
- Recomendador de inferencias de SageMaker para obtener recomendaciones para la configuración adecuada de los puntos de conexión
Solo paga por los recursos subyacentes de almacenamiento y computación dentro de SageMaker u otros servicios de AWS, en función del uso.
Para utilizar el nivel gratuito de Amazon Q Developer en Jupyter Lab y en el editor de código, siga las instrucciones que se encuentran aquí. Para utilizar Amazon Q Developer Pro en JupyterLab, debe suscribirse a Amazon Q Developer. Los precios de Amazon Q Developer se encuentran disponibles aquí.
Evaluaciones de modelos fundacionales
SageMaker Clarify es compatible con las evaluaciones de los modelos básicos con métodos de evaluación automáticos y realizadas por humanos. Cada una de ellas tiene un precio diferente. Si evalúa un modelo básico de Amazon SageMaker JumpStart que aún no está desplegado en su cuenta, SageMaker desplegará el modelo JumpStart de manera temporal en una instancia de SageMaker mientras dure la inferencia. La instancia específica se ajustará a la recomendación de instancia brindada por JumpStart para ese modelo.
Evaluación automática:
Las evaluaciones del modelo básico se ejecutan como un trabajo de procesamiento de SageMaker. El trabajo de evaluación invocará SageMaker Inference. A los clientes se les cobra por la inferencia y por el trabajo de evaluación. A los clientes solo se les cobra por la duración del trabajo de evaluación. El costo del trabajo de evaluación sería la suma del costo por hora de la instancia de evaluación y la suma del costo por hora de la instancia de alojamiento.
Evaluaciones realizadas por humanos:
Cuando utiliza la característica de evaluación realizada por humanos, en la que trae su propio personal, se le cobran tres elementos: 1) la instancia de SageMaker utilizada para la inferencia, 2) la instancia utilizada para ejecutar el trabajo de procesamiento de SageMaker que aloja la evaluación humana y 3) un cargo de 0,21 USD por tarea de evaluación humana completada. Una tarea humana se define como la ocurrencia en la que un trabajador humano envía una evaluación de una sola solicitud y las respuestas de inferencia asociadas en la interfaz de usuario de la evaluación humana. El precio es el mismo sin importar si tiene uno o dos modelos en el trabajo de evaluación o si aporta sus propias conclusiones; también es el mismo sin importar el número de dimensiones de la evaluación y los métodos de calificación que incluya. El precio de 0,21 USD por tarea es el mismo para todas las regiones de AWS. No hay ningún cargo adicional por el personal, ya que lo suministra usted.
Evaluación administrada por AWS:
En el caso de una evaluación de expertos administrada por AWS, los precios varían según las necesidades de evaluación en un contrato privado mientras trabaja con el equipo de evaluaciones de expertos de AWS.
Amazon SageMaker Studio Lab
Puede crear y entrenar modelos de ML con Amazon SageMaker Studio Lab de forma gratuita. SageMaker Studio Lab ofrece a los desarrolladores, los académicos y los científicos de datos un entorno de desarrollo sin configuración para aprender y experimentar con ML sin cargos adicionales.
Amazon SageMaker Canvas
Amazon SageMaker Canvas amplía el acceso a ML al brindar a los analistas de negocios la capacidad de generar predicciones precisas de ML mediante una interfaz visual e interactiva, sin necesidad de tener experiencia en codificación o en ML.
Etiquetado de datos de Amazon SageMaker
El etiquetado de datos Amazon SageMaker tiene dos ofertas de etiquetado de datos: Amazon SageMaker Ground Truth Plus y Amazon SageMaker Ground Truth. Obtenga más información acerca del etiquetado de datos de Amazon SageMaker, un servicio de etiquetado de datos completamente administrado que facilita la creación de conjuntos de datos de formación de alta precisión para ML.
Pruebas de sombras de Amazon SageMaker
SageMaker le permite ejecutar pruebas de sombras para evaluar un nuevo modelo de ML antes del lanzamiento a producción. Para ello, prueba su rendimiento frente al modelo implementado actualmente. No hay cargos adicionales por las pruebas de sombras de SageMaker aparte de los cargos por uso de las instancias de ML y el almacenamiento de ML aprovisionado para alojar el modelo de sombras. El precio de las instancias de ML y de las dimensiones de almacenamiento de ML es el mismo que el de la opción de inferencia en tiempo real especificada en la tabla de precios anterior. No hay ningún cargo adicional por los datos procesados dentro y fuera de las implementaciones de sombras.
Amazon SageMaker Edge
Obtenga más información acerca de los precios de Amazon SageMaker Edge para optimizar, ejecutar y monitorear modelos de ML en flotas de dispositivos de borde.
Savings Plans de Amazon SageMaker
Amazon SageMaker Savings Plans ayuda a reducir los costos en hasta un 64 %. Los planes se aplican automáticamente al uso de instancias de ML de SageMaker elegibles, incluidos cuadernos de SageMaker Studio, instancias de cuaderno de SageMaker, SageMaker Processing, SageMaker Data Wrangler, SageMaker Training, SageMaker Real-Time Inference y SageMaker Batch Transform, independientemente de la familia de instancias, el tamaño o la región. Por ejemplo, puede cambiar el uso de una instancia de CPU ml.c5.xlarge en funcionamiento en la región Este de EE. UU. (Ohio) a una instancia ml.Inf1 en la región Oeste de EE. UU. (Oregón) para cargas de trabajo de inferencia en cualquier momento y pagar de manera automática el precio de Savings Plans.
Costo total de propiedad con Amazon SageMaker
Amazon SageMaker ofrece un costo total de propiedad por lo menos 54 % más bajo en un periodo de 3 años en comparación con otras soluciones autoadministradas basadas en la nube. Obtenga más información en el análisis completo del TCO correspondiente a Amazon SageMaker.
Ejemplos de precios
-
Ejemplo de precios N.° 1: JupyterLab
Como científico de datos, dedica 20 días a usar JupyterLab para experimentar rápidamente con cuadernos, código y datos durante 6 horas al día en una instancia ml.g4dn.xlarge. Crea y luego ejecuta un espacio de JupyterLab para acceder al IDE de JupyterLab. La computación solo se cobra por la instancia utilizada cuando se ejecuta el espacio de JupyterLab. Los gastos de almacenamiento de un espacio de JupyterLab se acumulan hasta que se elimina.Computación
Instancia Duración Días Duración total Costo por hora Total ml.g4dn.xlarge 6 horas 20 6 * 20 = 120 horas 0,7364 USD 88,368 USD Almacenamiento
Utilizará el almacenamiento SSD de uso general durante 480 horas (24 horas* 20 días). En una región que cobra 0,1125 USD por GB al mes:
0,112 USD por GB-mes * 5 GB * 480/(24 horas/día * 30 días al mes) = 0,373 USD -
Ejemplo de precios N.° 2: Editor de código
Como ingeniero de ML, dedica 20 días a usar el editor de código para editar, ejecutar y depurar código de producción de ML durante 6 horas al día en una instancia ml.g4dn.xlarge. Cree y, a continuación, ejecute un espacio de editor de código para acceder al IDE del editor de código. La computación solo se cobra por la instancia utilizada cuando se ejecuta el espacio del editor de código. Los gastos de almacenamiento de un espacio del editor de código se acumulan hasta que se elimina.Computación
Instancia Duración Días Duración total Costo por hora Total ml.g4dn.xlarge 6 horas 20 6 * 20 = 120 horas 0,7364 USD 88,368 USD Almacenamiento
Utilizará el almacenamiento SSD de uso general durante 480 horas (24 horas* 20 días). En una región que cobra 0,1125 USD por GB al mes:
0,112 USD por GB-mes * 5 GB * 480/(24 horas/día * 30 días al mes) = 0,373 USD
-
Ejemplo de precios N.° 3: Studio Classic
Un científico de datos experimenta la siguiente secuencia de acciones mientras utiliza los cuadernos de Amazon SageMaker Studio.
- Abre el cuaderno 1 en un kernel de TensorFlow en una instancia ml.c5.xlarge y, luego, trabaja en este cuaderno durante una hora.
- Abre el cuaderno 2 en una instancia ml.c5.xlarge. Este se abre automáticamente en la misma instancia ml.c5.xlarge que ejecuta el bloc de notas 1.
- Trabaja en los blocs de notas 1 y 2 de forma simultánea durante una hora.
- El científico de datos recibirá una factura por un total de 2 horas de uso de la instancia ml.c5.xlarge. Por la hora en la que trabajó simultáneamente en el cuaderno 1 y 2, cada aplicación de kernel contará como media hora y se le cobrará una hora.
Aplicación de kernel Instancia de cuaderno Horas Costo por hora Total TensorFlow ml.c5.xlarge 1 0,204 USD 0,204 USD TensorFlow ml.c5.xlarge 0,5 0,204 USD 0,102 USD Ciencia de datos ml.c5.xlarge 0,5 0,204 USD 0,102 USD 0,408 USD -
Ejemplo de precios N.° 4: RStudio
Un científico de datos experimenta la siguiente secuencia de acciones mientras utiliza RStudio:
- Lanza RSession 1 en una instancia ml.c5.xlarge y, luego, trabaja en este cuaderno durante una hora.
- Lanza RSession 2 en una instancia ml.c5.xlarge. Este se abre automáticamente en la misma instancia ml.c5.xlarge que ejecuta RSession 1.
- Funciona con RSession 1 y RSession 2 de forma simultánea durante una hora.
- El científico de datos recibirá una factura por un total de dos (2) horas de uso de la instancia ml.c5.xlarge. Por la hora en la que trabajó de forma simultánea en RSession 1 y RSession 2, cada aplicación de RSession contará como media hora y se le cobrará 1 hora.
Mientras tanto, RServer funciona ininterrumpidamente sin importar si hay RSessions en marcha o no. Si el administrador elige Small (Pequeño) (ml.t3.medium), entonces es gratuito. Si el administrador elige “Medium” (Mediano) (ml.c5.4xlarge) o “Large” (Grande) (ml.c5.9xlarge), entonces se cobra por hora mientras RStudio esté habilitado para el dominio de SageMaker.
Aplicación RSession Instancia de RSession Horas Costo por hora Total Base R ml.c5.xlarge 1 0,204 USD 0,204 USD Base R ml.c5.xlarge 0,5 0,204 USD 0,102 USD Base R ml.c5.xlarge 0,5 0,204 USD 0,102 USD 0,408 USD -
Ejemplo de precios N.° 5: procesamiento
Con el procesamiento de Amazon SageMaker, solo se cobran las instancias utilizadas mientras los trabajos están en marcha. Cuando proporciona los datos entrantes para su procesamiento en Amazon S3, Amazon SageMaker descarga los datos desde Amazon S3 al almacenamiento de archivos local al comienzo de un trabajo de procesamiento.
El analista de datos pone en marcha un trabajo de procesamiento para preprocesar y validar los datos en dos instancias ml.m5.4xlarge para la duración de un trabajo de 10 minutos. Carga un conjunto de datos de 100 GB en S3 como entrada para el trabajo de procesamiento. Los datos de salida, que suelen tener el mismo tamaño, se almacenan nuevamente en S3.
Horas Instancias de procesamiento Costo por hora Total 1 * 2 *0,167 = 0,334 ml.m5.4xlarge 0,922 USD 0,308 USD Almacenamiento (SSD) de uso general (GB) Costo por hora Total 100 GB * 2 = 200 0,14 USD 0,0032 USD El subtotal correspondiente al trabajo de procesamiento de Amazon SageMaker = 0,308 USD.
El subtotal correspondiente a 200 GB de almacenamiento (SSD) de uso general = 0,0032 USD.
El precio total de este ejemplo sería 0,3112 USD
-
Ejemplo de precios N.° 6: Data Wrangler
Según la tabla, utiliza Amazon SageMaker Data Wrangler durante 18 horas en total durante un periodo de 3 días para preparar los datos. Además, crea un trabajo de SageMaker Data Wrangler para preparar datos actualizado semanalmente. Cada trabajo dura 40 minutos y este se ejecuta una vez por semana durante un mes.
Cargos totales mensuales correspondientes al uso de Data Wrangler = 16,596 USD + 2,461 USD = 19,097 USD
Aplicación Instancia de SageMaker Studio Días Duración Duración total Costo por hora Costo subtotal SageMaker Data Wrangler ml.m5.4xlarge 3 6 horas 18 horas 0,922 USD 16,596 USD Trabajo de SageMaker Data Wrangler ml.m5.4xlarge - 40 minutos 2,67 horas 0,922 USD 2,461 USD Como científico de datos, utiliza Amazon SageMaker Data Wrangler 6 horas al día durante 3 días para limpiar, explorar y visualizar datos. Tras ello, para ejecutar la canalización de preparación de datos, inicia un trabajo de SageMaker Data Wrangler programado para ejecutarse semanalmente.
La tabla que aparece a continuación resume el uso total durante el mes y los cargos correspondientes al uso de Amazon SageMaker Data Wrangler.
-
Ejemplo de precios N.° 7: almacén de características
++ Todas las unidades de lectura fraccionarias se redondean al siguiente número entero
Almacenamiento de datos
Total de datos almacenados = 31,5 GB
Cargos mensuales correspondientes a los datos almacenados = 31,5 GB * 0,45 USD = 14,175 USDCargos mensuales totales correspondientes al almacén de características de Amazon SageMaker = 56,875 USD + 3,185 USD + 14,175 USD = 74,235 USD
Día del mes Total de escrituras Total de unidades de escritura Total de lecturas Total de unidades de lectura Del día 1 al día 10 100 000 escrituras
(10 000 escrituras * 10 días)2 500 000
(100 000 * 25 KB)100 000
(10 000 * 10 días)700 000++
(100 000 * 25/4 KB )Día 11 200 000 escrituras 5 000 000
(200 000 * 25KB)200 000 lecturas 1 400 000++
(200 000 * 25/4 KB)Del día 12 al día 30 1 520 000 escrituras
(80 000 * 19 días)38 000 000
(1 520 000 * 25 KB)1 520 000 escrituras
(80 000 * 19 días)10 640 000++
(1 520 000 * 25/4 KB)Total de unidades facturables 45 500 000 unidades de escritura 12 740 000 unidades de lectura Cargos mensuales por escrituras y lecturas 56,875 USD
(45,5 millones de unidades de escritura * 1,25 USD por millón de escrituras)3,185 USD
(12,74 millones de unidades de lectura * 0,25 USD por millón de lecturas)Tiene una aplicación web que emite lecturas y escrituras de 25 KB cada una al almacén de características de Amazon SageMaker. Durante los primeros diez días del mes, la aplicación recibe poco tráfico, lo que resulta en 10 000 escrituras y 10 000 lecturas diarias para el almacén de características de SageMaker. El día 11 del mes, la aplicación logra atención en las redes sociales, y el tráfico aumenta a 200 000 escrituras y 200 000 lecturas ese día. Tras ello, la aplicación se establece en un patrón de tráfico más regular, con un promedio de 80 000 escrituras y 80 000 lecturas por día hasta el final del mes.
La tabla que aparece a continuación resume el uso total durante el mes y los cargos correspondientes al uso del almacén de características de Amazon SageMaker.
-
Ejemplo de precios N.° 8: entrenamiento
Los cargos totales por el entrenamiento y la depuración en este ejemplo son 2,38 USD. Las instancias de informática y los volúmenes de almacenamiento de uso general que utilizan las reglas integradas del depurador de Amazon SageMaker no generan cargos adicionales.
Almacenamiento (SSD) de uso general para entrenamiento (GB) Almacenamiento (SSD) de uso general para las reglas integradas del depurador (GB) Almacenamiento (SSD) de uso general para las reglas personalizadas del depurador (GB) Costo por GB al mes Subtotal Capacidad utilizada 3 2 1 Costo 0 USD No se aplican cargos adicionales por los volúmenes de la regla integrada 0 USD 0,10 USD 0 USD Horas Instancia de entrenamiento Instancia de depuración Costo por hora Subtotal 4 * 0,5 = 2,00 ml.m4.4xlarge n/d 0,96 USD 1,92 USD 4 * 0,5 * 2 = 4 n/d No se aplican cargos adicionales por las instancias de la regla integrada 0 USD 0 USD 4 * 0,5 = 2 ml.m5.xlarge n/d 0,23 USD 0,46 USD ------- 2,38 USD Una científica de datos dedicó una semana a trabajar en un modelo para una nueva idea. Entrenó el modelo 4 veces en una ml.m4.4xlarge durante 30 minutos por ejecución de entrenamiento con el depurador de Amazon SageMaker habilitado con 2 reglas integradas y 1 regla personalizada que ella escribió. Para la regla personalizada, especificó la instancia ml.m5.xlarge. Entrena usando 3 GB de datos de entrenamiento en Amazon S3 y envía una salida modelo de 1 GB a Amazon S3. SageMaker crea volúmenes de SSD de uso general (gp2) para cada instancia de entrenamiento. SageMaker también crea volúmenes de SSD de uso general (gp2) para cada regla especificada. En este ejemplo, se creará un total de 4 volúmenes de SSD de uso general (gp2). El depurador de SageMaker emite 1 GB de datos depurados al bucket de Amazon S3 del cliente.
-
Ejemplo de precios n.° 9: MLflow
Usted tiene dos equipos de científicos de datos. Un equipo con 10 científicos de datos y el otro equipo con 40. Para admitir estos dos equipos, elige habilitar dos servidores de seguimiento de MLflow diferentes: uno pequeño y otro mediano. Cada equipo realiza experimentos de machine learning (ML) y necesita registrar las métricas, los parámetros y los artefactos producidos por sus intentos de entrenamiento. Quieren usar los servidores de seguimiento de MLflow durante 160 horas al mes. Asumamos que cada equipo de ciencia de datos almacena 1 GB de metadatos para realizar un seguimiento de las ejecuciones de los experimentos. La factura al final del mes se calcularía de la siguiente manera:
Cargos de procesamiento para instancias del servidor pequeño: 160 * 0,60 USD = 96 USD
Cargos de procesamiento para instancias del servidor mediano: 160 * 1,40 USD = 166,4 USD
Cargos de almacenamiento para los dos equipos: 2 * 1 * 0,10 USD = 0,20 USDTotal = 262,60 USD
-
Ejemplo de precios n.° 10: inferencia en tiempo real
El subtotal correspondiente al entrenamiento, el alojamiento y la supervisión: 305 827 USD. El subtotal correspondiente a 3100 MB de datos precesados entrantes y 310 MB de datos procesados salientes para alojamiento al mes = 0,054 USD. El total de cargos para este ejemplo sería de 305,881 USD por mes.
Nota: Para las reglas integradas con la instancia ml.m5.xlarge, obtiene hasta 30 horas de supervisión agregada en todos los puntos de conexión por mes, sin costo.
Datos entrantes al mes: alojamiento Datos salientes al mes: alojamiento Costo por GB entrante o saliente Total 100 MB * 31 = 3100 MB 0,016 USD 0,0496 USD 10 MB * 31 = 310 MB 0,016 USD 0,00496 USD Horas al mes Instancias para alojamiento Instancias de Model Monitor Costo por hora Total 24 * 31 *2 = 1488 ml.c5.xlarge 0,204 USD 303,522 USD 31*0,08 = 2,5 ml.m5.4xlarge 0,922 USD 2,305 USD El modelo del ejemplo N.° 5 se implementa después en la fase de producción en dos (2) instancias ml.c5.xlarge para un alojamiento Multi-AZ fiable. Amazon SageMaker Model Monitor está habilitado con una (1) instancia ml.m5.4xlarge y los trabajos de supervisión se programan una vez por día. Cada trabajo de supervisión tarda 5 minutos en completarse. El modelo recibe diariamente 100 MB de datos y las inferencias tienen una décima parte del tamaño de los datos entrantes.
-
Ejemplo de precios N.° 11: inferencia asíncrona
El subtotal correspondiente a la inferencia asíncrona de SageMaker = 15,81 USD + 0,56 USD+ 2 * 0,0048 = 16,38 USD. El total de cargos de la inferencia asíncrona para este ejemplo sería de 16,38 USD al mes.
Datos entrantes al mes Datos salientes al mes Costo por GB entrante o saliente Total 10 KB * 1024 * 31 = 310 MB 10 KB * 1024 * 31 = 310 MB 0,02 USD 0,0048 10 KB * 1024 * 31 = 310 MB 0,02 USD 0,0048 Almacenamiento de uso general (SSD) (GB) Costo por GB al mes Total 4 0,14 USD 0,56 USD Horas al mes Instancias para alojamiento Costo por hora Total 2,5 * 31 * 1 = 77,5 ml.c5.xlarge 0,20 USD 15,81 USD El servicio de inferencia asíncrona de Amazon SageMaker le cobra por las instancias utilizadas por el punto de conexión. Cuando no se procesan activamente las solicitudes, puede configurar el escalado automático para escalar el recuento de instancias a cero para ahorrar costos. En el caso de las cargas de entrada en Amazon S3, no hay ningún costo por leer los datos de entrada de Amazon S3 y escribir los datos de salida en S3 en la misma región.
El modelo del ejemplo 5 se utiliza para ejecutar un punto de conexión de inferencia asíncrona de SageMaker. El punto de conexión se configura para que se ejecute en una instancia ml.c5.xlarge y se reduzca verticalmente el número de instancias a cero cuando no se procesen las solicitudes activamente. La instancia ml.c5.xlarge del punto de conexión tiene un almacenamiento de uso general (SSD) de 4 GB adjunto. En este ejemplo, el punto de conexión mantiene un recuento de instancias de 1 durante 2 horas al día y tiene un periodo de recuperación de 30 minutos, tras el cual se reduce verticalmente a un recuento de instancias de 0 durante el resto del día. Por lo tanto, se cobra por 2 horas y media de uso al día.
El punto de conexión procesa 1024 solicitudes al día. El tamaño de cada cuerpo de solicitud o respuesta de invocación es de 10 KB y cada carga de solicitud de inferencia en Amazon S3 es de 100 MB. Las salidas de inferencia tienen la décima parte del tamaño de los datos de entrada, que se almacenan de nuevo en Amazon S3 en la misma región. En este ejemplo, los cargos por procesamiento de datos se aplican al cuerpo de la solicitud y la respuesta, pero no a los datos transferidos a o desde Amazon S3.
-
Ejemplo de precios N.° 12: transformación por lotes
Los cargos totales por inferencia en este ejemplo serían de 2,88 USD.
Horas Instancias para alojamiento Costo por hora Total 3 * 0,25 * 4 = 3 horas ml.m4.4xlarge 0,96 USD 2,88 USD El modelo del ejemplo 5 se utiliza para ejecutar la transformación por lotes de SageMaker. El científico de datos pone en marcha cuatro trabajos de transformación por lotes de SageMaker diferentes en 3 instancias ml.m4.4xlarge durante 15 minutos por trabajo en funcionamiento. Carga un conjunto de datos de evaluación de 1 GB en S3 para cada puesta en marcha. Las inferencias tienen una décima parte del tamaño de los datos de entrada, que se almacenan nuevamente en S3.
-
Ejemplo de precios N.° 13: inferencia sin servidor bajo demanda
Cargos mensuales por el procesamiento de datos
Procesamiento de datos (GB) Costo por GB entrante o saliente Cargo mensual por el procesamiento de datos 10 GB 0,016 USD 0,16 USD El subtotal correspondiente al cargo por la duración de la inferencia sin servidor de SageMaker bajo demanda = 40 USD. El subtotal correspondiente al cargo por el procesamiento de datos de 10 GB = 0,16 USD. Los cargos totales de este ejemplo serían 40,16 USD.
Cargos de computación mensuales
Número de solicitudes Duración de cada solicitud Duración total de la inferencia (segundos) Costo por segundo Cargo mensual por la duración de la inferencia 10 M 100 ms 1 M 0,00004 USD 40 USD
Con la inferencia sin servidor bajo demanda, solo paga por la capacidad de cálculo utilizada para procesar las solicitudes de inferencia, facturada por milisegundos y por la cantidad de datos procesados. El cargo de cálculo depende de la configuración de la memoria que elija.
Si asignó 2 GB de memoria a su punto de conexión, lo puso en marcha 10 millones de veces en un mes durante 100 ms cada vez y se procesaron 10 GB de datos de entrada o de salida en total, los cargos se calcularían de la siguiente manera:
-
Ejemplo de precios N.° 14: simultaneidad aprovisionada en una inferencia sin servidor
Supongamos que dirige un servicio de chatbot para una empresa de procesamiento de nóminas. Espera un aumento de las consultas de los clientes a finales de marzo, antes de la fecha límite para la declaración de la renta. Sin embargo, para el resto del mes, se espera que el tráfico sea escaso. Por lo tanto, implementa un punto de conexión sin servidor con 2 GB de memoria y agrega una simultaneidad aprovisionada de 100 para los últimos 5 días del mes de 9:00 h a 17:00 h (8 horas), durante los cuales su punto de conexión procesa 10 millones de solicitudes y 10 GB de datos de entrada/salida de datos en total. El resto del mes, el chatbot se ejecuta mediante inferencia sin servidor bajo demanda y procesa 3 millones de solicitudes y 3 GB de entrada/salida de datos. Supongamos que la duración de cada solicitud es de 100 ms.
Cargos por simultaneidad aprovisionada (PC)
El precio por PC es de 0,000010 USD/segundo
Duración del uso de los PC = 5 días * 100 PC * 8 horas * 3600 segundos = 14 400 000 segundos
Cargo por uso de PC = 14 400 000 s * 0,000010 USD/segundo = 144 USD.Cargos por duración de inferencia para el tráfico servido por simultaneidad aprovisionada
El precio de la duración de la inferencia es de 0,000023 USD/segundo
Duración total de la inferencia para PC (segundos)= 10 millones * (100 ms) / 1000 = 1 millón de segundos.
Cargos por duración de inferencia por PC = 1 000 000 segundos * 0,000023 USD/segundo = 23 USDCargos por duración de inferencia bajo demanda
El precio mensual del cálculo es de 0,00004 USD/segundo y el nivel gratuito ofrece 150 000 segundos.
Cálculo total (segundos) = (3) millones * (100 ms) / 1000 = 0,3 millones de segundos.
Cálculo total - Cálculo gratuito = Cálculo mensual facturable en segundos
0,3 millones de segundos - 150 000 segundos = 150 000 segundos
Cargos mensuales por computación = 150 000 * 0,00004 USD = 6 USDProcesamiento de datos
Costo/GB de datos procesados de entrada/salida = 0,016 USD
Total de GB procesados: 10 + 3 = 13
Costo total: 0,016 USD * 13 USD = 0,208 USD
Cargos totales de marzo
Cargos totales = cargos de la simultaneidad aprovisionada + duración de la inferencia para capacidad disponible + duración de la inferencia para computación bajo demanda + costos de procesamiento de datos
= 144 USD + 23 USD + 6 USD + 0,208 USD = 173,2 USD -
Ejemplo de precios n.° 15: JumpStart
El cliente utiliza JumpStart para implementar un modelo BERT Base Uncased previamente entrenado para clasificar la valoración de los clientes como positiva o negativa.
El cliente implementa el modelo en dos (2) instancias ml.c5.xlarge para un alojamiento Multi-AZ fiable. El modelo recibe diariamente 100 MB de datos y las inferencias tienen una décima parte del tamaño de los datos entrantes.
Horas al mes Instancias para alojamiento Costo por hora Total 24 * 31 *2 = 1488 ml.c5.xlarge 0,204 USD 303,55 USD Datos entrantes al mes – Alojamiento Datos salientes al mes – Alojamiento Costo por GB entrante o saliente
Total
100 MB * 31 = 3100 MB 0,02 USD 0,06 USD 10 MB * 31 = 310 MB 0,02 USD 0,01 USD El subtotal correspondiente al entrenamiento, el alojamiento y la supervisión: 305 827 USD. EEl subtotal correspondiente a 3100 MB de datos precesados entrantes y 310 MB de datos procesados salientes para alojamiento al mes = 0,06 USD. El total de cargos para este ejemplo sería de 305,887 USD por mes.
-
Ejemplo de precios n.° 16: clúster HyperPod
Supongamos que desea aprovisionar un clúster de 4 ml.g5.24xlarge durante 1 mes (30 días) con 100 GB adicionales de almacenamiento por instancia para respaldar el desarrollo del modelo. Los cargos totales por el clúster y el almacenamiento adicional en este ejemplo son de 29 374,40 USD.Computación
Instancia Duración Instancias Coste por hora Subtotal ml.g5.24xlarge 30 días* 24 horas = 720 horas 4 10,18 USD 29 318,40 USD Almacenamiento
Almacenamiento de uso general (SSD) Duración Instancias Costo por GB al mes Subtotal 100 GB 30 días* 24 horas = 720 horas 4 0,14 USD 56,00 USD -
Ejemplo de precios n.° 17: evaluaciones del modelo fundacional (evaluación automática)
Las evaluaciones del modelo fundacional con SageMaker Clarify solo le cobran por las instancias utilizadas mientras se ejecutan los trabajos de evaluación automática. Al seleccionar una tarea de evaluación automática y un conjunto de datos, SageMaker carga el conjunto de datos de solicitudes de Amazon S3 en una instancia de evaluaciones de SageMaker.
En el siguiente ejemplo, un ingeniero de machine learning ejecuta una evaluación del modelo Llama2 7B en el Este de EE. UU. (Norte de Virginia) para obtener un resumen preciso de la tarea. El tipo de instancia recomendado para la inferencia para Llama 2 7B es ml.g5.2xlarge. La instancia mínima recomendada para una evaluación es ml.m5.2xlarge. En este ejemplo, el trabajo se ejecuta durante 45 minutos, según el tamaño del conjunto de datos. En este ejemplo, el coste del trabajo de evaluación y los resultados detallados es de 1,48 USD.Procesamiento de las horas de trabajo (ejemplo)
Región
Tipo de instancia
Instancia
Costo por hora
Costo
0,45
US-east-1
Alojamiento del modelo de lenguaje de gran tamaño (LLM)
ml.g5.2xlarge
1,52 USD
1,14 USD
0,45
US-east-1
evaluación
ml.m5.2xlarge
0,46 USD
0,35 USD
Total
1,48 USD
En el siguiente ejemplo, el mismo ingeniero de Virginia ejecuta otro trabajo de evaluación para resumir la precisión de las tareas, pero utiliza una versión personalizada de Llama 2 7B desplegada en su cuenta y en funcionamiento. En este caso, dado que el modelo ya está desplegado en la cuenta, el único costo incremental sería el de la instancia de evaluación.
Procesamiento de las horas de trabajo
Región
Tipo de instancia
Instancia
Costo por hora
Costo
0,45
US-east-1
evaluación
ml.m5.2xlarge
0,46 USD
0,35 USD
Total
0,35 USD
-
Ejemplo de precios N.° 18: Evaluaciones del modelo fundacional (evaluación realizada por humanos)
En el siguiente ejemplo, un ingeniero de machine learning del Este de EE. UU. (Norte de Virginia) realiza una evaluación humana de Llama-2-7B para resumir la precisión de las tareas y utiliza su propio personal privado para la evaluación. El tipo de instancia recomendado para Llama-2-7B es ml.g5.2xlarge. La instancia mínima recomendada para un trabajo de procesamiento de evaluación realizado por humanos es ml.t3.medium. La inferencia en Llama-2-7B dura 45 minutos, según el tamaño del conjunto de datos. El conjunto de datos contiene 50 solicitudes y el desarrollador requiere que dos trabajadores califiquen cada conjunto de solicitudes y respuestas (se puede configurar en la creación del trabajo de evaluación como parámetro “trabajadores por solicitud”). Este trabajo de evaluación constará de 100 tareas (una por cada par de respuesta rápida por cada trabajador: dos trabajadores x 50 conjuntos de respuesta rápida = 100 tareas humanas). El personal humano tarda un día (24 horas) en completar las 100 tareas de evaluación humana del trabajo de evaluación (depende del número y del nivel de habilidad de los trabajadores y de la longitud y la complejidad de las indicaciones y las respuestas de inferencia).
Horas de computación
Tareas humanas
Región
Tipo de instancia
Instancia
Costo por hora
Costo por tarea humana
Costo total
0,45
Este de EE. UU. (Norte de Virginia)
Alojamiento del modelo de lenguaje de gran tamaño (LLM)
ml.g5.2xlarge
1,52 USD
1,14 USD
24
Este de EE. UU. (Norte de Virginia)
Trabajo de procesamiento
ml.t3.medium
0,05 USD
1,20 USD
100
Cualquiera
0,21 USD
21,00 USD
Total
23,34 USD
En el siguiente ejemplo, el mismo ingeniero del Este de EE. UU. (Norte de Virginia) ejecuta el mismo trabajo de evaluación, pero utiliza Llama-2-7B ya desplegado en su cuenta y en funcionamiento. En este caso, el único costo incremental sería el del trabajo de procesamiento de la evaluación y las tareas humanas.
Horas de computación
Tareas humanas
Región
Tipo de instancia
Instancia
Costo por hora
Costo por tarea humana
Costo total
24
Este de EE. UU. (Norte de Virginia)
Trabajo de procesamiento
ml.t3.medium
0,05 USD
1,20 USD
100
Cualquiera
0,21 USD
21,00 USD
Total
22,20 USD