Publicado en: Dec 1, 2021
Amazon SageMaker Inference Recommender ayuda a elegir la mejor instancia informática disponible y configuración para implementar modelos de machine learning con el fin de obtener rendimiento y costo óptimos de la inferencia.
La selección de una instancia informática con el mejor rendimiento en cuanto a precio para la implementación de modelos de machine learning es un proceso complicado e iterativo que puede tardar semanas de experimentación. En primer lugar, debe elegir el tipo de instancia de ML adecuado entre más de 70 opciones, en función de los requisitos de recursos de sus modelos y del tamaño de los datos de entrada. Después, debe optimizar el modelo para el tipo de instancia seleccionado. Por último, debe aprovisionar y administrar la infraestructura para ejecutar pruebas de carga y ajustar la configuración de la nube para obtener un rendimiento y un costo óptimos. Todo esto puede retrasar la implementación del modelo y el tiempo de comercialización.
Amazon SageMaker Inference Recommender selecciona automáticamente el tipo de instancia informática, el número de instancias, los parámetros del contenedor y las optimizaciones del modelo para la inferencia con el fin de maximizar el rendimiento y minimizar el costo. Puede utilizar SageMaker Inference Recommender desde SageMaker Studio, AWS Command Line Interface (CLI) o el SDK de AWS y, en cuestión de minutos, obtener recomendaciones para implementar el modelo de ML. A continuación, puede implementar el modelo en una de las instancias recomendadas o ejecutar una prueba de carga completamente administrada en un conjunto de tipos de instancia que elija sin preocuparse por la infraestructura de pruebas. Puede revisar los resultados de la prueba de carga en SageMaker Studio y evaluar las compensaciones entre la latencia, el rendimiento y el costo para seleccionar la configuración de implementación más óptima.
Amazon SageMaker Inference Recommender está disponible de manera general en todas las regiones en las que está disponible SageMaker, excepto en las regiones de AWS de China. Para más información, consulte la página web de implementación de modelos de SageMaker y la documentación de SageMaker Inference Recommender.