Publicado en: May 28, 2021
Amazon SageMaker Autopilot crea, entrena y ajusta automáticamente los mejores modelos de Machine Learning en función de los datos, a la vez que permite mantener el control y la visibilidad completos. A partir de hoy, Autopilot realiza una validación cruzada en conjuntos de datos de entrada de menos de 50 000 filas para todos los tipos de problemas: regresión, clasificación binaria y clasificación de varias clases. Gracias a la validación cruzada, se beneficia de una mayor solidez frente a divisiones no deseadas entre los datos de entrenamiento y los de validación, lo que se traduce en una mayor calidad del modelo. En función del conjunto de datos y del tipo de problema, la calidad del modelo puede mejorar hasta en un 35 %.
Autopilot divide automáticamente los datos de entrada en conjuntos de entrenamiento y validación. Gracias a esta versión, Autopilot también utiliza el método de validación cruzada de K iteraciones y realiza la inferencia con el conjunto de modelos de validación cruzada del ensayo con la mejor métrica de validación. Autopilot se asegura de que cada iteración de entrenamiento y validación tenga igual representación de cada clase para ayudar a mejorar la precisión y crear el mejor modelo con los datos disponibles. Puede ver la métrica de validación final correspondiente a cada modelo en la salida del experimento de Autopilot antes de optar por implementar el modelo. Además, las actualizaciones detalladas de la validación cruzada, incluidas las métricas de entrenamiento y validación de cada iteración, están disponibles en Amazon CloudWatch.
La validación cruzada automática está ahora disponible en todas las regiones de AWS en las que actualmente se admite SageMaker Autopilot. Para comenzar, consulte nuestra documentación u obtenga acceso a Amazon SageMaker Studio para crear un nuevo experimento de Autopilot.