发布于: May 28, 2021
Amazon SageMaker Autopilot 可根据您的数据自动构建、训练和调整最佳机器学习模型,同时允许您保持完全控制和可见性。从现在开始,Autopilot 会对 50,000 行以下的数据集执行所有问题类型的交叉验证,这包括回归、二分类和多分类验证。借助交叉验证功能,您可活得更好的稳健性,消除训练数据和验证数据之间不理想拆分的影响,从而提高模型质量。根据数据集和问题类型的不同,您最高可将模型质量提升 35%。
Autopilot 会自动将输入数据拆分为训练数据集和验证数据集。发布此功能后,Autopilot 还会使用 k 次交叉验证方法,并使用来自最佳验证指标实验的交叉验证模型整体进行推理。Autopilot 会确保每次训练和验证都同等代表每个类,以帮助提高精确度并使用可用的数据构建最优的模型。在选择部署模型之前,您可以在 Autopilot 实验的输出中查看每个模型的最终验证方法。此外,Amazon CloudWatch 中也提供了详细的交叉验证更新,包括每次使用的训练和验证指标。
自动交叉验证功能现已在当前支持 SageMaker Autopilot 的所有 AWS 区域开放。要开始使用,请查看我们的文档或访问 Amazon SageMaker Studio 以创建新的 Autopilot 实验。