Publié le: Apr 21, 2022
Aujourd'hui, nous sommes heureux d'annoncer la disponibilité générale de l'inférence sans serveur d'Amazon SageMaker dans toutes les Régions AWS où SageMaker est généralement disponible (à l'exception des Régions AWS Chine). Avec l'inférence sans serveur SageMaker, vous pouvez déployer rapidement des modèles de machine learning (ML) pour l'inférence sans avoir à configurer ou à gérer l'infrastructure sous-jacente. Lorsque vous déployez vos modèles ML, il suffit de sélectionner l'option sans serveur et Amazon SageMaker se chargera automatiquement de l'allocation, de la mise à l'échelle et de la désactivation de la capacité de calcul en fonction du volume de demandes d'inférence. Avec l'inférence sans serveur SageMaker, vous ne payez que pour la capacité de calcul utilisée pour traiter les demandes d'inférence (facturée à la milliseconde) et la quantité de données traitées. Vous ne payez pas pour le temps d'inactivité. L'inférence sans serveur SageMaker est idéale pour les applications dont le trafic est intermittent ou imprévisible.
Depuis le lancement de l'avant-première à re:Invent 2021, nous avons ajouté la prise en charge du kit SDK Amazon SageMaker Python, qui offre des abstractions pour simplifier le déploiement des modèles, et la prise en charge du registre des modèles, qui vous permet d'intégrer vos points de terminaison d'inférence sans serveur à votre flux MLOps. Nous avons également augmenté la limite maximale d'invocations simultanées par point de terminaison à 200 (contre 50 durant la phase d'aperçu), ce qui vous permet d'utiliser l'inférence sans serveur SageMaker pour les charges de travail à fort trafic.
Vous pouvez créer un point de terminaison d'inférence sans serveur SageMaker à partir de la console AWS, d'AWS SDK pour Python (Boto3), du kit SDK SageMaker Python, d'AWS CloudFormation ou de l'AWS Command Line Interface (AWS CLI). L'inférence sans serveur SageMaker est disponible dans les 21 Régions AWS suivantes : USA Est (Ohio), USA Est (Virginie du Nord), USA Ouest (Californie du Nord), USA Ouest (Oregon), Afrique (Le Cap), Asie-Pacifique (Hong Kong), Asie-Pacifique (Mumbai), Asie-Pacifique (Osaka), Asie-Pacifique (Séoul), Asie-Pacifique (Singapour), Asie-Pacifique (Sydney), Asie-Pacifique (Tokyo), Canada (Centre), EU (Francfort), EU (Irlande), EU (Londres), EU (Milan), EU (Paris), EU (Stockholm), Moyen-Orient (Bahreïn) et Amérique du Sud (São Paulo).
Démarrer :
- Consultez l'article de blog sur l'inférence sans serveur Amazon SageMaker
- Consultez le guide du développeur de l'inférence sans serveur SageMaker
- Téléchargez les blocs-notes d'exemples sur GitHub pour l'inférence sans serveur SageMaker
- Consultez la page de tarification d'Amazon SageMaker