Amazon SageMaker Catalog

Découvrez, gérez et collaborez sur les données et l’IA en toute sécurité

Présentation

La nouvelle génération d’Amazon SageMaker simplifie la découverte, la gouvernance et la collaboration en matière de données et d’IA dans votre environnement, vos modèles d’IA et vos applications. Avec Amazon SageMaker Catalog, basé sur Amazon DataZone, les utilisateurs peuvent découvrir et accéder en toute sécurité à des données et à des modèles approuvés à l’aide de la recherche sémantique avec des métadonnées créées par l’IA générative, ou vous pouvez simplement demander à Amazon Q Developer en langage naturel de trouver vos données. Les utilisateurs peuvent définir et appliquer des politiques d’accès de manière cohérente à l’aide d’un modèle d’autorisation unique avec des contrôles d’accès ultraprécis de manière centralisée dans Amazon SageMaker Unified Studio. Partagez et collaborez en toute simplicité sur les données et les actifs d’IA grâce à des flux de publication et d’abonnement simplifiés. Avec SageMaker, vous pouvez sauvegarder et protéger vos modèles d’IA à l’aide des barrières de protection Amazon Bedrock et mettre en œuvre des politiques d’IA responsable. Instaurez la confiance au sein de votre organisation grâce à la surveillance et à l’automatisation de la qualité des données, à la détection des données sensibles et au lignage des données et du machine learning (ML).

Découvrez le catalogue Amazon SageMaker en action

catalogue de vignettes SageMaker

Avantages

Découvrez vos données et vos ressources d’IA mises à l’échelle grâce à SageMaker Catalog, basé sur Amazon DataZone. Améliorez la découverte des données grâce à l’IA générative pour enrichir automatiquement vos données et vos métadonnées en fonction du contexte commercial, permettant ainsi à tous les utilisateurs de trouver, de comprendre et d’utiliser facilement les données. Partagez vos données, vos modèles d’IA, vos invites et vos ressources d’IA générative en filtrant par noms de tables et de colonnes ou par termes du glossaire métier. Recommandez automatiquement des colonnes applicables et des applications analytiques pertinentes pour chaque jeu de données, afin de pouvoir utiliser les bonnes données pour créer rapidement les bons modèles. Soutenez les modèles de gouvernance centralisés et décentralisés grâce à un partage transparent des données et de l’IA sur la base de flux de travail de publication et d’abonnement au sein d’une expérience unique en cliquant sur « Projects ».

Gagnez en confiance grâce à une visibilité en temps réel de la qualité des données et au lignage des données et du ML dans SageMaker. Automatisez le profilage des données et les recommandations relatives à la qualité des données, surveillez les règles de qualité des données et recevez des alertes. Résolvez les défis complexes en matière de qualité des données en utilisant des approches basées d'une part sur des règles et d'autre part sur le ML pour réconcilier les entités afin de fournir des données de haute qualité qui permettront de prendre des décisions métier en toute confiance. Améliorez la transparence des pipelines de données et des projets d’IA grâce à la surveillance intégrée des modèles pour détecter les biais ou rendre compte de la manière dont les fonctionnalités contribuent à la prédiction modélisée.
Centralisez la sécurité des données et de l’IA dans SageMaker grâce à des contrôles d’accès ultra-précis, à une classification des données et à des barrières de protection pour garantir une utilisation appropriée des données, de l’analytique et des modèles d’IA. Définissez les autorisations une seule fois et appliquez-les à l’ensemble des données et des modèles. Grâce à l’intégration native d’Amazon Bedrock, les clients peuvent utiliser les barrières de protection Amazon Bedrock dans leur application d’IA générative en bloquant le contenu préjudiciable, en filtrant les hallucinations et en activant des mesures de protection personnalisables en matière de confidentialité, de sécurité et de précision. Identifiez automatiquement les informations sensibles dans vos pipelines à l’aide d’Amazon Comprehend.
Respectez les normes d’audit et de conformité réglementaire en matière d’utilisation des données, de consignation et de surveillance des modèles. Favorisez une utilisation acceptable de vos actifs analytiques et d’IA au sein de toute votre entreprise grâce à une isolation basée sur les projets. Comprenez l’utilisation des données et modélisez l’utilisation de votre lakehouse de données pour une sécurité renforcée. Utilisez Amazon SageMaker Clarify pour contrôler les biais, la précision et la robustesse des modèles, conformément à vos normes d’IA responsable. Alignez les coûts sur les initiatives commerciales et obtenez une vision claire de vos investissements commerciaux.

Caractéristiques

Des données sélectionnées pour le contexte et la capacité de localisation

SageMaker Catalog présente un contexte métier à vos métadonnées techniques et vous permet de les enrichir à l’aide du contexte métier. Vous pouvez rendre les données visibles grâce au contexte métier afin que tous vos utilisateurs puissent les trouver, les comprendre et leur faire confiance rapidement et facilement.

Recommandations en matière de métadonnées automatisées

Automatisez l’ajout de descriptions et de noms commerciaux aux données afin de comprendre facilement le contexte et d’éviter d’avoir à utiliser des noms techniques cryptiques. Cette automatisation est alimentée par de grands modèles de langage (LLM) pour une précision et une cohérence accrues.

Garantissez un niveau constant de sécurité de l'IA dans toutes vos applications

Les barrières de protection Amazon Bedrock permettent d’évaluer les entrées des utilisateurs et les réponses des modèles de fondation (FM) en fonction de politiques spécifiques à chaque cas d’utilisation, et fournissent un niveau de protection supplémentaire indépendamment des FM sous-jacents.

Auditez et suivez rapidement les modèles

Auditez et dépannez rapidement les performances de tous les modèles, points de terminaison et tâches de surveillance des modèles grâce à une vue unifiée. Suivez les déviations par rapport au comportement prévu du modèle, ainsi que les tâches de surveillance manquantes ou inactives, grâce à des alertes automatiques.

Qualité des données

Grâce aux statistiques de qualité des données, les consommateurs de données peuvent consulter les métriques de qualité des données provenant d’AWS ou de systèmes tiers. Les consommateurs de données peuvent faire confiance aux sources de données qu’ils utilisent pour prendre des décisions et bénéficier d’un contexte de qualité des données lors de leurs recherches d’actifs. Les producteurs de données et les équipes informatiques peuvent également utiliser des API pour intégrer les statistiques de qualité des données provenant de systèmes tiers dans un portail unifié, hors console.

Lignage des données et du ML

Comprendre l’évolution des données et des modèles au fil du temps. Le lignage peut renforcer la confiance et les connaissances d’une organisation en matière de données et d’IA en aidant les consommateurs de données à comprendre d’où proviennent les données, comment elles ont évolué et leur consommation. Vous pouvez réduire le temps consacré au mappage des données et des ressources d’IA et leurs liens, à dépanner et à développer des pipelines, et à appliquer des pratiques de gouvernance des données et de l’IA.

Clients

CISCO

« Il est important d’avoir accès à vos données, de les partager et de les gérer. Que vous l’appeliez maillage de données ou tissu de données, les données existent au sein de différentes équipes dans de multiples silos, et vous avez besoin d’un moyen de les rassembler. Amazon SageMaker Catalog met en relation les producteurs et les consommateurs de données, permettant aux producteurs de partager des données grâce à des contrôles et des contrats de données intégrés, tout en offrant aux consommateurs la possibilité d’accéder aux données à l’aide des outils de leur choix »

Shaja Arul Selvamani, Directeur principal de l’IA/ML, Cisco

image

Natera, Inc.

« Notre organisation a tiré parti d’Amazon DataZone, de l’IA Amazon SageMaker, d’Amazon Athena et d’Amazon Redshift pour gérer et analyser nos données cliniques et génomiques. Nous sommes ravis de disposer désormais de la gouvernance unifiée de Amazon SageMaker Catalog, qui rationalisera la découverte et l’accès aux données, permettant à notre équipe d’analyser rapidement les données pertinentes dans l’ensemble de notre domaine. Cette intégration nous aidera à créer des jeux de données personnalisés, ce qui pourrait réduire notre délai d’analyse et, en fin de compte, améliorer les résultats pour les patients à mesure que nous progressons vers notre objectif consistant à faire des tests génétiques personnalisés une partie intégrante des soins. »

Mirko Buholzer, vice-président du génie logiciel chez Natera, Inc.

image

NatWest

« Notre équipe d’ingénierie des plateformes de données a déployé de nombreux outils destinés aux utilisateurs finaux pour les tâches d’ingénierie des données, de ML, de SQL et d’IA générative. Dans le but de simplifier les processus au sein de la banque, nous avons cherché à rationaliser l’authentification des utilisateurs et l’autorisation d’accès aux données. Amazon SageMaker propose une expérience utilisateur prête à l’emploi pour nous aider à déployer un environnement unique au sein de l’entreprise, réduisant ainsi d’environ 50 % le temps nécessaire à nos utilisateurs de données pour accéder aux nouveaux outils. »

Zachery Anderson, CDAO, au sein du groupe NatWest

image