AWS Germany – Amazon Web Services in Deutschland
Neue generative KI-Funktionen für Amazon DataZone vereinfachen die Erfassung und Katalogisierung von Daten (Vorschau)
von Channy Yun, übersetzt von Pawel Warmuth und David Surey
Im November veröffentlichten wir die Vorschau einer von Künstliche Intelligenz (KI) gestützten Automatisierungsfunktion für Amazon DataZone. Die neue Funktion reduziert die Zeit für die Erkennung von Zusammenhängen in Unternehmensdaten dramatisch. Diese neue Funktion kann den arbeitsintensiven Prozess der Datenkatalogisierung automatisieren. Unterstützt von großen Sprachmodellen (engl. Large Language Models, LLMs) die in Amazon Bedrock zur Verfügung stehen, generiert sie detaillierte Beschreibungen von Daten und deren Schemata und schlägt Analytische Anwendungsfälle vor. Mit nur einem Klick lässt sich nun ein ganzheitlicher Unternehmenskontext zu Ihren Daten erstellen.
Unsere Kunden sagen uns, dass Mitarbeiter wie Datenanalysten, Datenwissenschaftler und Ingenieure in ihren Firmen Probleme haben, die Bedeutung der Daten zu verstehen. Der Grund dafür sind fehlende Zusatzinformationen zu den Daten. Infolgedessen verbringen sie entweder mehr Zeit mit der Interpretation der Daten oder wenden sich mit weiteren Fragen erneut an die ursprünglichen Datenproduzenten. Datenproduzenten wie Datenbesitzer, Ingenieure und Analysten müssen etwas tun. Sie machen die Daten für andere Mitarbeiter verfügbar. Deshalb müssen sie manuell zusätzliche Informationen zu den wichtigsten Daten eingeben. Diese Zusatzinformationen erklären, worum es bei den Daten geht. Nur so können andere Mitarbeiter die Daten verstehen und finden. Dieser zeitaufwändige Prozess ist einer der Hauptprobleme unserer Kunden um Daten in einer Art „Selbstbedienungsladen“ bereitzustellen.
Als wir im Oktober 2023 die allgemeine Verfügbarkeit von Amazon DataZone bekannt gegeben haben [EN], präsentierten wir das erste Feature, das Generative-AI-Fähigkeiten nutzt, um die Generierung von Tabellennamen und Spaltennamen von Unternehmenskatalogbetriebsmitteln zu automatisieren. Im Datenportal von Amazon DataZone zeigt das grüne Gehirn-Symbol automatisch generierte Metadaten-Vorschläge an. Sie können jede von Amazon DataZone empfohlene Vorschlag annehmen, bearbeiten oder ablehnen.
Was ist neu bei der damaligen Ankündigung?
Sie können neben Spalten- und Tabellennamen auch ausführlichere Beschreibungen der Tabelle und des Schemas sowie Verwendungsvorschläge automatisch generieren.
Im Business Metadata-Tab im Datenportal wird beim Auswählen von „Generate Summary“ (Übersicht generieren) wird nun eine Übersicht erstellt, welche Ihre Tabelle und deren Metadaten beschreibt.
Sie können diese Empfehlung annehmen, bearbeiten oder ablehnen.
Wenn Sie die Registerkarte Schema wählen, sehen Sie Empfehlungen für Beschreibung und Namen. Sie können die generierten Metadaten überprüfen und entscheiden, ob Sie die Empfehlung annehmen, bearbeiten oder ablehnen möchten.
Diese neue Funktion wird die Auffindbarkeit von Daten verbessern und zur Reduktion der indifferenten Kommunikation zwischen Datenkonsumenten und -Produzenten beitragen. Ihre Suche wird zukünftig durch tiefere Einblicke in die Daten verbessert.
Probieren sie das neue Feature aus
Die neue Metadaten-Generierungsfunktion wird nun in den AWS-Regionen US East (N. Virginia) und US West (Oregon) vorgestellt. Indem Sie die Datenkatalogisierung mit dieser neuen Generative-AI-Funktion beschleunigen können Sie die Zeit bis zum Erkenntnisgewinn verkürzen und die Datenauffindung verbessern. Um mehr zu erfahren, besuchen Sie Amazon DataZone: Automatisierte Datenauffindung.
Probieren Sie es aus und senden Sie Ihr Feedback an AWS re:Post für Amazon DataZone oder über Ihre üblichen AWS Support-Kontakte.
Über die Autoren
Channy Yun ist Principal Developer Advocate bei AWS und mit Leidenschaft dabei, Entwicklern zu helfen, moderne Anwendungen mit den neuesten AWS-Services zu erstellen. Als pragmatischer Entwickler und Blogger aus Überzeugung liebt er gemeinschaftsgetriebenes Lernen und Teilen von Technologie, was Entwickler zu globalen AWS-Usergroups geführt hat. Seine Hauptthemen sind Open-Source, Container, Speicher, Netzwerk & Sicherheit sowie IoT. Folgen Sie ihm auf Twitter unter @channyun. |