Was ist Feature Engineering?
Modell-Features sind die Eingaben, mit denen Machine Learning (ML)-Modelle während des Trainings und der Inferenz Vorhersagen treffen. Die Genauigkeit des ML-Modells hängt von einer präzisen Zusammenstellung und Komposition der Funktionen ab. In einer ML-Anwendung, die eine Musik-Wiedergabeliste empfiehlt, könnten die Funktionen beispielsweise Song-Bewertungen, die zuvor angehörten Songs und die Hördauer der Songs umfassen. Die Erstellung von Funktionen kann einen erheblichen technischen Aufwand erfordern. Beim Feature Engineering werden Variablen aus Rohdaten wie Preislisten, Produktbeschreibungen und Absatzmengen extrahiert und umgewandelt, damit Funktionen für das Training und die Vorhersage verwendet werden können. Die für die Entwicklung von Funktionen erforderlichen Schritte umfassen die Datenextraktion und -bereinigung sowie die Erstellung und Speicherung von Funktionen.
Was sind die Herausforderungen beim Feature Engineering?
Feature Engineering ist herausfordernd, da es eine Kombination aus Datenanalyse, Fachwissen und etwas Intuition erfordert. Bei der Erstellung von Funktionen ist es verlockend, sofort auf verfügbare Daten zurückzugreifen, aber oft sollten Sie zunächst überlegen, welche Daten benötigt werden, indem Sie mit Experten sprechen, ein Brainstorming durchführen und Nachforschungen bei Dritten anstellen. Wenn Sie das nicht erledigen, könnten Sie wichtige Prädiktoren übersehen.
Datenextrahierung
Funktionserstellung
Funktionsspeicherung
Wie kann AWS beim Feature Engineering helfen?
Mit Amazon SageMaker Data Wrangler können Sie den Prozess des Feature Engineering über eine einzige visuelle Benutzeroberfläche vereinfachen. Mit dem Datenauswahl-Tool von SageMaker Data Wrangler können Sie die gewünschten Rohdaten aus verschiedenen Datenquellen auswählen und mit einem einzigen Klick importieren. SageMaker Data Wrangler enthält über 300 integrierte Datenumwandlungen, sodass Sie schnell Funktionen normalisieren, umwandeln, und kombinieren können, ohne Code schreiben zu müssen. Nachdem Ihre Daten vorbereitet sind, können Sie mit Amazon SageMaker Pipelines vollautomatische ML-Arbeitsprozesse erstellen, und diese zur Wiederverwendung im Amazon SageMaker Feature Store speichern. SageMaker Feature Store ist ein speziell entwickeltes Repository, in dem Sie Funktionen speichern und darauf zugreifen können, sodass es einfacher ist, sie zu benennen, zu organisieren und teamübergreifend wiederzuverwenden. SageMaker Feature Store bietet einen einheitlichen Speicher für Funktionen während des Trainings und der Echtzeit-Inferenz, ohne dass Sie zusätzlichen Code schreiben oder manuelle Prozesse erstellen müssen, um die Funktionen konsistent zu halten.
Nächste Schritte auf AWS
Sie erhalten sofort Zugriff auf das kostenlose Kontingent von AWS.
Starten Sie mit der Entwicklung in der AWS-Managementkonsole.