Veröffentlicht am: Dec 8, 2020

HAQM SageMaker Data Wrangler reduziert den Zeitaufwand für die Zusammenführung und Vorbereitung von Daten für maschinelles Lernen (ML) von Wochen auf Minuten. Mit HAQM SageMaker Data Wrangler können Sie den Prozess der Datenaufbereitung und des Merkmal-Engineerings vereinfachen, und jeden Schritt des Datenaufbereitungs-Arbeitsprozess, einschließlich der Datenauswahl, -bereinigung, -erkundung und -visualisierung, über eine einzige visuelle Oberfläche abschließen. 

Für die meisten ML-Modelle können Sie Wochen oder Monate damit verbringen, Daten aus verschiedenen Quellen zusammenzuführen und vorzubereiten: Konvertieren, Umwandlung und Validieren von Rohdaten in Merkmalen, die zum Trainieren von Modellen und für Vorhersagen verwendet werden können. Sie müssen Code schreiben, um Datenumwandlungen zu verfassen, damit Sie Daten in Formate umwandeln können, die effizient für ein Modell verwendet werden können, und zusätzlichen Code schreiben, der im Maßstab über eine große Anzahl von Datenquellen ausgeführt werden kann - Zeit, die weitaus besser für höherwertige Aufgaben verwendet werden kann.

Mit dem Datenauswahl-Werkzeug von HAQM SageMaker Data Wrangler können Sie die gewünschten Daten aus verschiedenen Datenquellen, einschließlich HAQM S3, HAQM Athena, HAQM Redshift, AWS Lake Formation, und HAQM SageMaker Feature Store, auswählen und mit einem einzigen Klick importieren. HAQM SageMaker Data Wrangler enthält über 300 integrierte Datenumwandlungen, sodass Sie schnell Funktionen normalisieren, umwandeln, und kombinieren können, ohne Code schreiben zu müssen. Mit den Visualisierungsvorlagen von HAQM SageMaker Data Wrangler können Sie in HAQM SageMaker Studio, der ersten vollständig integrierten Entwicklungsumgebung (IDE) für ML, schnell eine Vorschau anzeigen und prüfen, ob diese Umwandlungen wie beabsichtigt abgeschlossen sind. Sobald Ihre Daten vorbereitet sind, können Sie mit HAQM SageMaker Pipelines vollautomatische ML-Arbeitsprozesse erstellen, und diese zur Wiederverwendung im HAQM SageMaker Feature Store speichern.

HAQM SageMaker Data Wrangler ist jetzt allgemein in allen AWS Regionen verfügbar, in denen HAQM SageMaker Studio auch verfügbar ist. Um mit HAQM SageMaker Data Wrangler zu beginnen, besuchen Sie unsere Dokumentation.