投稿日: Dec 8, 2020
HAQM SageMaker Data Wrangler は、機械学習 (ML) 用のデータを集約して準備するのにかかる時間を数週間から数分に短縮します。HAQM SageMaker Data Wrangler を使用すると、データ準備と特徴エンジニアリングのプロセスを簡素化し、データ選択、クレンジング、探索、視覚化など、データ準備ワークフローの各ステップを単一のビジュアルインターフェイスから実行できます。
ほとんどの ML モデルは、さまざまなソースから得たデータを集約および準備するために数週間から数か月を費やしています。生データを、モデルのトレーニングと予測に使用できる機能に転換、変換、検証します。データをモデルに効率的に使用できる形式に変換できるように、データ変換を作成するためのコードを記述し、多数のデータソースにわたって大規模に実行できる追加のコードを作成する必要があります。これにより、価値の高いタスクにより多くの時間を費やすことができます。
HAQM SageMaker Data Wrangler のデータ選択ツールを使用すると、HAQM S3、HAQM Athena、HAQM Redshift、AWS Lake Formation、HAQM SageMaker モダンアプリケーションなどのさまざまなデータソースから必要なデータを選択し、ワンクリックでインポートすることができます。HAQM SageMaker Data Wrangler には 300 を超える組み込みのデータ変換が含まれているため、コードを記述しなくても、機能をすばやく正規化、変換、および結合できます。HAQM SageMaker Data Wrangler の視覚化テンプレートを使用すると、ML 用の最初の完全統合開発環境 (IDE) である HAQM SageMaker Studio で表示することにより、これらの変換が意図したとおりに完了したことをすばやくプレビューおよび検査できます。データの準備ができたら、HAQM SageMaker Pipelines を使用して完全に自動化された ML ワークフローを構築し、HAQM SageMaker モダンアプリケーションで再利用できるように保存できます。
HAQM SageMaker Data Wrangler は、HAQM SageMaker Studio が利用可能なすべてのリージョンで一般的に利用可能です。HAQM SageMaker Data Wrangler を今すぐ使用するには、ドキュメントをご覧ください。