Pemrosesan Data HAQM SageMaker menganalisis, menyiapkan, mengintegrasikan, dan mengatur data Anda dengan kemampuan pemrosesan dari HAQM Athena, HAQM EMR, AWS Glue, dan HAQM Managed Workflow for Apache Airflow (MWAA). Anda dapat memanfaatkan kerangka kerja pemrosesan data sumber terbuka, seperti Apache Spark menganalisis data dalam skala besar dengan Trino, dan membangun analitik waktu nyata secara mulus dengan Apache Flink dan Apache Spark.
Pemrosesan Data HAQM SageMaker menyatukan HAQM EMR, HAQM Athena, AWS Glue, dan HAQM Managed Workflows for Apache Airflow.
Pemrosesan Data SageMaker membantu Anda menjelajahi data, membangun pekerjaan transformasi data, mengatur, dan menerapkan pipeline data dalam skala besar. Ini meningkatkan performa, mendorong wawasan yang lebih cepat daripada sistem sumber terbuka tradisional dengan versi Apache Spark, Apache Airflow, Apache Flink, Trino, dan banyak lagi yang kompatibel dengan API hemat biaya dan sumber terbuka. Pemrosesan Data menyediakan akses ke sumber data Anda di HAQM SageMaker Lakehouse melalui integrasi nol-ETL, kemampuan kueri gabungan dan konektor.
Tidak, Anda tidak perlu melakukan migrasi ke HAQM SageMaker. Anda dapat terus menggunakan HAQM EMR, HAQM Athena, AWS Glue, dan HAQM Managed Workflow untuk Apache Airflow seperti yang Anda lakukan saat ini. Namun, sebaiknya Anda memulai dengan HAQM SageMaker untuk memanfaatkan alat terpadu, tata kelola data bawaan, dan arsitektur HAQM SageMaker Lakehouse yang disederhanakan.
Tidak ada dampak terhadap kode, kueri, pekerjaan, dan sumber daya lain yang telah Anda buat dan gunakan dengan HAQM EMR, HAQM Athena, atau AWS Glue. Anda dapat terus memanfaatkan layanan ini untuk beban kerja baru, jika mau. Sumber daya yang dibuat dalam layanan ini, seperti HAQM EMR pada klaster EC2, terlihat di HAQM SageMaker untuk menyederhanakan pengembangan aplikasi analitik dan AI. Pengalaman pengembangan yang ada yang dibangun di HAQM EMR, AWS Glue, dan HAQM Athena akan terus ada selain pengalaman pengembangan baru di HAQM SageMaker.
Versi terbaru dari AWS Glue, Glue 5.0, tersedia di HAQM SageMaker. Glue 5.0 mempercepat beban kerja pemrosesan data dan menghadirkan runtime Apache Spark 3.5.2 terbaru yang dioptimalkan untuk performa sehingga Anda dapat mengembangkan, menjalankan, dan menskalakan untuk wawasan yang lebih cepat. Untuk mempelajari selengkapnya, kunjungi AWS Glue.
Setiap layanan AWS yang Anda gunakan melalui HAQM SageMaker ditagih dengan harga individu masing-masing. Untuk detail selengkapnya, silakan lihat halaman harga AWS untuk HAQM Athena, HAQM EMR, AWS Glue, dan HAQM Managed Workflow Apache Airflow