การประมวลผลข้อมูลของ HAQM SageMaker จะวิเคราะห์ จัดเตรียม และจัดระเบียบข้อมูลของคุณด้วยความสามารถในการประมวลผลจาก HAQM Athena, HAQM EMR, AWS Glue และเวิร์กโฟลว์ที่มีการจัดการของ HAQM สำหรับ Apache Airflow (MWAA) คุณสามารถใช้ประโยชน์จากเฟรมเวิร์กการประมวลผลข้อมูลแบบโอเพนซอร์ส เช่น Apache Spark เพื่อวิเคราะห์ข้อมูลในวงกว้างด้วย Trino และสร้างการวิเคราะห์แบบเรียลไทม์ได้อย่างราบรื่นด้วย Apache Flink และ Apache Spark
การประมวลผลข้อมูลของ HAQM SageMaker จะรวบรวม HAQM EMR, HAQM Athena, AWS Glue และ HAQM Managed Workflows สำหรับ Apache Airflow เข้าด้วยกัน
การประมวลผลข้อมูลของ SageMaker ช่วยให้คุณสำรวจข้อมูล สร้างงานแปลงข้อมูล จัดระเบียบ และปรับใช้ท่อส่งข้อมูลตามขนาดที่ต้องการ ซึ่งช่วยปรับปรุงประสิทธิภาพ ขับเคลื่อนข้อมูลเชิงลึกได้รวดเร็วกว่าระบบโอเพนซอร์สแบบดั้งเดิมด้วยเวอร์ชันของ Apache Spark, Apache Airflow, Apache Flink, Trino และอื่น ๆ ที่คุ้มต้นทุนและเข้ากันได้กับ API โอเพนซอร์ส การประมวลผลข้อมูลช่วยให้คุณเข้าถึงแหล่งที่มาของข้อมูลใน HAQM SageMaker Lakehouse ผ่านการบูรณาการ ETL แบบไร้รอยต่อ ความสามารถในการสืบค้นแบบรวม และตัวเชื่อมต่อ
ไม่ คุณไม่จำเป็นต้องโอนย้ายไปยัง HAQM SageMaker คุณสามารถใช้ HAQM EMR, HAQM Athena, AWS Glue และ HAQM Managed Workflow สำหรับ Apache Airflow ได้ต่อไปเช่นเดียวกับที่คุณทำในปัจจุบัน อย่างไรก็ตาม เราขอแนะนำให้คุณเริ่มต้นใช้งาน HAQM SageMaker เพื่อใช้ประโยชน์จากเครื่องมือ การกำกับดูแลข้อมูลในตัว และสถาปัตยกรรม HAQM SageMaker Lakehouse แบบครบวงจรที่เรียบง่าย
โค้ด การสืบค้น งาน และทรัพยากรอื่น ๆ ที่คุณสร้างและใช้กับ HAQM EMR, HAQM Athena หรือ AWS Glue ในปัจจุบันจะไม่ได้รับผลกระทบ คุณสามารถใช้ประโยชน์จากบริการเหล่านี้ต่อไปสำหรับเวิร์กโหลดใหม่ได้หากคุณต้องการ ทรัพยากรที่สร้างขึ้นในบริการเหล่านี้ เช่น HAQM EMR บนคลัสเตอร์ EC2 สามารถมองเห็นได้ใน HAQM SageMaker เพื่อลดความซับซ้อนในการพัฒนาแอปพลิเคชันการวิเคราะห์และ AI โดยประสบการณ์การพัฒนาที่มีอยู่ซึ่งสร้างขึ้นใน HAQM EMR, AWS Glue และ HAQM Athena จะยังคงมีอยู่เพิ่มเติมจากประสบการณ์การพัฒนาใหม่ภายใน HAQM SageMaker
AWS Glue เวอร์ชันล่าสุดอย่าง Glue 5.0 มีให้บริการใน HAQM SageMaker แล้ว Glue 5.0 เร่งปริมาณงานการประมวลผลข้อมูลและส่งมอบรันไทม์ Apache Spark 3.5.2 ที่ปรับให้เหมาะสมกับประสิทธิภาพล่าสุดเพื่อให้คุณสามารถพัฒนา เรียกใช้ และปรับขนาดเพื่อข้อมูลเชิงลึกที่รวดเร็วขึ้น หากต้องการเรียนรู้เพิ่มเติม โปรดไปที่ AWS Glue
บริการ AWS แต่ละรายการที่คุณใช้ผ่าน HAQM SageMaker นั้นมีการกำหนดราคาแยกต่างหาก หากต้องการดูรายละเอียดเพิ่มเติม โปรดดูหน้าราคา AWS สำหรับ HAQM Athena, HAQM EMR, AWS Glue และเวิร์กโฟลว์ที่มีการจัดการของ HAQM สำหรับ Apache Airflow