ค่าบริการของ SageMaker Lakehouse

HAQM SageMaker Lakehouse รวมข้อมูลทั้งหมดของคุณใน Data Lake ของ HAQM Simple Storage Service (HAQM S3) และคลังข้อมูล HAQM Redshift ซึ่งช่วยให้คุณสร้างการวิเคราะห์และแอปพลิเคชัน AI/ML ที่มีประสิทธิภาพบนสำเนาข้อมูลเดียว SageMaker Lakehouse ให้ความยืดหยุ่นในการเข้าถึงและสืบค้นข้อมูลของคุณด้วยเครื่องมือที่ใช้งานร่วมกันได้กับ Apache Iceberg และเครื่องมืออื่น ๆ ทั้งหมด โดยจะรักษาความปลอดภัยข้อมูลของคุณใน Lakehouse ด้วยการปรับแต่งสิทธิ์แบบละเอียด ซึ่งจะมีการนำไปใช้กับทั่วทุกเครื่องมือและกลไกการวิเคราะห์และแมชชีนเลิร์นนิง (ML) อย่างสอดคล้องกัน นอกเหนือจากประโยชน์เหล่านี้แล้ว คุณยังสามารถเข้าถึงข้อมูลของคุณจากฐานข้อมูลและแอปพลิเคชันด้านการดำเนินงานผ่านการบูรณาการ ETL แบบไร้รอยต่อและข้อมูลทั่วทั้งแหล่งที่มาของบุคคลที่สามผ่านความสามารถในการสืบค้นที่เชื่อมโยงกับส่วนกลางใน Lakehouse

HAQM SageMaker Lakehouse สามารถเข้าถึงได้โดยตรงจากสตูดิโอแบบครบวงจรของ HAQM SageMaker ข้อมูลจากแหล่งต่าง ๆ จะได้รับการจัดระเบียบไว้ในคอนเทนเนอร์เชิงตรรกะที่เรียกว่าแค็ตตาล็อกใน SageMaker Lakehouse แต่ละแค็ตตาล็อกแสดงข้อมูลจากแหล่งที่มาของข้อมูลที่มีอยู่ เช่น คลังข้อมูล และฐานข้อมูลของบุคคลที่สาม หรือสร้างโดยตรงใน Lakehouse เพื่อจัดเก็บข้อมูลใน HAQM S3 หรือ Redshift Managed Storage (RMS) กลไกสืบค้นสามารถเชื่อมต่อกับแค็ตตาล็อกเหล่านี้และเข้าถึงข้อมูลในสถานที่ด้วย Apache Iceberg API ได้ คุณสามารถใช้กลไกที่เข้ากันได้กับที่ใช้งานร่วมกันกับ Apache Iceberg ได้ เช่น Apache Spark, Trino, HAQM Athena หรือ HAQM EMR เพื่อเข้าถึงข้อมูลในรูปแบบตาราง Apache Iceberg และสืบค้นข้อมูลจากกลไกสืบค้นของบุคคลที่หนึ่งและบุคคลที่สาม ในทำนองเดียวกัน แค็ตตาล็อกจะถูกติดตั้งไว้ในกลไกสืบค้นของบุคคลที่หนึ่ง เช่น คลัสเตอร์ HAQM Redshift และเวิร์กกรุ๊ปในรูปแบบฐานข้อมูล เชื่อมต่อกับฐานข้อมูลจากเครื่องมือสืบค้นผ่าน Java Database Connectivity (JDBC) หรือเครื่องมือแก้ไขการสืบค้นข้อมูลของ HAQM Redshift V2 เพื่อสืบค้นโดยใช้ SQL

ราคาของ SageMaker Lakehouse

SageMaker Lakehouse มีองค์ประกอบพื้นฐานดังต่อไปนี้ จะมีค่าใช้จ่ายสำหรับองค์ประกอบที่คุณใช้ใน Lakehouse

ข้อมูลเมตาของ SageMaker Lakehouse: คำจำกัดความของข้อมูลจะได้รับการจัดระเบียบไว้ในลำดับชั้นเชิงตรรกะของแค็ตตาล็อก ฐานข้อมูล และตารางโดยใช้แค็ตตาล็อกข้อมูลของ AWS Glue

  • แค็ตตาล็อก: คอนเทนเนอร์เชิงตรรกะที่เก็บวัตถุจากที่เก็บข้อมูล เช่น สคีมา ตาราง มุมมอง หรือมุมมองผลการสืบค้นจาก HAQM Redshift คุณสามารถซ้อนแค็ตตาล็อกไว้ภายใต้แคตตาล็อกเพื่อให้ตรงกับระดับลำดับชั้นจากแหล่งที่มาของข้อมูลที่คุณนำไปที่ Lakehouse
  • ฐานข้อมูล: สามารถใช้ฐานข้อมูลในการจัดระเบียบอ็อบเจกต์ข้อมูล เช่น ตารางและมุมมองใน Lakehouse
  • ตารางและมุมมอง: ตารางและมุมมองเป็นอ็อบเจกต์ข้อมูลในฐานข้อมูลที่อธิบายวิธีเข้าถึงข้อมูลพื้นฐาน เช่น สคีมา พาร์ติชัน ตำแหน่งที่จัดเก็บข้อมูล รูปแบบการจัดเก็บ และการสืบค้น SQL เพื่อเข้าถึงข้อมูล

ข้อมูลเมตาของ SageMaker Lakehouse สามารถเข้าถึงได้จาก AWS Glue API การจัดเก็บข้อมูลเมตาและคำขอ API จะเป็นไปตามราคาข้อมูลเมตาในแค็ตตาล็อกข้อมูลของ AWS Glue ซึ่งรวมถึง AWS Free Tier ด้วย ดูข้อมูลเพิ่มเติมได้ที่ ราคาของ AWS Glue

พื้นที่เก็บข้อมูลและการเข้าถึง: เมื่อใช้ SageMaker Lakehouse คุณจะสามารถอ่านและเขียนข้อมูลลงใน HAQM S3 หรือ RMS ได้ จะมีค่าใช้จ่ายในการประมวลผลและจัดเก็บข้อมูลเพิ่มเติมสำหรับการเข้าถึงพื้นที่เก็บข้อมูลพื้นฐาน ทั้งนี้จะขึ้นอยู่กับประเภทการจัดเก็บที่คุณเลือกจัดเก็บข้อมูลไว้ใน Lakehouse ดูรายละเอียดเพิ่มเติมเกี่ยวกับราคาพื้นที่เก็บข้อมูลและการประมวลผลสำหรับการจัดเก็บประเภทต่าง ๆ ได้ที่ราคาของ AWS Glue

การบำรุงรักษาตาราง Apache Iceberg และสถิติ: ใน SageMaker Lakehouse คุณสามารถทำให้การเก็บรวบรวมสถิติเกี่ยวกับตาราง Data Lake ใน HAQM S3 เป็นระบบอัตโนมัติ เพื่อให้การดำเนินการสืบค้นและการบำรุงรักษาตาราง Apache Iceberg เร็วขึ้น เช่น การบีบอัด ซึ่งจะช่วยเพิ่มประสิทธิภาพเค้าโครงการจัดเก็บของตาราง Apache Iceberg จะมีค่าบริการเพิ่มเติมเมื่อคุณเปิดใช้งานฟีเจอร์เหล่านี้ ดูข้อมูลเพิ่มเติมได้ที่ ราคาของ AWS Glue

สิทธิ์: สิทธิ์แบบละเอียดใน SageMaker Lakehouse ได้รับการขับเคลื่อนโดย AWS Lake Formation สิทธิ์ใน SageMaker Lakehouse ไม่มีค่าใช้จ่าย ดูรายละเอียดเพิ่มเติมได้ที่ราคาของ Lake Formation

ค่าใช้จ่ายการบูรณาการ ETL แบบไร้รอยต่อ

SageMaker มีการบูรณาการ ETL แบบไร้รอยต่อกับแอปพลิเคชัน ซึ่งจะขจัดความจำเป็นในการสร้างและจัดการไปป์ไลน์กระบวนการ Extract, Transform and Load (ETL) แอปพลิเคชันที่รองรับ ได้แก่ Salesforce, ServiceNow, Zendesk และอื่น ๆ

การผสานรวมเหล่านี้ช่วยให้คุณมีความยืดหยุ่น คุณจึงสามารถเลือกตารางข้อมูลที่เฉพาะเจาะจงในแอปพลิเคชันเพื่อจำลองไปยัง HAQM Redshift โดยอัตโนมัติ ความยืดหยุ่นนี้ทำให้คุณสามารถเรียกใช้การวิเคราะห์แบบครบวงจรกับแอปพลิเคชันและแหล่งที่มาของข้อมูลต่าง ๆ ได้ AWS ไม่เรียกเก็บค่าธรรมเนียมเพิ่มเติมสำหรับการบูรณาการ ETL แบบไร้รอยต่อ คุณจะจ่ายค่าทรัพยากรที่มีอยู่ที่ใช้ในการสร้างและประมวลผลข้อมูลการเปลี่ยนแปลงที่สร้างขึ้นโดยเป็นส่วนหนึ่งของการบูรณาการ ETL แบบไร้รอยต่อ ซึ่งรวมถึงพื้นที่เก็บข้อมูล HAQM Redshift เพิ่มเติมสำหรับการจัดเก็บข้อมูลจำลอง ทรัพยากรการประมวลผลสำหรับการประมวลผลการจำลองข้อมูล (หรือ RPU บน HAQM Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์) และค่าใช้จ่ายในการถ่ายโอนข้อมูล Cross-AZ สำหรับการย้ายข้อมูลจากต้นทางไปยังเป้าหมาย การประมวลผลการเปลี่ยนแปลงข้อมูลอย่างต่อเนื่องโดยการบูรณาการ ETL แบบไร้รอยต่อจะไม่มีค่าใช้จ่ายเพิ่มเติม ดูข้อมูลเพิ่มเติมได้ที่ราคาของ HAQM Aurora ราคา HAQM Relational Database (HAQM RDS) สำหรับ MySQL ราคาของ HAQM DynamoDB และ AWS Glue