คำถามที่พบบ่อยเกี่ยวกับ HAQM Redshift
หัวข้อของหน้า
ข้อมูลทั่วไปข้อมูลทั่วไป
เปิดทั้งหมดHAQM Redshift คืออะไร
ลูกค้าหลายหมื่นรายใช้ HAQM Redshift ทุกวันเพื่อเรียกใช้การวิเคราะห์ SQL ในระบบคลาวด์ในการประมวลผลข้อมูลระดับเอกซะไบต์เพื่อให้ได้ข้อมูลเชิงลึกทางธุรกิจ ไม่ว่าข้อมูลที่มีปริมาณมากขึ้นเรื่อยๆ ของคุณจะถูกจัดเก็บไว้ในที่เก็บข้อมูลการดำเนินงาน, Data Lake, บริการข้อมูลสตรีม หรือชุดข้อมูลของบริษัทอื่น HAQM Redshift ก็สามารถช่วยคุณเข้าถึง ผสานรวม และแชร์ข้อมูลอย่างปลอดภัยโดยมีการโอนย้ายหรือคัดลอกน้อยที่สุด HAQM Redshift จะผสานการทำงานกับฐานข้อมูล AWS, การวิเคราะห์ และบริการแมชชีนเลิร์นนิงอย่างล้ำลึกเพื่อนำวิธีการ Zero-ETL มาใช้ หรือช่วยคุณเข้าถึงข้อมูลที่มีอยู่เพื่อใช้ในการวิเคราะห์ในแบบเกือบเรียลไทม์ สร้างโมเดลแมชชีนเลิร์นนิงใน SQL และเปิดใช้การวิเคราะห์ของ Apache Spark โดยใช้ข้อมูลใน Redshift HAQM Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ช่วยให้วิศวกร นักพัฒนา นักวิทยาศาสตร์ข้อมูล และนักวิเคราะห์สามารถเริ่มต้นทำงานได้ง่ายๆ และปรับขนาดการวิเคราะห์ได้อย่างรวดเร็วในสภาพแวดล้อมที่ไม่ต้องมีการบริหารจัดการ ด้วยกลไก Massively Parallel Processing (MPP) และสถาปัตยกรรมที่แยกการประมวลผลและการจัดเก็บข้อมูลออกจากกันเพื่อให้ได้นวัตกรรมการทำงานที่มีประสิทธิภาพ ปรับขนาดได้ และขับเคลื่อนด้วยแมชชีนเลิร์นนิง (ตัวอย่างเช่น AutoMaterialized Views) HAQM Redshift สร้างขึ้นมาเพื่อการปรับขนาดและมอบประสิทธิภาพการทำงานในราคาคุ้มค่ากว่าถึง 5 เท่าเมื่อเทียบกับคลังข้อมูลบนระบบคลาวด์อื่นๆ
เหตุผลหลักที่ลูกค้าเลือกใช้ HAQM Redshift มีอะไรบ้าง
ลูกค้าหลายพันรายเลือกใช้ HAQM Redshift เพื่อเร่งเวลารับข้อมูลเชิงลึก เนื่องจากเป็นระบบการวิเคราะห์ที่มีประสิทธิภาพที่ผสานการทำงานได้ดีกับฐานข้อมูลและบริการแมชชีนเลิร์นนิง จึงทำให้การใช้งานดียิ่งขึ้น และสามารถใช้เป็นบริการศูนย์กลางในการส่งมอบผลลัพธ์ตามความต้องการด้านการวิเคราะห์ HAQM Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ช่วยจัดเตรียมและปรับขนาดความจุคลังข้อมูลโดยอัตโนมัติเพื่อมอบประสิทธิภาพระดับสูงสำหรับเวิร์กโหลดที่ใช้ทรัพยากรมากและคาดเดาไม่ได้ HAQM Redshift มอบประสิทธิภาพชั้นนำที่คุ้มกับราคาสำหรับเวิร์กโหลดการวิเคราะห์ที่หลากหลาย ไม่ว่าจะเป็นการทำแดชบอร์ด การพัฒนาแอปพลิเคชัน การแชร์ข้อมูล งาน ETL (Extract, Transform, Load) และอื่นๆ อีกมากมาย เนื่องจากมีลูกค้าหลายหมื่นรายที่เรียกใช้การวิเคราะห์ข้อมูลในระดับเทระไบต์ไปจนถึงเพตะไบต์ HAQM Redshift จึงช่วยเพิ่มประสิทธิภาพเวิร์กโหลดให้กับลูกค้าในสภาพแวดล้อมจริงโดยอิงจากการตรวจวัดประสิทธิภาพระยะไกลของกลุ่มอินสแตนซ์ และส่งมอบการทำงานที่ปรับขนาดเวิร์กโหลดได้ในเชิงเส้นในขณะควบคุมต้นทุนให้ต่ำอยู่เสมอ นวัตกรรมการทำงานที่ทันสมัยนี้มีให้บริการลูกค้าโดยไม่มีค่าใช้จ่ายเพิ่มเติม HAQM Redshift ช่วยให้คุณได้รับข้อมูลเชิงลึกจากการเรียกใช้การวิเคราะห์เชิงคาดการณ์แบบเรียลไทม์ในส่วนข้อมูลทั้งหมดทั่วทั้งฐานข้อมูลเชิงปฏิบัติการ, Data Lake, คลังข้อมูล, ข้อมูลการสตรีม และชุดข้อมูลของบุคคลภายนอก HAQM Redshift ยังรองรับความปลอดภัยระดับชั้นนำของอุตสาหกรรมด้วยการผสานรวมการจัดการข้อมูลระบุตัวตนและระบบเชื่อมโยงข้อมูลสำหรับการเข้าสู่ระบบครั้งเดียว (SSO), การยืนยันตัวตนโดยใช้หลายปัจจัย (MFA), การควบคุมการเข้าถึงระดับคอลัมน์, การรักษาความปลอดภัยระดับแถว, การควบคุมการเข้าถึงตามบทบาท, HAQM Virtual Private Cloud (HAQM VPC) และการปรับขนาดคลัสเตอร์ที่เร็วขึ้น
HAQM Redshift ช่วยให้การจัดการคลังข้อมูลและการวิเคราะห์เป็นเรื่องง่ายขึ้นได้อย่างไร
HAQM Redshift ได้รับการจัดการอย่างเต็มรูปแบบโดย AWS ดังนั้นคุณจึงไม่ต้องกังวลไปกับงานการจัดการคลังข้อมูลอีกต่อไป เช่น การจัดเตรียมฮาร์ดแวร์ การแพตช์ซอฟต์แวร์ การตั้งค่า การกำหนดค่า การตรวจสอบโหนดและไดรฟ์เพื่อกู้คืนจากความล้มเหลว หรือการสำรองข้อมูล AWS จะคอยจัดการงานที่จำเป็นในการตั้งค่า ดำเนินการ และปรับขนาดคลังข้อมูลในนามของคุณ ช่วยให้คุณให้ความสำคัญกับการสร้างแอปพลิเคชันของคุณได้เต็มที่ HAQM Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ช่วยจัดเตรียมและปรับขนาดความจุคลังข้อมูลโดยอัตโนมัติ เพื่อมอบประสิทธิภาพระดับสูงสำหรับปริมาณงานที่ใช้ทรัพยากรมากและคาดเดาไม่ได้ และคุณจ่ายเฉพาะทรัพยากรที่คุณใช้เท่านั้น HAQM Redshift ยังมีความสามารถในการปรับค่าอัตโนมัติและแสดงคำแนะนำสำหรับการจัดการคลังเก็บข้อมูลของคุณใน Redshift Advisor อีกด้วย สำหรับ Redshift Spectrum นั้น HAQM Redshift ช่วยจัดการโครงสร้างพื้นฐานของการประมวลผลทั้งหมด การปรับสมดุลโหลด การวางแผน การกำหนดเวลา และการดำเนินการสืบค้นข้อมูลที่จัดเก็บไว้ใน HAQM S3 HAQM Redshift ช่วยให้คุณสามารถวิเคราะห์ข้อมูลทั้งหมดได้ด้วยการผสานการทำงานอย่างราบรื่นในบริการฐานข้อมูล พร้อมมีคุณสมบัติต่างๆ เช่น HAQM Aurora Zero-ETL ไปจนถึง HAQM Redshift และการสืบค้นแบบรวมไปจนถึงการเข้าถึงข้อมูลที่มีอยู่จากฐานข้อมูลเชิงปฏิบัติการอย่าง HAQM RDS และ Data Lake ของ HAQM S3 Redshift ช่วยให้สามารถนำข้อมูลเข้าอย่างมีประสิทธิภาพโดยไม่ต้องใช้โค้ด เป็นไปป์ไลน์ข้อมูลแบบอัตโนมัติที่นำเข้าข้อมูลการสตรีมหรือไฟล์จาก HAQM S3 โดยอัตโนมัติ Redshift ยังผสานการทำงานกับ AWS Data Exchange ช่วยให้ผู้ใช้สามารถค้นหา สมัครรับข้อมูล และสืบค้นชุดข้อมูลของบุคคลภายนอก และผสานรวมเข้ากับข้อมูลของตนเพื่อให้ได้ข้อมูลเชิงลึกที่ครบถ้วนครอบคลุม การผสานรวมการทำงานในตัวลงใน HAQM SageMaker ช่วยให้ลูกค้าสามารถดำเนินการได้จากคลังข้อมูลของตน และสร้าง ฝึกฝน และออกแบบโมเดลแมชชีนเลิร์นนิงใน SQL HAQM Redshift ตอบสนองความต้องการด้านการวิเคราะห์ SQL ทั้งหมดซึ่งมีความคุ้มค่ากว่าคลังข้อมูลบนระบบคลาวด์อื่นๆ ถึง 5 เท่า
มีตัวเลือกการนำไปใช้จริงใดบ้างสำหรับ HAQM Redshift
HAQM Redshift เป็นบริการที่มีการจัดการเต็มรูปแบบและมีตัวเลือกทั้งแบบเตรียมใช้งานและแบบไม่ต้องใช้เซิร์ฟเวอร์ ซึ่งช่วยให้การเรียกใช้และการปรับขนาดการวิเคราะห์มีประสิทธิภาพยิ่งขึ้นโดยไม่ต้องจัดการคลังข้อมูลของคุณ คุณสามารถเรียกใช้งานตำแหน่งข้อมูล HAQM Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์โฉมใหม่เพื่อเตรียมใช้งานคลังข้อมูลโดยอัตโนมัติในไม่กี่วินาที หรือคุณสามารถเลือกตัวเลือกที่มีการเตรียมใช้งานสำหรับเวิร์กโหลดที่คาดเดาได้ก็ได้
ฉันจะเริ่มต้นใช้งาน HAQM Redshift ได้อย่างไร
คุณสามารถเริ่มสืบค้นข้อมูลได้เพียงไม่กี่ขั้นตอนในคอนโซลการจัดการของ AWS คุณสามารถใช้ประโยชน์จากชุดข้อมูลตัวอย่างที่โหลดไว้ล่วงหน้า ซึ่งรวมถึงชุดข้อมูลวัดประสิทธิภาพ TPC-H, TPC-DS และตัวอย่างการสืบค้นอื่นๆ เพื่อเริ่มการวิเคราะห์ได้ทันที หากต้องการเริ่มต้นใช้งาน HAQM Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ ให้เลือก “ลองใช้ HAQM Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์” และเริ่มสืบค้นข้อมูล เริ่มต้นที่นี่
ประสิทธิภาพของ HAQM Redshift กับคลังข้อมูลอื่น ๆ แตกต่างกันอย่างไร
ผลการวัดประสิทธิภาพ TPC-DS แสดงให้เห็นว่า HAQM Redshift มีความคุ้มค่าที่สุดตั้งแต่แรกเริ่ม แม้จะใช้ชุดข้อมูลขนาด 3 TB ที่ค่อนข้างเล็กก็ตาม HAQM Redshift มีความคุ้มค่ากว่าคลังข้อมูลบนระบบคลาวด์อื่นๆ ถึง 5 เท่า ซึ่งหมายความว่าคุณจะได้รับประโยชน์จากความคุ้มค่าระดับชั้นนำของ HAQM Redshift นี้ตั้งแต่แรกเริ่มโดยไม่ต้องปรับแต่งอะไรเองเลย จากประสิทธิภาพการตรวจวัดระยะไกลในกลุ่มอินสแตนซ์ของเรา เรายังทราบอีกว่าเวิร์กโหลดส่วนใหญ่นั้นเป็นเวิร์กโหลดการสืบค้นระยะสั้น (เวิร์กโหลดที่ทำงานน้อยกว่า 1 วินาที) สำหรับเวิร์กโหลดเหล่านี้ เกณฑ์มาตรฐานล่าสุดแสดงให้เห็นว่า HAQM Redshift มีความคุ้มค่ากว่าคลังข้อมูลบนระบบคลาวด์อื่นๆ ถึง 7 เท่า ทั้งด้านการทำงานพร้อมกันในระดับสูงและเวิร์กโหลดที่มีเวลาแฝงต่ำ เรียนรู้เพิ่มเติมที่นี่
ฉันสามารถรับความช่วยเหลือเพื่อเรียนรู้เพิ่มเติมและเริ่มต้นใช้งาน HAQM Redshift ได้หรือไม่
ได้ ผู้เชี่ยวชาญของ HAQM Redshift พร้อมตอบคำถามต่างๆ และให้การสนับสนุน โปรดติดต่อเรา แล้วคุณจะได้รับการติดต่อกลับจากเราภายในหนึ่งวันทำการเพื่อพูดคุยว่า AWS สามารถช่วยเหลือองค์กรของคุณอย่างไรได้บ้าง
HAQM Redshift Managed Storage คืออะไร
HAQM Redshift Managed Storage มีให้เลือกใช้แบบไร้เซิร์ฟเวอร์และมาพร้อมกับประเภทโหนด RA3 ช่วยให้คุณสามารถปรับขนาดและจ่ายค่าบริการสำหรับการประมวลผลและพื้นที่จัดเก็บแยกกันได้ ซึ่งทำให้คุณสามารถกำหนดขนาดของคลัสเตอร์ตามความต้องการในการประมวลผลของคุณเพียงอย่างเดียว โดยจะใช้พื้นที่จัดเก็บเฉพาะที่ SSD ประสิทธิภาพสูงเป็นแคชชั้นที่ 1 โดยอัตโนมัติ และใช้ประโยชน์ของการปรับประสิทธิภาพให้เหมาะสม เช่น อุณหภูมิของบล็อกข้อมูล อายุของบล็อกข้อมูล และรูปแบบของปริมาณงานเพื่อการทำงานมีประสิทธิภาพสูงในขณะที่ปรับขนาดพื้นที่จัดเก็บไปยัง HAQM S3 โดยอัตโนมัติเมื่อจำเป็นโดยไม่ต้องดำเนินการใดๆ
ฉันจะใช้พื้นที่จัดเก็บที่มีการจัดการของ HAQM Redshift อย่างไร
หากคุณใช้โหนด HAQM Redshift Dense Storage หรือ Dense Compute อยู่แล้ว คุณสามารถใช้ Elastic Resize เพื่ออัปเกรดคลัสเตอร์ที่มีอยู่เดิมให้เป็นอินสแตนซ์การประมวล RA3 แบบใหม่ได้ HAQM Redshift Serverless และคลัสเตอร์ที่ใช้อินสแตนซ์ RA3 จะใช้พื้นที่จัดเก็บที่มีการจัดการโดย Redshift โดยอัตโนมัติเพื่อจัดเก็บข้อมูล โดยไม่จำเป็นต้องดำเนินการอื่นใดนอกเหนือจากการใช้ HAQM Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ หรืออินสแตนซ์ RA3 เพื่อใช้คุณสมบัตินี้
ฉันจะเรียกใช้การสืบค้นจาก Redshift สำหรับข้อมูลที่จัดเก็บไว้ใน AWS Data Lake ได้อย่างไร
HAQM Redshift Spectrum เป็นคุณสมบัติหนึ่งของ HAQM Redshift ที่ให้คุณสามารถเรียกใช้การสืบค้นกับ Data Lake ใน HAQM S3 ได้โดยไม่ต้องมีการโหลดข้อมูลหรือ ETL เมื่อสร้างการสืบค้น SQL ระบบจะส่งการสืบค้นนั้นไปยังตำแหน่งข้อมูลของ HAQM Redshift ซึ่งจะสร้างและปรับแผนการสืบค้นให้ดีขึ้น HAQM Redshift จะระบุว่าข้อมูลใดอยู่ในเครื่องและข้อมูลใดอยู่ใน HAQM S3 แล้วสร้างแผนในการลดจำนวนข้อมูล S3 ที่ต้องอ่านให้น้อยที่สุด จากนั้นส่งคำขอโปรแกรมทำงานของ HAQM Redshift Spectrum จากแหล่งทรัพยากรร่วมเพื่ออ่านและประมวลผลข้อมูลจาก HAQM S3
ฉันควรพิจารณาใช้อินสแตนซ์ RA3 เมื่อใด
พิจารณาเลือกใช้โหนด RA3 ในกรณีต่อไปนี้
- คุณต้องการความยืดหยุ่นในการปรับขนาดและจ่ายค่าบริการประมวลผลแยกกับพื้นที่จัดเก็บ
- คุณสืบค้นข้อมูลเพียงส่วนหนึ่งของข้อมูลทั้งหมด
- ปริมาณข้อมูลของคุณเพิ่มขึ้นอย่างรวดเร็วหรือคาดว่าจะเพิ่มขึ้นอย่างรวดเร็ว
- คุณต้องการความยืดหยุ่นในการปรับขนาดคลัสเตอร์ตามความต้องการด้านประสิทธิภาพของคุณเท่านั้น
เมื่อข้อมูลเพิ่มขึ้นเรื่อยๆ ไปจนถึงระดับเพตะไบต์ ปริมาณข้อมูลที่คุณนำเข้าไปยังคลังข้อมูล HAQM Redshift ของคุณก็จะเพิ่มขึ้นด้วยเช่นกัน คุณอาจกำลังมองหาวิธีที่จะวิเคราะห์ข้อมูลทั้งหมดของคุณอย่างคุ้มค่า
อินสแตนซ์ RA3 ของ HAQM Redshift โฉมใหม่พร้อมพื้นที่จัดเก็บที่มีการจัดการ ช่วยให้คุณสามารถเลือกจำนวนโหนดโดยขึ้นอยู่กับข้อกำหนดด้านประสิทธิภาพการทำงาน และจ่ายค่าบริการเฉพาะพื้นที่จัดเก็บข้อมูลที่มีการจัดการซึ่งคุณใช้งานเท่านั้น ซึ่งช่วยให้คุณมีความยืดหยุ่นในการกำหนดขนาดคลัสเตอร์ RA3 ของคุณตามปริมาณข้อมูลที่คุณประมวลผลในแต่ละวันโดยไม่เพิ่มค่าใช้จ่ายด้านพื้นที่จัดเก็บข้อมูลแต่อย่างใด อินสแตนซ์ RA3 ที่สร้างขึ้นบน AWS Nitro System พร้อมพื้นที่จัดเก็บที่มีการจัดการจะใช้ SSD ประสิทธิภาพสูงสำหรับข้อมูล Hot (ข้อมูลที่เข้าถึงบ่อย) และใช้ HAQM S3 สำหรับข้อมูล Cold (ข้อมูลที่เข้าถึงไม่บ่อย) ซึ่งใช้งานได้ง่าย จัดเก็บข้อมูลได้คุ้มค่า และสืบค้นได้รวดเร็ว
คุณสมบัติใดบ้างที่ฉันสามารถใช้เพื่อการวิเคราะห์ตามตำแหน่งได้
HAQM Redshift Spatial มีการวิเคราะห์ข้อมูลเชิงลึกจำนวนมากตามตำแหน่งกับข้อมูลของคุณ ซึ่งรวมข้อมูลเชิงพื้นที่และข้อมูลธุรกิจได้อย่างราบรื่นในการวิเคราะห์เพื่อการตัดสินใจ HAQM Redshift เปิดตัวการสนับสนุนการประมวลผลข้อมูลเชิงพื้นที่แบบเนทีฟในเดือนพฤศจิกายน 2019 โดยมีประเภทข้อมูลพหุสันฐาน GEOMETRY และฟังก์ชันเชิงพื้นที่ SQL ที่สำคัญหลายรายการ ขณะนี้เรารองรับประเภทข้อมูล GEOGRAPHY และไลบรารีฟังก์ชันเชิงพื้นที่ SQL ของเราได้เติบโตขึ้นเป็น 80 เรารองรับประเภทข้อมูลและมาตรฐานเชิงพื้นที่ทั่วไปทั้งหมด รวมถึง Shapefiles, GeoJSON, WKT, WKB, eWKT และ eWKB หากต้องการเรียนรู้เพิ่มเติม โปรดไปที่หน้า เอกสารประกอบ หรือหน้า บทแนะนำสอนการใช้งาน HAQM Redshift Spatial
SQL ของ Athena มีการรองรับการใช้งานอย่างไรเทียบกับ Redshift และฉันควรจะเลือกอะไรระหว่างบริการทั้งสองนี้
HAQM Athena และ HAQM Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ ตอบสนองความต้องการและกรณีการใช้งานที่แตกต่างกันแม้ว่าทั้งสองบริการจะเป็นแบบไม่ต้องใช้เซิร์ฟเวอร์และให้บริการแก่ผู้ใช้ SQL ก็ตาม
ด้วยสถาปัตยกรรม Massively Parallel Processing (MPP) ที่แยกที่จัดเก็บและการประมวลผลออกจากกัน รวมถึงความสามารถในการปรับประสิทธิภาพอัตโนมัติที่สนับสนุนโดยแมชชีนเลิร์นนิง คลังข้อมูลอย่าง HAQM Redshift ไม่ว่าจะเป็นแบบไม่ต้องใช้เซิร์ฟเวอร์หรือแบบเตรียมใช้งาน ก็ล้วนเป็นตัวเลือกที่ยอดเยี่ยมสำหรับลูกค้าที่ต้องการประสิทธิภาพการทำงานที่คุ้มราคาในทุกขนาดการใช้งานสำหรับเวิร์กโหลด BI และการวิเคราะห์ข้อมูลที่ซับซ้อน ลูกค้าสามารถใช้ HAQM Redshift เป็นองค์ประกอบศูนย์กลางของสถาปัตยกรรมข้อมูลที่มีการผสานการทำงานขั้นละเอียดพร้อมให้เข้าถึงข้อมูลที่มีอยู่ หรือนำเข้าหรือย้ายข้อมูลลงในคลังข้อมูลได้ง่ายๆ เพื่อการวิเคราะห์ข้อมูลที่มีประสิทธิภาพสูงผ่าน ZeroETL และไม่ต้องใช้โค้ด ลูกค้าสามารถเข้าถึงข้อมูลที่จัดเก็บไว้ใน HAQM S3, ฐานข้อมูลเชิงปฏิบัติการอย่าง Aurora และ HAQM RDS, คลังข้อมูลของบุคคลภายนอกผ่านการผสานการทำงานกับ AWS Data Exchange และผสานรวมกับข้อมูลที่จัดเก็บไว้ในคลังข้อมูล HAQM Redshift เพื่อการวิเคราะห์ข้อมูล ผู้ใช้สามารถเริ่มต้นการจัดทำคลังข้อมูลได้ง่ายๆ และดำเนินการแมชชีนเลิร์นนิงเพิ่มเติมจากข้อมูลทั้งหมดนี้ด้วย
HAQM Athena เหมาะสำหรับใช้ในการวิเคราะห์เชิงโต้ตอบและการสำรวจข้อมูลที่อยู่ใน Data Lake หรือแหล่งที่มาของข้อมูลใดๆ ผ่านเฟรมเวิร์กส่วนเชื่อมต่อแบบขยายได้ (รวมถึงตัวเชื่อมต่อที่ใช้งานได้ฟรีทันทีกว่า 30 รายการสำหรับแอปพลิเคชันและระบบการวิเคราะห์ข้อมูลในสถานที่หรือบนระบบคลาวด์อื่นๆ) โดยไม่ต้องกังวลถึงการนำเข้าหรือประมวลผลข้อมูล HAQM Athena สร้างขึ้นบนเครื่องมือและเฟรมเวิร์กแบบโอเพนซอร์ส เช่น Spark, Presto และ Apache Iceberg ลูกค้าจึงมีความยืดหยุ่นในการใช้ Python หรือ SQL หรือทำงานกับข้อมูลรูปแบบเปิด หากลูกค้าต้องการวิเคราะห์ข้อมูลเชิงโต้ตอบโดยใช้เฟรมเวิร์กและข้อมูลรูปแบบโอเพนซอร์ส HAQM Athena ถือเป็นการเริ่มต้นที่ยอดเยี่ยม
ความยืดหยุ่นในด้านขนาดมีผลกับโหนด Redshift Reserved หรือไม่
ไม่ อินสแตนซ์ Redshift Reserved นั้นไม่มีความยืดหยุ่น และมีผลกับประเภทโหนดที่แน่นอนที่คุณสำรองไว้เท่านั้น
การวิเคราะห์ SQL ของ HAQM SageMaker
เปิดทั้งหมดประโยชน์ของการใช้ Redshift ใน SageMaker สำหรับการวิเคราะห์ SQL มีอะไรบ้าง
SageMaker ช่วยลดความยุ่งยากในการวิเคราะห์ SQL ด้วยการจัดหาแพลตฟอร์มที่ครอบคลุมและใช้งานง่ายซึ่งเชื่อมต่อแหล่งที่มาของข้อมูลหลายแหล่งและปรับปรุงการสำรวจข้อมูล ด้วยอินเทอร์เฟซสไตล์โน้ตบุ๊คที่ยืดหยุ่น คุณสามารถเข้าถึงข้อมูลจาก HAQM Simple Storage Service (HAQM S3), HAQM Redshift และแหล่งที่มาของข้อมูลอื่น ๆ รวมถึงเขียนและเรียกใช้การสืบค้นในเอ็นจิ้นต่าง ๆ และสร้างภาพรวมภายในเครื่องมือโดยตรง แพลตฟอร์มจะจัดการข้อมูลเมตาของคุณโดยอัตโนมัติ ทำให้สามารถเข้าใจและค้นพบข้อมูลได้ง่ายขึ้น การผสานรวมกับบริการ AWS อื่น ๆ อย่างราบรื่นของแพลตฟอร์มนี้ช่วยให้คุณสามารถก้าวไปไกลกว่าการวิเคราะห์ SQL แบบดั้งเดิม เปลี่ยนข้อมูลของคุณให้กลายเป็นข้อมูลเชิงลึกที่ใช้งานได้โดยมีความซับซ้อนทางเทคนิคน้อยที่สุด
ฉันจำเป็นต้องโอนย้ายข้อมูลจาก HAQM S3 หรือคลังข้อมูล HAQM Redshift ที่มีอยู่เพื่อใช้ SageMaker สำหรับการวิเคราะห์ SQL หรือไม่
ไม่ คุณไม่จำเป็นต้องโอนย้ายข้อมูลของคุณเพื่อใช้ SageMaker สำหรับการวิเคราะห์ SQL คุณสามารถค้นหาและสืบค้นข้อมูลได้โดยตรงจากหลายแหล่ง ซึ่งรวมถึง HAQM S3 (แค็ตตาล็อกข้อมูลของ AWS Glue และบัคเก็ตของตาราง HAQM S3), HAQM Redshift (แบบไม่ต้องใช้เซิร์ฟเวอร์และจัดเตรียมไว้) และแหล่งที่มาของข้อมูลแบบรวมศูนย์เพิ่มเติม 13 แหล่งที่เข้ากันได้กับเวิร์กโฟลว์วิศวกรรม SQL HAQM SageMaker Lakehouse เชื่อมต่อกับข้อมูลปัจจุบันของคุณได้อย่างราบรื่น คุณจึงสามารถมุ่งเน้นไปที่ข้อมูลเชิงลึกแทนที่จะใช้เวลาในการเคลื่อนย้ายข้อมูล เพียงไม่กี่ขั้นตอนง่ายๆ คุณก็จะสามารถสำรวจข้อมูลของคุณ เรียกใช้แบบสอบถาม และค้นพบข้อมูลธุรกิจที่มีค่าได้โดยไม่ต้องมีปัญหาทางเทคนิค
ฉันจะโหลดข้อมูลและเริ่มต้นใช้งาน SageMaker สำหรับการวิเคราะห์ SQL ได้อย่างไร
SageMaker มีสองวิธีในการนำข้อมูลของคุณเข้าสู่แพลตฟอร์มสำหรับการวิเคราะห์ SQL เพื่อเริ่มต้นใช้งาน SageMaker SQL จะช่วยให้คุณสามารถเรียกใช้การสืบค้นกับข้อมูลเหล่านั้นโดยตรงด้วย Data Lake ได้เมื่อคุณจัดเก็บข้อมูลใน HAQM S3 หรือคุณสามารถอัปโหลดข้อมูลลงในคลังข้อมูลของคุณโดยเรียกใช้คำสั่ง COPY หากคุณมีข้อมูลในเดสก์ท็อปของคุณ SageMaker ช่วยให้คุณสามารถอัปโหลดไฟล์ข้อมูลโดยตรงจากคอมพิวเตอร์ของคุณเอง โดยการลากและวางไฟล์ข้อมูลลงในแพลตฟอร์ม SageMaker นอกจากนี้คุณยังสามารถใช้ ETL แบบไร้รอยต่อเพื่อนำข้อมูลจากคลังข้อมูลการดำเนินงานของคุณได้ กระบวนการทั้งหมดได้รับการออกแบบมาเพื่อขจัดอุปสรรคทางเทคนิค ซึ่งช่วยให้คุณสามารถมุ่งเน้นไปที่การค้นพบข้อมูลเชิงลึกมาก แทนที่จะใช้เวลาไปกับกระบวนการโหลดข้อมูลที่ซับซ้อน
ประสบการณ์การใช้งานบันทึกการสืบค้น SageMaker เป็นอย่างไร
HAQM SageMaker Unified Studio (เวอร์ชันทดลองใช้) มีอินเทอร์เฟซแบบโน้ตบุ๊คที่ทรงพลังและใช้งานง่าย เพื่อการวิเคราะห์ SQL แบบครบวงจร คุณสามารถเขียนและเรียกใช้โค้ด SQL ในเซลล์แยกกัน สร้างแผนภูมิและการแสดงภาพ รวมถึงสำรวจข้อมูลรวมจากแหล่งต่าง ๆ เช่น HAQM S3, HAQM Redshift และแหล่งแบบรวมต่าง ๆ ผ่าน SageMaker Lakehouse แพลตฟอร์มนี้ยังมีฟีเจอร์ที่มีประโยชน์เช่น การป้อนอัตโนมัติและการตรวจสอบไวยากรณ์เพื่อช่วยเหลือในการเขียน SQL ของคุณ คุณยังสามารถใช้ฟังก์ชัน AI ช่วยสร้างได้กับ SQL ช่วยสร้างของ HAQM Q ซึ่งให้คำแนะนำโค้ด SQL โดยใช้ภาษาธรรมชาติ SageMaker ได้รับการออกแบบมาเพื่อทำให้การวิเคราะห์ SQL ใช้งานง่าย ยืดหยุ่น และเข้าถึงได้สำหรับผู้ใช้ข้อมูลทุกคน
ฉันจะแชร์การสืบค้น SQL หรือโมเดลข้อมูลใน SageMaker ได้อย่างไร
HAQM SageMaker Unified Studio (เวอร์ชันทดลองใช้) มี “โปรเจกต์” ซึ่งเป็นพื้นที่ทำงานดิจิทัลแบบร่วมมือที่ช่วยทีมที่ช่วยให้ทีมงานสามารถจัดระเบียบและจัดการงานการวิเคราะห์ข้อมูลได้ ซึ่งฟีเจอร์ดังกล่าวเป็นเหมือนโฟลเดอร์ที่แชร์กันซึ่งคุณสามารถจัดเก็บการสืบค้น SQL, โมเดลข้อมูล, โค้ด และทรัพยากรอื่น ๆ ในตำแหน่งเดียวที่ปลอดภัยได้ การสร้างโปรเจกต์จะช่วยให้คุณสร้างสภาพแวดล้อมแบบรวมศูนย์ที่สามารถเชิญสมาชิกในทีม กำหนดสิทธิ์การเข้าถึงที่เฉพาะเจาะจง และทำงานร่วมกันได้อย่างราบรื่น โดยภายในพื้นที่นี้ คุณสามารถแจกจ่าย Querybooks ซึ่งเป็นที่เก็บการสืบค้นและโมเดลข้อมูลของคุณ รวมถึงให้สิทธิ์เข้าถึงแหล่งที่มาของข้อมูล เช่น HAQM S3 และ Redshift ตลอดจนจัดเตรียมทรัพยากรคอมพิวเตอร์ที่ใช้ร่วมกันได้ แพลตฟอร์มนี้รองรับการควบคุมเวอร์ชันผ่านการผสานรวม Git ซึ่งช่วยให้ทีมของคุณสามารถติดตามการเปลี่ยนแปลง ทำงานร่วมกันในโค้ด และรักษาประวัติการทำงานการวิเคราะห์ SQL ของคุณได้อย่างชัดเจน วิธีการนี้ช่วยให้มั่นใจได้ว่าสมาชิกในทีมทุกคนสามารถดู แก้ไข และเรียกใช้การสืบค้นในขณะที่รักษาความปลอดภัยและความสม่ำเสมอในเวิร์กโหลดการวิเคราะห์ SQL ของคุณ
โมเดลการกำหนดราคาสำหรับการวิเคราะห์ SQL ใน SageMaker คืออะไร
ไม่มีค่าใช้จ่ายเพิ่มเติมในการใช้ตัวแก้ไข SQL ใน SageMaker คุณจะจ่ายเฉพาะค่าใช้จ่ายสำหรับการใช้งานเอ็นจิ้นประมวลผลข้อมูลที่พร้อมใช้งาน เช่น HAQM Athena และ HAQM Redshift เท่านั้น
SLA สำหรับการวิเคราะห์ SQL ใน HAQM SageMaker คืออะไร
ข้อตกลงระดับบริการ (SLA) ของการวิเคราะห์ SQL Analytics ใน HAQM SageMaker เชื่อมโยงโดยตรงกับ SLA ของเครื่องมือ SQL พื้นฐาน: HAQM Redshift และ HAQM Athena ลูกค้าสามารถค้นหาข้อมูลข้อผูกพันในการบริการโดยละเอียดในหน้าข้อตกลงระดับบริการที่เกี่ยวข้องสำหรับ HAQM Redshift และ HAQM Athena
ไม่ต้องใช้เซิร์ฟเวอร์
เปิดทั้งหมดHAQM Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์คืออะไร
HAQM Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ คือตัวเลือกแบบไม่ต้องใช้เซิร์ฟเวอร์ของ HAQM Redshift ที่ช่วยให้เรียกใช้และปรับขนาดการวิเคราะห์ได้อย่างมีประสิทธิภาพยิ่งขึ้นภายในเวลาไม่กี่วินาทีโดยไม่จำเป็นต้องตั้งค่าและจัดการโครงสร้างพื้นฐานคลังข้อมูล Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ช่วยให้ผู้ใช้ทุกคน รวมถึงนักวิเคราะห์ข้อมูล นักพัฒนา นักธุรกิจ และนักวิทยาศาสตร์ข้อมูล ได้รับข้อมูลเชิงลึกจากข้อมูลเพียงแค่โหลดและสืบค้นข้อมูลในคลังข้อมูล
ฉันจะเริ่มใช้งาน HAQM Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ได้อย่างไร
คุณสามารถเลือก "กำหนดค่า HAQM Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์" และเริ่มสืบค้นข้อมูลได้เพียงทำไม่กี่ขั้นตอนในคอนโซลการจัดการของ AWS คุณสามารถใช้ประโยชน์จากชุดข้อมูลตัวอย่างที่โหลดไว้ล่วงหน้า เช่น ข้อมูลสภาพอากาศ ข้อมูลสำมะโน และชุดข้อมูลวัดประสิทธิภาพ พร้อมกับการสืบค้นตัวอย่างเพื่อเริ่มการวิเคราะห์ทันที คุณสามารถสร้างฐานข้อมูล สคีมา ตาราง และโหลดข้อมูลจาก HAQM S3, แชร์ข้อมูลของ HAQM Redshift หรือกู้คืนจากสแนปช็อตคลัสเตอร์ที่มีการเตรียมใช้งานของ Redshift ที่มีอยู่ และคุณยังสามารถสืบค้นข้อมูลโดยตรงในรูปแบบเปิด (เช่น Parquet หรือ ORC) ใน Data Lake ของ HAQM S3 หรือสืบค้นข้อมูลในฐานข้อมูลปฏิบัติการ เช่น HAQM Aurora และ HAQM RDS PostgreSQL และ MySQL ดูคู่มือเริ่มต้นใช้งาน
การใช้งาน HAQM Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์มีข้อดีอย่างไรบ้าง
หากคุณไม่มีประสบการณ์ในการจัดการคลังข้อมูล คุณก็ไม่ต้องกังวลกับการตั้งค่า การกำหนดค่า การจัดการคลัสเตอร์ หรือการปรับแต่งคลังข้อมูล คุณสามารถให้ความสำคัญกับการรับข้อมูลเชิงลึกที่สำคัญจากข้อมูลของคุณ หรือการนำเสนอผลลัพธ์ทางธุรกิจหลักของคุณผ่านข้อมูล และจ่ายค่าบริการเฉพาะส่วนที่คุณใช้เท่านั้น ช่วยให้ดูแลจัดการต้นทุนได้ตลอด โดยคุณยังคงได้รับประโยชน์จากประสิทธิภาพชั้นยอดทั้งหมดของ HAQM Redshift, คุณสมบัติ SQL ที่หลากหลาย, การผสานรวมกับที่เก็บข้อมูลดิบและคลังข้อมูลปฏิบัติการอย่างราบรื่น และคุณสมบัติวิเคราะห์เชิงคาดการณ์ในตัวและการแชร์ข้อมูล หากคุณต้องการควบคุมคลังข้อมูลอย่างละเอียด คุณสามารถจัดเตรียมคลัสเตอร์ Redshift ได้
HAQM Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ใช้งานร่วมกับบริการอื่น ๆ ของ AWS ได้อย่างไรบ้าง
คุณสามารถใช้ฟังก์ชันการวิเคราะห์ที่หลากหลายทั้งหมดของ HAQM Redshift ได้ต่อไป เช่น การรวบรวมที่ซับซ้อน การสืบค้นโดยตรงไปยังข้อมูลใน Data Lake ของ HAQM S3 และฐานข้อมูลเชิงปฏิบัติการ, มุมมองผลการสืบค้น, ขั้นตอนกระบวนการที่จัดเก็บไว้, การสนับสนุนข้อมูลกึ่งมีโครงสร้าง และ ML อีกทั้งยังมีประสิทธิภาพสูงในทุกระดับขนาดอีกด้วย บริการที่เกี่ยวข้องทั้งหมดที่ HAQM Redshift ใช้งานร่วมกันได้ (เช่น HAQM Kinesis, AWS Lambda, HAQM QuickSight, HAQM SageMaker, HAQM EMR, AWS Lake Formation และ AWS Glue) ยังคงใช้งานกับ HAQM Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ต่อไปได้
มีกรณีใช้งานใดบ้างที่ฉันสามารถจัดการด้วย HAQM Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ได้
คุณสามารถเรียกใช้กรณีการใช้งานการวิเคราะห์ทั้งหมดต่อไปได้ HAQM Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ พร้อมเวิร์กโฟลว์การเริ่มต้นใช้งานที่เรียบง่าย การปรับขนาดอัตโนมัติ และการจ่ายค่าบริการตามที่ใช้งานช่วยให้การเรียกใช้การพัฒนาและการทดสอบสภาพแวดล้อมที่ต้องเริ่มต้นอย่างรวดเร็ว การวิเคราะห์ธุรกิจเฉพาะทาง เวิร์กโหลดที่มีความต้องการด้านการประมวลผลที่แตกต่างกันและคาดเดาไม่ได้ และเวิร์กโหลดที่ไม่ต่อเนื่องหรือไม่สม่ำเสมอมีประสิทธิภาพและคุ้มค่ายิ่งขึ้น
การนำข้อมูลเข้าและการโหลดข้อมูล
เปิดทั้งหมดฉันจะโหลดข้อมูลเข้าคลังข้อมูล HAQM Redshift ได้อย่างไร
คุณสามารถโหลดข้อมูลเข้าไปยัง HAQM Redshift ได้จากแหล่งที่มาของข้อมูลต่าง ๆ มากมาย ได้แก่ HAQM S3, HAQM RDS, HAQM DynamoDB, HAQM EMR, AWS Glue, AWS Data Pipeline และ/หรือโฮสต์ที่เปิดใช้ SSH บน HAQM EC2 หรือในองค์กร HAQM Redshift จะพยายามโหลดข้อมูลของคุณโดยพร้อมกันเข้าไปยังโหนดประมวลผลแต่ละโหนด เพื่อเพิ่มอัตราที่คุณสามารถนำข้อมูลเข้าไปยังคลัสเตอร์คลังข้อมูลของคุณได้ ไคลเอ็นต์สามารถเชื่อมต่อเข้ากับ HAQM Redshift โดยใช้ ODBC หรือ JDBC และออกคำสั่ง SQL 'insert' เพื่อแทรกข้อมูลได้ โปรดทราบว่า วิธีนี้จะช้ากว่าการใช้ S3 หรือ DynamoDB เนื่องจากวิธีการดังกล่าวจะโหลดข้อมูลโดยพร้อมกันไปยังโหนดประมวลผลแต่ละโหนด ขณะที่คำสั่ง ‘insert’ ของ SQL จะโหลดผ่านโหนดนำตัวเดียว สำหรับรายละเอียดเพิ่มเติมเกี่ยวกับการโหลดข้อมูลเข้าไปยัง HAQM Redshift โปรดดูที่ คู่มือการเริ่มใช้งานของเรา
การคัดลอกอัตโนมัติของ Redshift แตกต่างจากคำสั่งคัดลอกอย่างไร
การคัดลอกอัตโนมัติของ Redshift ช่วยให้สามารถใช้คำสั่งคัดลอกอัตโนมัติโดยการติดตามโฟลเดอร์ใน HAQM S3 และนำเข้าไฟล์ใหม่ๆ โดยที่ลูกค้าไม่ต้องดำเนินการเอง หากไม่ใช้ฟังก์ชันการคัดลอกอัตโนมัติ คำสั่งคัดลอกจะเริ่มต้นขั้นตอนการนำเข้าไฟล์สำหรับไฟล์ที่มีอยู่ทันที การคัดลอกอัตโนมัติจะส่งคำสั่งคัดลอกที่มีอยู่และสามารถ 1/ ทำให้ขั้นตอนการนำเข้าไฟล์เป็นแบบอัตโนมัติ โดยตรวจติดตามเส้นทางต่างๆ ใน HAQM S3 ที่ระบุสำหรับไฟล์ใหม่ๆ 2/ ใช้การกำหนดค่าการคัดลอกซ้ำ ลดความต้องการในการสร้างและเรียกใช้คำสั่งคัดลอกใหม่ๆ สำหรับงานการนำเข้าซ้ำๆ และ 3/ ติดตามไฟล์ที่โหลดมาเพื่อหลีกเลี่ยงการคัดลอกข้อมูลซ้ำ
ฉันจะเริ่มต้นใช้การคัดลอกอัตโนมัติของ Redshift ได้อย่างไร
ในการเริ่มต้น ลูกค้าควรมีโฟลเดอร์ใน HAQM S3 ซึ่งสามารถเข้าถึงได้โดยคลัสเตอร์/ตำแหน่งข้อมูลแบบไม่ต้องใช้เซิร์ฟเวอร์ของ Redshift โดยใช้บทบาทใน IAM ที่เกี่ยวข้อง และสร้างตาราง Redshift ที่จะใช้เป็นเป้าหมาย หลังจากที่เส้นทาง HAQM S3 และตาราง Redshift พร้อมแล้ว ลูกค้าสามารถสร้างงานคัดลอกโดยใช้คำสั่งคัดลอกได้ หลังจากสร้างงานคัดลอกแล้ว Redshift จะเริ่มติดตามเส้นทาง HAQM S3 ที่ระบุในการทำงานเบื้องหลัง และเริ่มคำสั่งคัดลอกที่ผู้ใช้กำหนดเพื่อคัดลอกไฟล์ใหม่ๆ ลงในตารางเป้าหมายโดยอัตโนมัติ
การผสานการทำงาน HAQM Redshift สำหรับ Apache Spark มีกรณีการใช้งานใดบ้าง
กรณีการใช้งานที่สำคัญมีดังนี้: 1/ ลูกค้าที่ใช้ HAQM EMR และ AWS Glue เพื่อเรียกใช้งาน Apache Spark ที่จะเข้าถึงและโหลดข้อมูลลงใน HAQM Redshift อันเป็นส่วนหนึ่งของไปป์ไลน์การนำข้อมูลเข้าและการแปลงข้อมูล (แบตช์และการสตรีม) 2/ ลูกค้าที่ใช้ HAQM SageMaker ในการดำเนินงานแมชชีนเลิร์นนิงโดยใช้ Apache Spark และจะต้องเข้าถึงข้อมูลที่จัดเก็บไว้ใน HAQM Redshift สำหรับกระบวนการสร้างฟีเจอร์ใหม่และการแปลงข้อมูล 3/ ลูกค้า HAQM Athena ที่ใช้ Apache Spark ในการวิเคราะห์เชิงโต้ตอบกับข้อมูลที่อยู่ใน HAQM Redshift
การผสานการทำงาน HAQM Redshift สำหรับ Apache Spark มีข้อดีอย่างไรบ้าง
Baikal มีประโยชน์ดังต่อไปนี้:
- ใช้งานง่ายในการเริ่มต้นและเรียกใช้แอปพลิเคชัน Apache Spark บนข้อมูลใน HAQM Redshift โดยไม่ต้องกังวลกับขั้นตอนที่ต้องดำเนินการด้วยตนเองซึ่งเกี่ยวข้องกับการตั้งค่าและการบำรุงรักษา Spark สำหรับเวอร์ชันที่ไม่ผ่านการรับรอง
- ความสะดวกในการใช้ Apache Spark จากบริการต่าง ๆ ของ AWS เช่น HAQM EMR, AWS Glue, HAQM Athena และ HAQM SageMaker พร้อม HAQM Redshift ด้วยการกำหนดค่าที่น้อยที่สุด
- ปรับปรุงประสิทธิภาพขณะเรียกใช้แอปพลิเคชัน Apache Spark บน HAQM Redshift
ฉันควรใช้ HAQM Aurora Zero-ETL เพื่อเชื่อมข้อมูลไปยัง HAQM Redshift แทนการสืบค้นข้อมูลจากส่วนกลางเมื่อใด
การเชื่อมข้อมูลจาก HAQM Aurora Zero-ETL ไปยัง HAQM Redshift ช่วยให้ลูกค้าของ HAQM Aurora และ HAQM Redshift สามารถเรียกใช้การวิเคราะห์ในแบบเกือบเรียลไทม์และแมชชีนเลิร์นนิงสำหรับข้อมูลการดำเนินการในระดับเพตะไบต์ได้ โดยเสนอโซลูชันที่มีการจัดการเต็มรูปแบบเพื่อจัดทำข้อมูลการดำเนินการจาก HAQM Aurora ที่มีอยู่ใน HAQM Redshift หลังจากเขียนออกมาได้ภายในไม่กี่วินาที ด้วยการเชื่อมข้อมูลจาก HAQM Aurora Zero-ETL ไปยัง HAQM Redshift ลูกค้าเพียงแค่ต้องเลือกตาราง HAQM Aurora ที่มีข้อมูลที่ตนต้องการเพื่อวิเคราะห์โดยใช้ HAQM Redshift และคุณสมบัตินี้จะทำซ้ำสคีมาและข้อมูลลงใน HAQM Redshift อย่างราบรื่น ซึ่งจะช่วยลดความจำเป็นที่ลูกค้าจะต้องสร้างและจัดการไปป์ไลน์ข้อมูลที่ซับซ้อน และมีเวลาให้ความสำคัญกับการพัฒนาแอปพลิเคชันของตนแทน การเชื่อมข้อมูลจาก HAQM Aurora Zero-ETL ไปยัง HAQM Redshift ช่วยให้ลูกค้าสามารถทำซ้ำข้อมูลจากคลัสเตอร์ฐานข้อมูล HAQM Aurora หลายแหล่งลงในอินสแตนซ์ HAQM Redshift เดียวกันเพื่อรับข้อมูลเชิงลึกที่ครบถ้วนทั่วแอปพลิเคชันต่างๆ ไปพร้อมกับรวบรวมสินทรัพย์การวิเคราะห์หลัก ประหยัดต้นทุนอย่างมาก และดำเนินงานได้อย่างมีประสิทธิภาพ การเชื่อมข้อมูลจาก HAQM Aurora Zero-ETL ไปยัง HAQM Redshift ช่วยให้ลูกค้าสามารถเข้าถึงการวิเคราะห์หลักและความสามารถด้านแมชชีนเลิร์นนิงของ HAQM Redshift ได้ด้วย เช่น มุมมองผลการสืบค้น การแชร์ข้อมูล และการเข้าถึงแหล่งเก็บข้อมูลและ Data Lake หลายแหล่งจากส่วนกลาง ซึ่งช่วยให้ลูกค้าสามารถรวมการวิเคราะห์หลักในแบบเกือบเรียลไทม์เพื่อรับข้อมูลเชิงลึกสุดรวดเร็วที่จะช่วยในการตัดสินใจทางธุรกิจอย่างมีข้อมูล นอกจากนี้ ลูกค้าจะใช้ HAQM Aurora สำหรับธุรกรรมและ HAQM Redshift สำหรับการวิเคราะห์ จึงไม่จำเป็นต้องใช้แหล่งข้อมูลการประมวลผลร่วมกัน ทำให้ได้โซลูชันที่มีประสิทธิภาพการทำงานและการดำเนินงานที่เสถียร
การเชื่อมข้อมูลจาก HAQM Aurora Zero-ETL ไปยัง HAQM Redshift มีความสัมพันธ์กับ/ทำงานร่วมกับบริการอื่น ๆ ของ AWS อย่างไร
การบูรณาการ ETL แบบไร้รอยต่อของ HAQM Aurora กับ HAQM Redshift นำเสนอการผสานรวมที่ราบรื่นระหว่างบริการทั้งสองสำหรับการวิเคราะห์ธุรกรรม
การนำเข้าข้อมูลการสตรีมทำงานอย่างไร
ข้อมูลการสตรีมแตกต่างจากตารางฐานข้อมูลแบบเดิมตรงที่เมื่อคุณสืบค้นการสตรีม คุณกำลังได้รับวิวัฒนาการความสัมพันธ์ที่แปรเปลี่ยนตามเวลา ในขณะที่ตารางจะบันทึกสแนปช็อต ณ จุดเวลาใดเวลาหนึ่งของความสัมพันธ์ที่แปรเปลี่ยนตามเวลานี้ ลูกค้าของ HAQM Redshift คุ้นเคยกับการทำงานกับตารางทั่วไปและดำเนินการประมวลผลขั้นปลาย (เช่น การแปลงข้อมูล) ของข้อมูลโดยใช้โมเดลแบตช์แบบเดิม เช่น “ELT” เรามอบวิธีการใช้มุมมองผลการสืบค้น (MV) ของ Redshift เพื่อให้ลูกค้าสามารถเห็นมุมมองผลการสืบค้น ณ จุดเวลาใดเวลาหนึ่งของการสตรีมได้ง่ายๆ ซึ่งรวมกันเป็นเวลาที่ใช้ในการสืบค้น และรวดเร็วพอที่จะรองรับเวิร์กโฟลว์ ELT
การแบ่งปันข้อมูล
เปิดทั้งหมดกรณีการใช้งานสำหรับการแชร์ข้อมูลมีอะไรบ้าง
กรณีการใช้งานที่สำคัญมีดังนี้
- การแชร์ข้อมูลของคลัสเตอร์ ETL ส่วนกลางกับคลัสเตอร์ BI/การวิเคราะห์จำนวนมาก เพื่อแยกปริมาณงานในการอ่านและดูแลควบคุมเพิ่มเติม
- ผู้ให้บริการข้อมูลแชร์ข้อมูลกับผู้บริโภคภายนอก
- การแชร์ชุดข้อมูลทั่วไป เช่น ลูกค้า ผลิตภัณฑ์ในกลุ่มธุรกิจต่างๆ และการทำงานร่วมกันเพื่อการวิเคราะห์ในวงกว้างและวิทยาศาสตร์ข้อมูล
- การกระจายศูนย์ข้อมูลเพื่อให้จัดการได้ง่ายขึ้น
- การแชร์ข้อมูลระหว่างสภาพแวดล้อมการพัฒนา การทดสอบ และการผลิต
- การเข้าถึงข้อมูล Redshift จากบริการวิเคราะห์อื่นๆ ของ AWS
การสืบค้นข้ามฐานข้อมูลใน HAQM Redshift คืออะไร
การสืบค้นข้ามฐานข้อมูลทำให้คุณสามารถสืบค้นและรวมข้อมูลจากฐานข้อมูล Redshift ต่างๆ ที่คุณมีสิทธิ์เข้าถึงเข้าด้วยกันได้อย่างราบรื่น ไม่ว่าคุณกำลังเชื่อมต่อกับฐานข้อมูลใดอยู่ก็ตาม ซึ่งรวมถึงฐานข้อมูลที่อยู่ในคลัสเตอร์ และชุดข้อมูลสำหรับแชร์ที่มีให้จากคลัสเตอร์ระยะไกล การสืบค้นข้ามฐานข้อมูลช่วยให้คุณสามารถจัดระเบียบข้อมูลเป็นฐานข้อมูลที่แยกกันได้อย่างยืดหยุ่นเพื่อให้รองรับการกำหนดค่าแบบหลายผู้ใช้ได้
ใครใช้งาน AWS Data Exchange เป็นหลัก
AWS Data Exchange ช่วยให้ลูกค้า AWS สามารถแลกเปลี่ยนและใช้ข้อมูลของบุคคลภายนอกใน AWS ได้อย่างปลอดภัยและมีประสิทธิภาพมากขึ้น นักวิเคราะห์ข้อมูล ผู้จัดการผลิตภัณฑ์ ผู้จัดการพอร์ตโฟลิโอ นักวิทยาศาสตร์ข้อมูล นักวิจัยเชิงปริมาณ ช่างเทคนิคด้านการทดลองทางคลินิก และนักพัฒนาในเกือบทุกอุตสาหกรรมต่างต้องการเข้าถึงข้อมูลจำนวนมากขึ้นเพื่อดำเนินการวิเคราะห์ ฝึกฝนโมเดล ML และตัดสินใจโดยใช้ข้อมูลเป็นหลัก แต่ไม่มีอะไรที่สามารถค้นหาข้อมูลจากผู้ให้บริการหลายรายได้ อีกทั้งผู้ให้บริการแต่ละรายยังส่งมอบข้อมูลแตกต่างกัน ทำให้ต้องเจอกับสื่อทางกายภาพ, ข้อมูล FTP และการเรียก API ตามความต้องการแบบต่างๆ มากมาย ในทางกลับกัน องค์กรจำนวนมากต้องการให้ข้อมูลของตนพร้อมสำหรับวัตถุประสงค์ด้านการวิจัยหรือการค้า แต่การสร้างและการดูแลการส่งข้อมูล การให้สิทธิ์ และเทคโนโลยีการเรียกเก็บเงินนั้นยากและมีต้นทุนสูง ซึ่งลดการให้ข้อมูลที่มีค่าให้ต่ำลงไปอีก
ความสามารถในการเพิ่มทรัพยากรและการทำงานพร้อมกัน
เปิดทั้งหมดฉันสามารถปรับขนาดและประสิทธิภาพของคลัสเตอร์คลังข้อมูล HAQM Redshift ได้อย่างไร
HAQM Redshift Serverless จะจัดเตรียมความจุของคลังข้อมูลโดยอัตโนมัติ และปรับทรัพยากรพื้นฐานอย่างชาญฉลาด HAQM Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์จะปรับความจุในไม่กี่วินาทีเพื่อมอบประสิทธิภาพที่สูงอย่างสม่ำเสมอ และลดความยุ่งยากในการปฏิบัติงานสำหรับเวิร์กโหลดที่มีความต้องการสูงและผันผวนมากที่สุด คุณสมบัติการปรับขนาดพร้อมกันเปิดโอกาสให้คุณสนับสนุนผู้ใช้และการสืบค้นพร้อมกันได้อย่างไม่จำกัดจำนวน โดยมีประสิทธิภาพการสืบค้นที่รวดเร็วสม่ำเสมอ เมื่อมีการเปิดใช้งานการปรับขนาดพร้อมกัน HAQM Redshift จะเพิ่มความจุคลัสเตอร์ให้โดยอัตโนมัติเมื่อประสบการณ์คลัสเตอร์ของคุณเพิ่มขึ้นในคิวการสืบค้น
สำหรับการเพิ่มทรัพยากรด้วยตนเอง หากคุณต้องการเพิ่มประสิทธิภาพในการสืบค้นและการตอบสนองต่อ CPU, หน่วยความจำ หรือการใช้งาน I/O เกินกำลัง คุณสามารถเพิ่มจำนวนโหนดภายในคลัสเตอร์คลังข้อมูลได้โดยใช้ Elastic Resize ผ่าน คอนโซลการจัดการของ AWS หรือ API ModifyCluster หากคุณปรับเปลี่ยนคลัสเตอร์คลังข้อมูล ระบบจะดำเนินการปรับเปลี่ยนตามที่คุณร้องขอโดยทันที ตัวชี้วัดสำหรับการใช้งานการประมวลผล การใช้งานพื้นที่จัดเก็บ และปริมาณการเขียน/อ่านข้อมูลในคลัสเตอร์คลังข้อมูล Redshift สามารถใช้งานได้ฟรีผ่านคอนโซลการจัดการของ AWS หรือ API ของ HAQM CloudWatch นอกจากนี้ คุณยังสามารถเพิ่มตัวชี้วัดที่ผู้ใช้กำหนดผ่านฟังก์ชันตัวชี้วัดแบบกำหนดเองของ HAQM CloudWatch ได้เช่นกัน
HAQM Redshift Spectrum ช่วยให้คุณสามารถเรียกใช้คลัสเตอร์ Redshift ได้หลายตัวซึ่งมีการเข้าถึงข้อมูลเดียวกันใน HAQM S3 คุณสามารถใช้คลัสเตอร์ที่ต่างกันสำหรับกรณีใช้งานที่ต่างกันได้ ตัวอย่างเช่น คุณสามารถใช้หนึ่งคลัสเตอร์สำหรับการรายงานมาตรฐานและอีกหนึ่งคลัสเตอร์สำหรับการสืบค้นข้อมูล ฝ่ายการตลาดของคุณสามารถใช้คลัสเตอร์ของตนเองที่แตกต่างจากฝ่ายปฏิบัติการได้ Redshift Spectrum จะกระจายการดำเนินการสืบค้นไปยังโปรแกรมทำงานของ Redshift Spectrum ทั้งหลายนอกเหนือจากแหล่งทรัพยากรที่ใช้ร่วมกันเพื่ออ่านและประมวลผลข้อมูลจาก HAQM S3 และดึงผลลัพธ์กลับไปยังคลัสเตอร์ Redshift เพื่อการประมวลผลใดๆ ที่เหลืออยู่
ฉันจะยังสามารถใช้งานคลัสเตอร์คลังข้อมูลของฉันในระหว่างการปรับขนาดได้หรือไม่
ขึ้นอยู่กับสถานการณ์ เมื่อคุณใช้คุณสมบัติการปรับขนาดพร้อมกัน คลัสเตอร์จะพร้อมให้ใช้งานเพื่ออ่านและเขียนอย่างเต็มที่ในระหว่างการปรับขนาดพร้อมกัน ด้วย Elastic Resize คลัสเตอร์จะไม่พร้อมให้ใช้งานเป็นเวลาสี่ถึงแปดนาทีของช่วงเวลาที่ปรับขนาด ด้วยความยืดหยุ่นในการเก็บข้อมูลของ Redshift RA3 ในพื้นที่จัดเก็บที่มีการจัดการ คลัสเตอร์จะพร้อมให้ใช้งานได้อย่างเต็มที่ และข้อมูลจะถูกย้ายระหว่างพื้นที่จัดเก็บที่มีการจัดการกับโหนดประมวลผลโดยอัตโนมัติ
Elastic Resize คืออะไรและแตกต่างจากการปรับขนาดพร้อมกันอย่างไร
Elastic Resize จะเพิ่มหรือลบโหนดจากคลัสเตอร์ Redshift เดียวภายในไม่กี่นาทีเพื่อจัดการกับอัตราการโอนถ่ายข้อมูลการสืบค้น ตัวอย่างเช่น เวิร์กโหลด ETL สำหรับจำนวนชั่วโมงที่กำหนดในการรายงานแบบต่อวันหรือสิ้นเดือนอาจจำเป็นต้องใช้ทรัพยากร HAQM Redshift เพิ่มเติมเพื่อให้เสร็จสมบูรณ์ทันเวลา การปรับขนาดพร้อมกันจะเพิ่มทรัพยากรคลัสเตอร์เพิ่มเติมเพื่อเพิ่มความสามารถในการทำงานพร้อมกันของการสืบค้นโดยรวม
ฉันสามารถเข้าถึงคลัสเตอร์การปรับขนาดพร้อมกันได้โดยตรงหรือไม่
ไม่ได้ การปรับขนาดพร้อมกันเป็นแหล่งรวมทรัพยากรขนาดใหญ่ของ HAQM Redshift และลูกค้าไม่สามารถเข้าถึงได้โดยตรง
การรักษาความปลอดภัย
เปิดทั้งหมดHAQM Redshift รักษาความปลอดภัยให้กับข้อมูลของฉันอย่างไร
HAQM Redshift รองรับความปลอดภัยระดับชั้นนำของอุตสาหกรรมด้วยการผสานรวมการจัดการข้อมูลระบุตัวตนและระบบเชื่อมโยงข้อมูลสำหรับการเข้าสู่ระบบครั้งเดียว (SSO), การยืนยันตัวตนโดยใช้หลายปัจจัย (MFA), การควบคุมการเข้าถึงระดับคอลัมน์, การรักษาความปลอดภัยระดับแถว, การควบคุมการเข้าถึงตามบทบาท และ HAQM Virtual Private Cloud (HAQM VPC) HAQM Redshift ช่วยเข้ารหัสข้อมูลของคุณในขณะที่ถ่ายโอนและจัดเก็บ คุณสมบัติด้านการรักษาความปลอดภัยทั้งหมดของ HAQM Redshift พร้อมใช้งานได้ทันทีโดยไม่ต้องมีค่าใช้จ่ายเพิ่มเติมเพื่อตอบสนองความต้องการด้านการรักษาความปลอดภัย ความเป็นส่วนตัว และการปฏิบัติตามข้อกำหนดที่เข้มงวดที่สุด คุณจะได้สัมผัสข้อดีจาก AWS ที่สนับสนุนมาตรฐานความปลอดภัยและใบรับรองการปฏิบัติตามข้อกำหนดมากกว่าผู้ให้บริการรายอื่นๆ รวมถึง ISO 27001, SOC, HIPAA/HITECH และ FedRAMP
Redshift รองรับการควบคุมการเข้าถึงแบบละเอียดหรือไม่
ใช่ HAQM Redshift รองรับการควบคุมการเข้าถึงตามบทบาท การควบคุมการเข้าถึงในระดับแถวจะช่วยให้คุณกำหนดอย่างน้อยหนึ่งบทบาทให้แก่ผู้ใช้ได้ และกำหนดสิทธิ์อนุญาตของระบบและอ็อบเจกต์ตามบทบาท คุณสามารถใช้บทบาทของระบบได้ทันที ไม่ว่าจะเป็นผู้ใช้ที่มีสิทธิ์ใช้งานสูงสุด, DBA, ผู้ปฏิบัติงาน และผู้ดูแลระบบความปลอดภัย หรือจะสร้างบทบาทของคุณเองก็ได้
HAQM Redshift รองรับการปกปิดข้อมูลหรือการทำให้เป็นข้อมูลโทเค็นหรือไม่
ฟังก์ชันที่กำหนดโดยผู้ใช้ของ AWS Lambda (UDF) ช่วยให้คุณสามารถใช้ฟังก์ชัน AWS Lambda เป็น UDF ใน HAQM Redshift และเรียกใช้จากการสืบค้นบน Redshift SQL ได้ ฟังก์ชันนี้ช่วยให้คุณสามารถเขียนส่วนขยายแบบกำหนดเองสำหรับการสืบค้น SQL ของคุณ เพื่อให้สามารถผสานรวมเข้ากับบริการอื่นๆ หรือผลิตภัณฑ์จากบุคคลภายนอกได้ดียิ่งขึ้น คุณสามารถเขียน Lambda UDF เพื่อเปิดใช้งานการสร้างโทเค็นภายนอก การมาสก์ข้อมูล การระบุตัวตนหรือการไม่ระบุตัวตนของข้อมูลโดยการผสานรวมกับผู้จัดจำหน่าย เช่น Protegrity และปกป้องหรือยกเลิกการปกป้องข้อมูลที่ละเอียดอ่อนตามสิทธิ์และกลุ่มของผู้ใช้ในระหว่างเวลาสืบค้น
การรองรับการมาสก์ข้อมูลแบบไดนามิกช่วยให้ลูกค้าปกป้องข้อมูลที่ละเอียดอ่อนได้อย่างง่ายดายและควบคุมการเข้าถึงอย่างละเอียดด้วยการจัดการนโยบายการมาสก์ข้อมูล สมมติว่าคุณมีแอปพลิเคชันที่มีผู้ใช้และอ็อบเจกต์หลายรายซึ่งมีข้อมูลที่ละเอียดอ่อนที่ไม่สามารถเปิดเผยต่อผู้ใช้ทั้งหมดได้ คุณมีข้อกำหนดในการจัดเตรียมระดับความปลอดภัยอย่างละเอียดที่แตกต่างกัน ซึ่งคุณต้องการใช้กับผู้ใช้กลุ่มต่างๆ Redshift Dynamic Data Masking สามารถกำหนดค่าได้เพื่ออนุญาตให้ลูกค้ากำหนดค่าข้อมูลที่มาสก์ในแบบที่สอดคล้องกัน รักษารูปแบบ และเปลี่ยนกลับไม่ได้ เมื่อคุณสมบัตินี้เป็น GA คุณจะเริ่มใช้งานได้ทันที ผู้ดูแลระบบด้านการรักษาความปลอดภัยสามารถสร้างและใช้นโยบายด้วยคำสั่งเพียงเล็กน้อย
HAQM Redshift รองรับการเข้าสู่ระบบครั้งเดียวหรือไม่
ใช่ ลูกค้าที่ต้องการใช้ผู้ให้บริการข้อมูลประจำตัวสำหรับองค์กร เช่น Microsoft Azure Active Directory, Active Directory Federation Services, Okta, Ping Federate หรือผู้ให้บริการข้อมูลประจำตัวที่เป็นไปตามมาตรฐาน SAML อื่นๆ สามารถกำหนดค่า HAQM Redshift ให้รองรับการเข้าสู่ระบบครั้งเดียวได้ คุณสามารถเข้าสู่ระบบคลัสเตอร์ HAQM Redshift ได้ด้วยข้อมูลประจำตัวของ Microsoft Azure Active Directory (AD) วิธีนี้จะช่วยให้คุณสามารถเข้าสู่ระบบ Redshift โดยไม่ซ้ำซ้อนกับข้อมูลประจำตัวของ Azure Active Directory ใน Redshift
HAQM Redshift รองรับการยืนยันตัวตนโดยใช้หลายปัจจัย (MFA) หรือไม่
ใช่ คุณสามารถใช้การยืนยันตัวตนโดยใช้หลายปัจจัย (MFA) เพื่อเพิ่มความปลอดภัยในการตรวจสอบสิทธิ์เพื่อเข้าสู่คลัสเตอร์ HAQM Redshift
ความพร้อมใช้งานและความคงทน
เปิดทั้งหมดในกรณีที่โหนดบางตัวหยุดทำงาน จะเกิดอะไรขึ้นกับความพร้อมใช้งานของคลัสเตอร์คลังข้อมูลและความคงทนของข้อมูล
HAQM Redshift จะตรวจจับและเปลี่ยนโหนดที่ทำงานล้มเหลวในคลัสเตอร์คลังข้อมูลของคุณโดยอัตโนมัติ บนคลัสเตอร์ Dense Compute (DC) และ Dense Storage (DS2) ข้อมูลจะถูกเก็บไว้ในโหนดประมวลผลเพื่อให้แน่ใจว่าข้อมูลจะมีความทนทานสูง เมื่อเปลี่ยนโหนดแล้ว ระบบจะรีเฟรชข้อมูลจากสำเนาบนโหนดอื่น คลัสเตอร์ RA3 และ Redshift ที่ไม่ต้องใช้เซิร์ฟเวอร์จะไม่ได้รับผลกระทบในลักษณะเดียวกันนี้ เนื่องจากข้อมูลถูกจัดเก็บไว้ใน HAQM S3 และไดรฟ์ในเครื่องเป็นเพียงแคชข้อมูลเท่านั้น คลัสเตอร์คลังข้อมูลจะไม่สามารถใช้งานในการสืบค้นและไม่สามารถอัปเดตได้จนกว่าระบบจะจัดเตรียมโหนดเปลี่ยนแทนให้และเพิ่มโหนดไปยังฐานข้อมูล HAQM Redshift ช่วยให้สามารถใช้งานโหนดเปลี่ยนแทนได้ทันทีและโหลดข้อมูลที่มีการเข้าถึงบ่อยที่สุดจาก HAQM S3 ก่อน เพื่อให้คุณดำเนินการสืบค้นข้อมูลของคุณต่อได้อย่างรวดเร็วที่สุด คลัสเตอร์โหนดแบบเดี่ยวไม่รองรับการทำสำเนาข้อมูล ในกรณีที่ไดรฟ์หยุดทำงาน คุณต้องกู้คืนคลัสเตอร์จากสแนปช็อตบน S3 เราแนะนำให้ใช้อย่างน้อยสองโหนดสำหรับการทำสำเนาข้อมูล
หาก Availability Zone (AZ) ของคลัสเตอร์คลังข้อมูลของฉันเกิดขัดข้อง จะเกิดอะไรขึ้นกับความพร้อมใช้งานของคลัสเตอร์คลังข้อมูลและความคงทนของข้อมูล
หากคลังข้อมูล HAQM Redshift ของ Availability Zone เป็นการนำไปใช้แบบ Single-AZ และ Availability Zone ของคลัสเตอร์ไม่พร้อมใช้งาน HAQM Redshift จะย้ายคลัสเตอร์ของคุณไปยัง AWS Availability Zone (AZ) อื่นโดยอัตโนมัติโดยไม่มีการสูญเสียข้อมูลหรือเปลี่ยนแปลงแอปพลิเคชัน โดยคุณต้องเปิดใช้งานความสามารถในการย้ายระบบในการตั้งค่าคลัสเตอร์เพื่อเปิดใช้ฟังก์ชันนี้
ทำไมฉันจึงควรใช้การใช้งานอินสแตนซ์แบบ Multi-AZ
ตอนนี้ลูกค้าสามารถปรับปรุงความพร้อมใช้งานของ Redshift ได้โดยเรียกใช้คลังข้อมูลในการใช้งานอินสแตนซ์แบบ Multi-AZ ซึ่งแตกต่างจากการนำไปใช้แบบ Single-AZ การใช้งานอินสแตนซ์แบบ Multi-AZ ช่วยให้คุณเรียกใช้คลังข้อมูลได้ในหลาย AWS Availability Zones (AZ) พร้อมกัน และปฏิบัติงานต่อไปเมื่อเกิดสถานการณ์ที่ต้องหยุดทำงานโดยไม่คาดคิด ไม่ต้องเปลี่ยนแปลงแอปพลิเคชันเพื่อรักษาความต่อเนื่องทางธุรกิจเนื่องจากการใช้งานอินสแตนซ์แบบ Multi-AZ ได้รับการจัดการเป็นคลังข้อมูลเดียวที่มีตำแหน่งข้อมูลเดียว การใช้งานอินสแตนซ์แบบ Multi-AZ ช่วยลดเวลาการกู้คืนโดยรับประกันความสามารถในการกู้คืนโดยอัตโนมัติ และเหมาะสำหรับลูกค้าที่มีแอปพลิเคชันการวิเคราะห์ที่สำคัญต่อธุรกิจ ซึ่งต้องการความพร้อมใช้งานและความสามารถในการฟื้นตัวต่อการหยุดทำงานของ AZ ในระดับสูง ซึ่งยังช่วยให้ลูกค้าสามารถใช้โซลูชันที่สอดคล้องกับคำแนะนำของ Reliability Pillar ของเฟรมเวิร์ก AWS Well-Architected ได้มากขึ้น หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับ HAQM Redshift Multi-AZ โปรดดูที่นี่
RPO และ RTO คืออะไร RPO และ RTO ใดบ้างที่รองรับการใช้งานอินสแตนซ์แบบ Multi-AZ
RPO ย่อมาจาก Recovery Point Objective และเป็นคำที่ใช้อธิบายการรับประกันความใหม่ของข้อมูลในกรณีที่หยุดทำงาน RPO คือระยะเวลาสูงสุดที่ยอมรับได้ นับจากจุดกู้คืนข้อมูลล่าสุด ซึ่งจะกำหนดสิ่งที่พิจารณาว่าเป็นการสูญหายของข้อมูลที่ยอมรับได้ระหว่างจุดกู้คืนล่าสุดและการหยุดชะงักของบริการ Redshift Multi-AZ รองรับ RPO = 0 หมายความว่าข้อมูลจะรับประกันว่าเป็นข้อมูลล่าสุดและเป็นปัจจุบันในกรณีที่หยุดทำงาน การทดสอบก่อนการเปิดตัวของเราพบว่า RTO ที่มีการปรับใช้การใช้งานอินสแตนซ์แบบ Multi-AZ ของ HAQM Redshift นั้นใช้เวลาน้อยกว่า 60 วินาทีหรือน้อยกว่าในกรณีที่เกิดความล้มเหลวของ AZ ซึ่งไม่น่าจะเกิดขึ้นได้
Redshift Multi-AZ เปรียบเทียบกับคุณสมบัติ Redshift Relocation ที่มีอยู่อย่างไร
Redshift Relocation จะเปิดใช้งานเป็นค่าเริ่มต้นบนคลัสเตอร์ RA3 ใหม่และตำแหน่งข้อมูลแบบไม่ต้องใช้เซิร์ฟเวอร์ทั้งหมด ซึ่งช่วยให้คลังข้อมูลสามารถเริ่มต้นใหม่ใน AZ อื่นได้ในกรณีที่เกิดการหยุดทำงานขนาดใหญ่ โดยไม่สูญเสียข้อมูลหรือค่าใช้จ่ายเพิ่มเติม แม้ว่าการใช้คุณสมบัติย้ายระบบจะไม่มีค่าใช้จ่าย แต่ก็มีข้อจำกัด เพราะเป็นวิธีที่พยายามอย่างเต็มที่โดยขึ้นอยู่กับความพร้อมใช้งานของทรัพยากรใน AZ ที่กู้คืน และระยะเวลาที่ใช้ในการกู้คืนข้อมูล (RTO) อาจได้รับผลกระทบจากปัญหาอื่นที่เกี่ยวข้องกับการเริ่มต้นคลัสเตอร์ใหม่ ซึ่งอาจส่งผลให้ใช้เวลากู้คืนตั้งแต่ 10 ถึง 60 นาที Redshift Multi-AZ รองรับความต้องการความพร้อมใช้งานในระดับสูงโดยมอบ RTO ที่วัดได้ในระดับสิบวินาทีและรับประกันการทำงานต่อเนื่อง เนื่องจากไม่อยู่ภายใต้ข้อจำกัดด้านความจุหรือปัญหาอื่นๆ ที่อาจเกิดขึ้นในการสร้างคลัสเตอร์ใหม่
การสืบค้นและการวิเคราะห์
เปิดทั้งหมดHAQM Redshift และ Redshift Spectrum ใช้งานร่วมกับแพ็คเกจซอฟต์แวร์ธุรกิจอัจฉริยะและเครื่องมือ ETL ที่ฉันต้องการได้หรือไม่
ได้ HAQM Redshift ใช้ SQL ตามมาตรฐานอุตสาหกรรมและสามารถเข้าถึงได้โดยใช้ไดรฟ์เวอร์ JDBC และ ODBC แบบมาตรฐาน คุณสามารถดาวน์โหลดไดรฟ์เวอร์ JDBC และ ODBC แบบกำหนดเองของ HAQM Redshift ได้จากแท็บ Connect Client ของ Redshift Console เรามีการผสานการทำงานที่ได้รับการตรวจสอบแล้วกับ ผู้จัดจำหน่าย BI และ ETL ยอดนิยม โดยบางรายเสนอ ช่วงทดลองใช้งานฟรี เพื่อช่วยให้คุณสามารถเริ่มใช้งานการโหลดและการวิเคราะห์ข้อมูล นอกจากนั้น คุณยังสามารถไปที่ AWS Marketplace เพื่อติดตั้งใช้จริงและกำหนดค่าโซลูชันที่ได้รับการออกแบบมาเพื่อใช้งานร่วมกับ HAQM Redshift ได้ภายในไม่กี่นาที
HAQM Redshift Spectrum รองรับเครื่องมือไคลเอ็นต์ของ HAQM Redshift ทุกแบบ เครื่องมือไคลเอ็นต์สามารถเชื่อมต่อกับตำแหน่งข้อมูลของคลัสเตอร์ HAQM Redshift ต่อไปได้โดยใช้การเชื่อมต่อ ODBC หรือ JDBC ไม่จำเป็นต้องปรับเปลี่ยนใดๆ
คุณต้องใช้โครงสร้างและความสามารถในการสืบค้นแบบเดียวกันเพื่อเข้าถึงตารางใน Redshift Spectrum ตามที่คุณมีสำหรับตารางในพื้นที่จัดเก็บภายในคลัสเตอร์ Redshift ของคุณ โดยระบบจะอ้างอิงตารางภายนอกโดยใช้ชื่อสคีมาที่กำหนดไว้ในคำสั่ง CREATE EXTERNAL SCHEMA ในที่ซึ่งลงทะเบียนคำสั่งเอาไว้
HAQM Redshift Spectrum รองรับรูปแบบข้อมูลและรูปแบบการบีบอัดประเภทใดบ้าง
ปัจจุบัน HAQM Redshift Spectrum รองรับรูปแบบข้อมูลแบบโอเพนซอร์สหลากหลายแบบด้วยกัน ได้แก่ Avro, CSV, Grok, HAQM Ion, JSON, ORC, Parquet, RCFile, RegexSerDe, Sequence, Text และ TSV <br>ปัจจุบัน HAQM Redshift Spectrum รองรับการบีบอัด Gzip และ Snappy
จะเกิดอะไรขึ้นหากตารางในพื้นที่จัดเก็บภายในของฉันมีชื่อเหมือนกันกับตารางภายนอก
คุณสามารถใช้ชื่อสคีมาในการเลือกตารางที่คุณต้องการโดยใช้ schema_name.table_name ในการสืบค้น เหมือนที่ทำกับตารางภายใน
ฉันใช้งาน Hive Metastore ในการจัดเก็บข้อมูลเมตาเกี่ยวกับ Data Lake S3 ของฉัน ฉันสามารถใช้ Redshift Spectrum ได้หรือไม่
ใช่ คำสั่ง CREATE EXTERNAL SCHEMA รองรับ Hive Metastore แต่เราไม่ยังไม่รองรับ DDL สำหรับ Hive Metastore ในตอนนี้
ฉันจะรับรายการตารางฐานข้อมูลภายนอกทั้งหมดที่สร้างขึ้นในคลัสเตอร์ได้อย่างไร
คุณสามารถสืบค้นตารางระบบ SVV_EXTERNAL_TABLES เพื่อรับข้อมูลดังกล่าวได้
Redshift รองรับความสามารถในการใช้แมชชีนเลิร์นนิงด้วย SQL หรือไม่
ใช่ คุณสมบัติ HAQM Redshift ML ช่วยให้ผู้ใช้ SQL สามารถสร้าง ฝึกอบรม และติดตั้งใช้งานโมเดลแมชชีนเลิร์นนิง (ML) ได้อย่างง่ายดายด้วยการใช้คำสั่ง SQL ที่คุ้นเคย HAQM Redshift ML ช่วยให้คุณสามารถใช้ประโยชน์จากข้อมูลของคุณใน HAQM Redshift ด้วย HAQM SageMaker ซึ่งเป็นบริการ ML ที่มีการจัดการอย่างเต็มรูปแบบ HAQM Redshift รองรับทั้งการเรียนรู้แบบไม่มีผู้ดูแล (K-Means) และการเรียนรู้แบบมีผู้ดูแล (อัลกอริทึม Autopilot, XGBoost, MLP) คุณยังสามารถใช้บริการ AI ด้านภาษาของ AWS เพื่อแปล ตรวจทาน และวิเคราะห์ช่องข้อความในการสืบค้น SQL ด้วยฟังก์ชัน Lambda UDF ที่สร้างไว้ล่วงหน้าได้ด้วย ดูบล็อกโพสต์
HAQM Redshift มี API เพื่อสืบค้นข้อมูลหรือไม่
HAQM Redshift มี Data API ที่คุณสามารถเข้าถึงข้อมูลได้อย่างสะดวกจาก HAQM Redshift ด้วยแอปพลิเคชัน Cloud-Native แบบดั้งเดิมทุกประเภท บริการบนเว็บแบบไม่ต้องใช้เซิร์ฟเวอร์และอยู่ในคอนเทนเนอร์ รวมถึงแอปพลิเคชันที่ขับเคลื่อนด้วยเหตุการณ์ Data API ช่วยลดความซับซ้อนในการเข้าถึง HAQM Redshift เนื่องจากคุณไม่จำเป็นต้องกำหนดค่าไดรฟ์เวอร์และจัดการการเชื่อมต่อฐานข้อมูล คุณสามารถเรียกใช้คำสั่ง SQL ไปยังคลัสเตอร์ HAQM Redshift ได้อย่างง่ายดายเพียงแค่เรียกตำแหน่งข้อมูล API ที่ปลอดภัยซึ่งได้รับจาก Data API Data API ดูแลในส่วนของการจัดการการเชื่อมต่อฐานข้อมูลและการบัฟเฟอร์ข้อมูล และ Data API เป็นแบบอะซิงโครนัส คุณจึงสามารถดึงผลลัพธ์ได้ในภายหลัง ผลการสืบค้นของคุณจะถูกจัดเก็บไว้เป็นเวลา 24 ชั่วโมง
ฉันสามารถใช้ข้อมูลประจำตัวประเภทใดบ้างกับ Data API ของ HAQM Redshift
Data API รองรับทั้งข้อมูลประจำตัว IAM และข้อมูลประจำตัวที่ใช้คีย์ลับจาก AWS Secrets Manager Data API รวมเข้ากับข้อมูลประจำตัว AWS Identity and Access Management (IAM) ดังนั้นคุณจึงสามารถใช้งานผู้ให้บริการข้อมูลประตัวอย่าง Okta หรือ Azure Active Directory หรือข้อมูลประจำตัวฐานข้อมูลที่จัดเก็บใน Secrets Manager โดยไม่ต้องผ่านข้อมูลประจำตัวฐานข้อมูลในการเรียกใช้ API
ฉันสามารถใช้ Data API ของ HAQM Redshift จาก AWS CLI ได้หรือไม่
ได้ คุณสามารถใช้ Data API จาก AWS CLI โดยใช้ตัวเลือกบรรทัดคำสั่งที่เป็นข้อมูลของ AWS Redshift ได้
Data API ของ Redshift ผสานการทำงานกับบริการของ AWS อื่นหรือไม่
คุณสามารถใช้ Data API จากบริการอื่น เช่น AWS Lambda, AWS Cloud9, AWS AppSync และ HAQM EventBridge ได้
ฉันต้องจ่ายค่าบริการการใช้งาน Data API ของ HAQM Redshift แยกต่างหากหรือไม่
ไม่ Data API ไม่มีค่าบริการแยกต่างหาก
การบูรณาการ ETL แบบไร้รอยต่อ
เปิดทั้งหมดETL แบบไร้รอยต่อคืออะไร
ETL แบบไร้รอยต่อ เป็นชุดของการบูรณาการที่มีการจัดการอย่างสมบูรณ์โดย AWS ซึ่งจะลบหรือลดความจำเป็นในการสร้างไปป์ไลน์ข้อมูลสำหรับกระบวนการ Extract, Transform and Load (ETL) ให้น้อยที่สุด ETL แบบไร้รอยต่อทำให้ข้อมูลพร้อมใช้งานใน SageMaker Lakehouse และ HAQM Redshift จากแหล่งปฏิบัติการต่าง ๆ แหล่งธุรกรรม และแอปพลิเคชันองค์กร ETL เป็นกระบวนการของการรวม ล้าง และปรับข้อมูลจากแหล่งที่มาต่างๆ ให้เป็นมาตรฐาน เพื่อให้พร้อมสำหรับเวิร์กโหลดการวิเคราะห์ AI, และ ML กระบวนการ ETL แบบเดิมใช้เวลานานและซับซ้อนในการพัฒนา บำรุงรักษา และปรับขนาด ทว่า การบูรณาการ ETL แบบไร้รอยต่อช่วยอำนวยความสะดวกในการเคลื่อนย้ายข้อมูลแบบจุดต่อจุดโดยไม่จำเป็นต้องสร้างและใช้งานไปป์ไลน์ข้อมูล ETL
ดูที่ ETL แบบไร้รอยต่อคืออะไร เพื่อเรียนรู้เพิ่มเติม
อุปสรรคของ ETL ใดบ้างที่การบูรณาการ ETL แบบไร้รอยต่อสามารถแก้ได้
การบูรณาการ ETL แบบไร้รอยต่อช่วยแก้ปัญหาความท้าทายในการเคลื่อนย้ายข้อมูลที่มีอยู่มากมายในกระบวนการ ETL แบบเดิม รวมถึง:
- ความซับซ้อนของระบบที่เพิ่มขึ้นเนื่องจากกฎการทำแผนที่ข้อมูลที่ซับซ้อน การจัดการข้อผิดพลาด และข้อกำหนดด้านความปลอดภัย
- ค่าใช้จ่ายเพิ่มเติมจากปริมาณข้อมูลที่เพิ่มขึ้น การอัพเกรดโครงสร้างพื้นฐาน และการบำรุงรักษา
- เวลาล่าช้าในการวิเคราะห์ AI และ ML เนื่องจากการพัฒนาและการปรับใช้โค้ดที่กำหนดเอง ทำให้โอกาสพลาดสำหรับกรณีการใช้งานแบบเรียลไทม์
ETL แบบไร้รอยต่อมีประโยชน์อย่างไรบ้าง
- ความคล่องตัวที่เพิ่มขึ้น: ETL แบบไร้รอยต่อช่วยลดความยุ่งยากของสถาปัตยกรรมข้อมูลและลดความพยายามด้านวิศวกรรมข้อมูล ช่วยให้สามารถรวมแหล่งที่มาของข้อมูลใหม่ได้โดยไม่จำเป็นต้องประมวลผลข้อมูลจำนวนมากอีกครั้ง ความยืดหยุ่นนี้ช่วยเพิ่มความคล่องตัว สนับสนุนการตัดสินใจที่ขับเคลื่อนด้วยข้อมูลและนวัตกรรมที่ฉับไว
- ประหยัดค่าใช้จ่าย: ETL แบบไร้รอยต่อใช้เทคโนโลยีการรวมข้อมูลที่เป็นแบบ Cloud-Native และปรับขนาดได้ จึงช่วยให้ธุรกิจสามารถปรับค่าใช้จ่ายให้เหมาะสมตามการใช้งานจริงและความต้องการในการประมวลผลข้อมูล องค์กรลดต้นทุนโครงสร้างพื้นฐาน ความพยายามในการพัฒนา และค่าใช้จ่ายในการบำรุงรักษา
- การเข้าถึงข้อมูลที่รวดเร็ว: กระบวนการ ETL แบบเดิมๆ มักเกี่ยวข้องกับการอัปเดตแบตช์เป็นระยะๆ ส่งผลให้ความพร้อมใช้งานของข้อมูลล่าช้า ในทางกลับกัน การบูรณาการ ETL แบบไร้รอยต่อ ให้การเข้าถึงข้อมูลแบบเกือบเรียลไทม์ เพื่อช่วยจัดหาข้อมูลใหม่ ๆ สำหรับการวิเคราะห์ AI/ML และการรายงาน คุณจะได้รับข้อมูลเชิงลึกที่แม่นยำและทันท่วงทีมากขึ้นสำหรับกรณีการใช้งาน เช่น แดชบอร์ดแบบเรียลไทม์ ประสบการณ์การเล่นเกมที่ปรับให้เหมาะสม การตรวจสอบคุณภาพข้อมูล และการวิเคราะห์พฤติกรรมลูกค้า องค์กรต่างๆ สามารถทำการคาดการณ์ที่ขับเคลื่อนด้วยข้อมูลด้วยความมั่นใจมากขึ้น ปรับปรุงประสบการณ์ของลูกค้า และส่งเสริมข้อมูลเชิงลึกที่ขับเคลื่อนด้วยข้อมูลทั่วทั้งธุรกิจ
ปัจจุบัน AWS มีการบูรณาการ ETL แบบไร้รอยต่อใดบ้าง
ในงาน re:Invent 2024 เราจะประกาศการบูรณาการ ETL แบบไร้รอยต่อสี่รายการต่อไปนี้:
- HAQM SageMaker Lakehouse และ HAQM Redshift รองรับการบูรณาการ ETL แบบไร้รอยต่อจากแอปพลิเคชันแล้ว
- การบูรณาการ ETL แบบไร้รอยต่อของ HAQM DynamoDB กับ HAQM SageMaker Lakehouse
- การบูรณาการ ETL แบบไร้รอยต่อของ HAQM OpenSearch Service เข้ากับ HAQM CloudWatch Logs
- การบูรณาการ ETL แบบไร้รอยต่อของ HAQM OpenSearch Service เข้ากับ HAQM Security Lake
นับตั้งแต่เปิดตัวการบูรณาการ ETL แบบไร้รอยต่อ เราได้เพิ่มการผสานข้อมูลใหม่เจ็ดรายการ:
- การบูรณาการ ETL แบบไร้รอยต่อของ HAQM Aurora MySQL เข้ากับ HAQM Redshift
- การบูรณาการ ETL แบบไร้รอยต่อกับ PostgreSQL ของ HAQM Aurora ด้วย HAQM Redshift
- HAQM Relational Database Service (HAQM RDS) สำหรับการบูรณาการ ETL แบบไร้รอยต่อ ของ MySQL กับ HAQM Redshift
- การบูรณาการ ETL แบบไร้รอยต่อ HAQM DynamoDB พร้อม HAQM OpenSearch Service
- การบูรณาการ ETL แบบไร้รอยต่อของ HAQM DocumentDB กับ HAQM OpenSearch Service
- การบูรณาการ ETL แบบไร้รอยต่อของ HAQM OpenSearch Service กับ HAQM Simple Storage Service (HAQM S3)
- การผสานรวม Zero-ETL HAQM DynamoDB กับ HAQM Redshift
โมเดลการกำหนดราคาสำหรับ ETL แบบไร้รอยต่อคืออะไร
หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับราคา โปรดไปที่หน้าราคาของ HAQM Redshift, AWS Glue และ SageMaker Lakehouse
ฉันสามารถเรียนรู้เพิ่มเติมเกี่ยวกับ ETL แบบไร้รอยต่อและฟีเจอร์ใหม่นี้ได้ที่ไหน
หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับ ETL แบบไร้รอยต่อ โปรดไปที่ ETL แบบไร้รอยต่อคืออะไร
การเปลี่ยนแปลงโครงสร้างข้อมูลจัดการกับการการผสานรวม ETL แบบไร้รอยต่อ
ต่อไปนี้เป็นประเด็นสำคัญบางประการเกี่ยวกับวิธีการจัดการการเปลี่ยนแปลงโครงสร้างข้อมูล:
- คำสั่ง DDL เช่น CREATE TABLE, ALTER TABLE, DROP TABLE และอื่น ๆ จะได้รับการจำลองโดยอัตโนมัติจาก Aurora ไปยัง HAQM Redshift
- การผสานรวมทำให้เกิดการตรวจสอบและการปรับเปลี่ยนที่จำเป็นในตาราง HAQM Redshift สำหรับการเปลี่ยนแปลงโครงสร้างข้อมูลข้อมูลที่จำลองไว้ ตัวอย่างเช่นการเพิ่มคอลัมน์ใน Aurora จะเพิ่มคอลัมน์ใน HAQM Redshift ด้วย
- การจำลองแบบและการซิงค์โครงสร้างข้อมูลจะเกิดขึ้นแบบเรียลไทม์โดยอัตโนมัติ โดยมีความล่าช้าน้อยที่สุดระหว่างฐานข้อมูลต้นทางและเป้าหมาย
- ความสอดคล้องของโครงสร้างข้อมูลจะคงอยู่แม้ว่าการเปลี่ยนแปลง DML เกิดขึ้นควบคู่ไปกับการเปลี่ยนแปลง DDL
ฉันจะเรียกใช้การแปลงข้อมูลของฉันโดยใช้การบูรณาการ ETL แบบไร้รอยต่อได้อย่างไร
คุณสามารถสร้างมุมมองผลการสืบค้นในฐานข้อมูล HAQM Redshift ในระบบท้องถิ่นของคุณเพื่อแปลงข้อมูลที่จำลองผ่านการผสานรวม ETL แบบไร้รอยต่อ เชื่อมต่อกับฐานข้อมูลท้องถิ่นของคุณและใช้การสืบค้นข้ามฐานข้อมูลเพื่อเข้าถึงฐานข้อมูลปลายทาง คุณสามารถใช้ชื่ออ็อบเจ็กต์ที่มีคุณสมบัติครบถ้วนพร้อมหมายเหตุประกอบสามส่วน (destination-database-name.schema-name.table-name) หรือสร้างโครงสร้างข้อมูลภายนอกอ้างอิงฐานข้อมูลปลายทางและคู่โครงสร้างข้อมูล และใช้หมายเหตุประกอบสองส่วน (external-schema-name.table-name) ได้
การสำรองและการกู้คืนข้อมูล
เปิดทั้งหมดHAQM Redshift สำรองข้อมูลของฉันอย่างไร ฉันจะกู้คืนคลัสเตอร์จากข้อมูลสำรองได้อย่างไร
คลัสเตอร์ HAQM Redshift RA3 และ HAQM Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ใช้ Redshift Managed Storage ซึ่งมีสำเนาล่าสุดของข้อมูลอยู่เสมอ คลัสเตอร์ DS2 และ DC2 ทำสำเนาข้อมูลบนคลัสเตอร์เพื่อให้แน่ใจว่าสำเนาล่าสุดจะพร้อมใช้งานในกรณีที่เกิดการหยุดทำงาน ระบบจะสร้างการสำรองข้อมูลขึ้นโดยอัตโนมัติในคลัสเตอร์ Redshift ทุกประเภทและจะคงไว้เป็นเวลา 24 ชั่วโมง และจุดกู้คืนแบบไม่ต้องใช้เซิร์ฟเวอร์จะสำรองข้อมูลไว้ในช่วง 24 ชั่วโมงที่ผ่านมา
และคุณยังสามารถสร้างข้อมูลสำรองของคุณเองที่สามารถเก็บไว้ได้อย่างไม่มีกำหนดด้วยเช่นกัน ข้อมูลสำรองเหล่านี้สร้างขึ้นได้ทุกเมื่อและสามารถแปลงข้อมูลสำรองอัตโนมัติจากจุดกู้คืนของ HAQM Redshift หรือ HAQM Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์เป็นข้อมูลสำรองของผู้ใช้ได้เพื่อเก็บรักษาให้ยาวนานขึ้น
HAQM Redshift ยังสามารถจำลองสแนปช็อตหรือจุดกู้คืนของคุณแบบไม่พร้อมกันไปยัง HAQM S3 ใน Region อื่นสำหรับกระบวนการกู้คืนจากความเสียหาย
บนคลัสเตอร์ DS2 หรือ DC2 ระบบจะจำกัดพื้นที่จัดเก็บข้อมูลสำรองฟรีตามพื้นที่จัดเก็บทั้งหมดบนโหนดในคลัสเตอร์คลังเก็บข้อมูล และจะนำไปใช้เฉพาะกับคลัสเตอร์คลังเก็บข้อมูลที่เปิดใช้งานอยู่เท่านั้น
ตัวอย่างเช่น หากคุณมีพื้นที่คลังเก็บข้อมูลทั้งหมด 8 TB เราจะจัดเตรียมพื้นที่จัดเก็บข้อมูลสำรองให้สูงสุด 8 TB โดยไม่มีค่าบริการเพิ่มเติม หากคุณต้องการขยายระยะเวลาเก็บรักษาข้อมูลสำรองไปเกินหนึ่งวัน คุณสามารถขยายระยะเวลาได้โดยใช้ คอนโซลการจัดการของ AWS หรือ API ของ HAQM Redshift หากต้องการดูข้อมูลเพิ่มเติมเกี่ยวกับสแนปช็อตอัตโนมัติ โปรดดูที่คู่มือการจัดการ HAQM Redshift
HAQM Redshift จะสำรองเฉพาะข้อมูลที่มีการเปลี่ยนแปลงเท่านั้น ดังนั้นสแนปช็อตส่วนใหญ่จึงใช้พื้นที่จัดเก็บข้อมูลสำรองฟรีเพียงเล็กน้อย หากคุณต้องการกู้คืนข้อมูลสำรอง คุณสามารถเข้าถึงทุกการสำรองข้อมูลอัตโนมัติได้ในหน้าต่างการเก็บรักษาข้อมูลสำรอง เมื่อคุณเลือกได้ว่าจะกู้คืนข้อมูลสำรองใด เราจะจัดเตรียมคลัสเตอร์คลังข้อมูลใหม่ให้และกู้คืนข้อมูลของคุณไปยังคลัสเตอร์ดังกล่าว
ฉันสามารถจัดการการเก็บรักษาข้อมูลสำรองและสแนปช็อตอัตโนมัติได้อย่างไร
คุณสามารถใช้ คอนโซลการจัดการของ AWS หรือ API ModifyCluster เพื่อจัดการระยะเวลาที่ข้อมูลสำรองอัตโนมัติของคุณจะถูกเก็บไว้ได้โดยการแก้ไขพารามิเตอร์ RetentionPeriod หากคุณต้องการปิดข้อมูลสำรองอัตโนมัติทั้งหมด สามารถทำได้โดยกำหนดระยะเวลาการเก็บข้อมูลเป็น 0 (ไม่แนะนำ)
หากฉันลบคลัสเตอร์คลังข้อมูล จะเกิดอะไรขึ้นกับข้อมูลสำรองของฉัน
หากคุณลบคลัสเตอร์คลังข้อมูล คุณจะสามารถระบุได้ว่าจะสร้างสแนปช็อตสุดท้ายเมื่อดำเนินการลบหรือไม่ ซึ่งช่วยให้สามารถกู้คืนคลัสเตอร์คลังข้อมูลที่ลบทิ้งไปแล้วได้ในภายหลัง สแนปช็อตแบบแมนนวลของคลัสเตอร์คลังข้อมูลที่สร้างไว้ก่อนหน้านี้ทั้งหมดจะได้รับการเก็บรักษาไว้และเรียกเก็บเงินตาม อัตราค่าบริการมาตรฐานของ HAQM S3 เว้นแต่คุณเลือกที่จะลบออก
การเฝ้าติดตามและการบำรุงรักษา
เปิดทั้งหมดฉันสามารถตรวจสอบประสิทธิภาพของคลัสเตอร์คลังข้อมูล HAQM Redshift ได้อย่างไร
ตัวชี้วัดสำหรับการใช้งานการประมวลผล การใช้งานพื้นที่จัดเก็บ และปริมาณการเขียน/อ่านข้อมูลในคลัสเตอร์คลังข้อมูล HAQM Redshift สามารถใช้งานได้ฟรีผ่าน คอนโซลการจัดการของ AWS หรือ API ของ HAQM CloudWatch และคุณยังสามารถเพิ่มตัวชี้วัดตามผู้ใช้กำหนดเพิ่มเติมผ่านฟังก์ชันตัวชี้วัดแบบกำหนดเองของ HAQM CloudWatch ได้อีกด้วย คอนโซลการจัดการของ AWS มีแดชบอร์ดการติดตามสำหรับช่วยคุณติดตามสภาพและประสิทธิภาพของคลัสเตอร์ทั้งหมดของคุณ นอกจากนี้ HAQM Redshift ยังมอบข้อมูลเกี่ยวกับประสิทธิภาพของการสืบค้นและคลัสเตอร์ผ่านคอนโซลการจัดการของ AWS อีกด้วย ข้อมูลนี้ช่วยให้คุณสามารถดูได้ว่าผู้ใช้และการสืบค้นใดที่กำลังใช้งานทรัพยากรระบบมากที่สุดเพื่อดำเนินการวิเคราะห์ปัญหาด้านประสิทธิภาพโดยดูแผนการสืบค้นและสถิติการดำเนินการ อีกทั้งคุณยังเห็นการใช้ทรัพยากรบนโหนดประมวลผลแต่ละตัว เพื่อดูว่าคุณมีข้อมูลและการสืบค้นที่สมดุลกันบนทุกโหนดหรือไม่
ระยะเวลาบำรุงรักษาคืออะไร ฉันจะสามารถใช้งานคลัสเตอร์คลังข้อมูลของระหว่างการบำรุงรักษาซอฟต์แวร์ได้หรือไม่
HAQM Redshift จะดำเนินการบำรุงรักษาเป็นครั้งคราวเพื่อปรับใช้การแก้ไข การปรับปรุง และคุณสมบัติใหม่ๆ ให้กับคลัสเตอร์ของคุณ คุณสามารถเปลี่ยนระยะเวลาบำรุงรักษาตามกำหนดได้โดยการแก้ไขคลัสเตอร์ทั้งทางโปรแกรมหรือโดยใช้ Redshift Console โดยจะไม่สามารถใช้งานคลัสเตอร์ HAQM Redshift ในการทำงานทั่วไปได้ระหว่างระยะเวลาการบำรุงรักษา สำหรับข้อมูลเพิ่มเติมเกี่ยวกับระยะเวลาบำรุงรักษาและกำหนดการตาม Region โปรดดูที่ ระยะเวลาบำรุงรักษา ในคู่มือการจัดการ HAQM Redshift