投稿日: Jan 23, 2020

HAQM Relational Database Service (HAQM RDS) または HAQM Aurora のスナップショットを、分析用の効率的なオープンカラムナーストレージ形式である Apache Parquet として HAQM S3 にエクスポートできるようになりました。Parquet 形式は、テキスト形式と比較して、エクスポートが最大 2 倍速く、HAQM S3 でのストレージ使用量が最大 6 倍少なくすみます。エクスポートしたデータは、HAQM Athena、HAQM EMR、HAQM SageMaker などの他の AWS のサービスを使用して分析できます。

HAQM RDS マネジメントコンソールで数回クリックするだけで、あるいは AWS SDK または CLI を使用してエクスポートを行うことができます。エクスポート操作はデータベースではなくスナップショットで実行されるため、スナップショットからデータを抽出してもデータベースのパフォーマンスには影響しません。Apache Parquet 形式で抽出したデータは移植性があるため、HAQM Athena などのクエリサービスまたは Apache Spark などのビッグデータ処理フレームワークで使用できます。開始手順などの詳細については、Aurora のドキュメントまたは HAQM RDS のドキュメントを参照してください。

HAQM RDS スナップショットの S3 へのエクスポートは、HAQM RDS for PostgreSQL、HAQM RDS for MariaDB、HAQM RDS for MySQL、HAQM Aurora PostgreSQL、HAQM Aurora MySQL のスナップショットからデータをエクスポートできます。現在、米国東部 (バージニア北部)、米国東部 (オハイオ)、米国西部 (オレゴン)、欧州 (アイルランド)、アジアパシフィック (東京) の各リージョンで利用可能です。

HAQM Aurora は、MySQL および PostgreSQL と互換性のあるクラウド向けのリレーショナルデータベースであり、従来のエンタープライズデータベースのパフォーマンスと可用性に加え、オープンソースデータベースのシンプルさとコスト効率性も兼ね備えています。HAQM Aurora の詳細については、製品ページを参照してください。