投稿日: Mar 14, 2023
HAQM EMR に新機能が追加されました。HAQM EMR ステップ API を使用して送信された Apache Hive ジョブによる書き込みオペレーション (INSERT INTO、INSERT OVERWRITE) の権限を、HAQM S3 データレイク上の AWS Lake Formation ベースのテーブルおよび列レベルで適用できるようになりました。この機能により、データ管理者は HAQM EMR で実行される Apache Hive 経由でデータにアクセスする顧客に対して、テーブルおよび列レベルのきめ細かなセキュリティを定義して適用できます。
HAQM EMR と AWS Lake Formation の統合により、HAQM EMR で実行される Apache Spark や Apache Hive といったオープンソースのデータ処理エンジンを使用して、データベース、テーブル、列レベルの権限を定義および適用できます。これまでデータ管理者は、EMR 上の Apache Hive を使用する読み取り専用ワークロードのデータベース、テーブル、列に対して、Lake Formation ベースの権限を定義して適用できました。今回のリリースでは、Hive を使用して Lake Formation 対応のテーブルに書き込みや変更を行えるようになりました。つまり、INSERT INTO、INSERT OVERWRITE、ALTER TABLE クエリの実行時に、Lake Formation ベースのデータベース、テーブル、列レベルの権限を適用できます。Lake Formation ベースの権限を使用するには、メタストアとして Glue データカタログを使用する必要があります。
この機能は、HAQM EMR を提供中のすべてのリージョンにおける、EC2 クラスター上の HAQM EMR のリリース 6.10 で利用できます。使用を開始するには、HAQM EMR ドキュメントの Integrate HAQM EMR with AWS Lake Formation (HAQM EMR と AWS Lake Formation の統合) セクションを参照してください。