ARA-C01 試験問題 71
あるメディア企業は、顧客レビューデータをSnowflakeテーブルに取り込み、いくつかの変換を適用するデータパイプラインを必要としています。また、Amazon Comprehendを使用して感情分析を行い、匿名化された最終データセットを、異なる地域で異なるクラウドプロバイダーを利用する広告会社向けに公開する必要があります。
データパイプラインは、イベント通知を活用してオブジェクトストレージに新しいレコードが到着するたびに、継続的かつ効率的に実行される必要があります。また、運用の複雑さ、プラットフォームのアップグレードやセキュリティを含むインフラストラクチャのメンテナンス、そして開発の労力は最小限に抑える必要があります。
どのデザインがこれらの要件を満たすでしょうか?
データパイプラインは、イベント通知を活用してオブジェクトストレージに新しいレコードが到着するたびに、継続的かつ効率的に実行される必要があります。また、運用の複雑さ、プラットフォームのアップグレードやセキュリティを含むインフラストラクチャのメンテナンス、そして開発の労力は最小限に抑える必要があります。
どのデザインがこれらの要件を満たすでしょうか?
ARA-C01 試験問題 72
Snowflake データ レイクのワークロードに半構造化データを効率的に取り込んで消費する手法はどれですか。
ARA-C01 試験問題 73
テーブルには5つの列があり、数百万件のレコードが含まれています。列のカーディナリティ分布は以下のとおりです。

列C4とC5は、SELECTクエリのGROUP BY句とORDER BY句で主に使用されます。一方、列C1、C2、C3は、SELECTクエリのフィルター条件と結合条件で頻繁に使用されます。
クエリのパフォーマンスを向上させるには、アーキテクトはこのテーブルのクラスタリング キーを設計する必要があります。
Snowflake の推奨事項に基づくと、複数列のクラスタリング キーを定義するときにクラスタリング キー列をどのように順序付ける必要がありますか?

列C4とC5は、SELECTクエリのGROUP BY句とORDER BY句で主に使用されます。一方、列C1、C2、C3は、SELECTクエリのフィルター条件と結合条件で頻繁に使用されます。
クエリのパフォーマンスを向上させるには、アーキテクトはこのテーブルのクラスタリング キーを設計する必要があります。
Snowflake の推奨事項に基づくと、複数列のクラスタリング キーを定義するときにクラスタリング キー列をどのように順序付ける必要がありますか?
ARA-C01 試験問題 74
この図は、Amazon Simple Notification Service (SNS) を使用した Snowpipe 自動インジェストのプロセスフローを次の手順で示しています。
ステップ 1: データ ファイルがステージにロードされます。
ステップ2:SNSによって発行されたAmazon S3イベント通知は、Amazon Simple Queue Service(SQS)を介してSnowpipeにファイルのロード準備が完了したことを通知します。Snowpipeはファイルをキューにコピーします。
ステップ 3: Snowflake が提供する仮想ウェアハウスは、指定されたパイプで定義されたパラメータに基づいて、キューに入れられたファイルからターゲット テーブルにデータをロードします。

AWS 管理者がステップ 2 で SNS トピックへの SQS サブスクリプションを誤って削除した場合、Amazon S3 からイベントメッセージを受信するためにトピックを参照するパイプはどうなりますか?
ステップ 1: データ ファイルがステージにロードされます。
ステップ2:SNSによって発行されたAmazon S3イベント通知は、Amazon Simple Queue Service(SQS)を介してSnowpipeにファイルのロード準備が完了したことを通知します。Snowpipeはファイルをキューにコピーします。
ステップ 3: Snowflake が提供する仮想ウェアハウスは、指定されたパイプで定義されたパラメータに基づいて、キューに入れられたファイルからターゲット テーブルにデータをロードします。

AWS 管理者がステップ 2 で SNS トピックへの SQS サブスクリプションを誤って削除した場合、Amazon S3 からイベントメッセージを受信するためにトピックを参照するパイプはどうなりますか?
ARA-C01 試験問題 75
ある企業は、自社の製品カタログデータをパートナー企業と共有する必要があります。製品カタログデータは、product_categoryとproduct_detailsという2つのデータベーステーブルに保存されています。両テーブルはproduct_id列で結合できます。データアクセスは適切に管理し、パートナー企業のみがレコードにアクセスできるようにする必要があります。
パートナーはSnowflakeの顧客ではありません。クラウドストレージとしてAmazon S3を使用しています。
必要な Snowflake 機能を使用しながら、最もコスト効率が高く安全な設計はどれでしょうか?
パートナーはSnowflakeの顧客ではありません。クラウドストレージとしてAmazon S3を使用しています。
必要な Snowflake 機能を使用しながら、最もコスト効率が高く安全な設計はどれでしょうか?
