DEA-C01 試験問題 61

データ エンジニアは、継続的なデータ パイプラインの読み込みプロセス中に内部でステージングされるファイルをどのように監視できますか? [該当するものをすべて選択してください]
  • DEA-C01 試験問題 62

    ある企業は、Python コネクタを使用して Snowflake に接続し、Python で販売レポート システムを構築しました。
    ユーザーの選択に基づいて、システムはレポートのデータを取得するために必要な SQL クエリを生成します。まず、指定されたクエリ パラメータに一致する顧客を取得し (レポート実行ごとに平均 1000 件の顧客レコード)、次に顧客レコードを順番にループします。そのループ内で、現在の顧客に対して生成された SQL 句を実行し、売上データ テーブルからその顧客番号の詳細データを取得します。データ エンジニアが個々の SQL 句をテストしたところ、十分な速さでした (顧客を取得するのに 1 秒、1 人の顧客の売上データを取得するのに 5 秒) が、レポートの合計実行時間は長すぎます。この状況を改善するにはどうすればよいでしょうか。
  • DEA-C01 試験問題 63

    MACRO Data Company の主任データ エンジニアである Stuart は、外部テーブル セットにストリームを作成しました。ストリームのデータ保持期間を 90 日間延長するように依頼されましたが、この延長を有効にするにはどのパラメーターを利用できますか?
  • DEA-C01 試験問題 64

    データ エンジニアは、1 回限りの分析ジョブを実行するために、複数のソースからのデータを結合する必要があります。データは、Amazon DynamoDB、Amazon RDS、Amazon Redshift、および Amazon S3 に保存されます。
    この要件を最もコスト効率よく満たすソリューションはどれでしょうか?
  • DEA-C01 試験問題 65

    ある企業は、オンプレミスの PostgreSQL データベースから AWS に顧客の通話データを送信して、ほぼリアルタイムの分析情報を生成する必要があります。ソリューションでは、PostgreSQL データベースで実行される運用データ ストアから更新をキャプチャして読み込む必要があります。データは継続的に変化します。
    データエンジニアは、AWS Database Migration Service (AWS DMS) の継続的なレプリケーションタスクを設定します。タスクは、各テーブルの PostgreSQL ソースデータベースのトランザクションログから変更をほぼリアルタイムで読み取ります。次に、タスクはデータを Amazon Redshift クラスターに送信して処理します。
    データ エンジニアは、タスクの変更データ キャプチャ (CDC) 中に遅延の問題を発見します。
    データ エンジニアは、PostgreSQL ソース データベースが高レイテンシの原因であると考えています。
    PostgreSQL データベースが高レイテンシの原因であることを確認できるソリューションはどれですか?