Professional-Data-Engineer 試験問題 211

スケーラブルな方法でデータを収集する必要がある新しいアプリケーションを構築しています。データは一日中アプリケーションから継続的に到着し、年末までに 1 日あたり約 150 GB の JSON データを生成することが予想されます。要件は次のとおりです。
* 生産者と消費者の分離
* 取り込んだ生のデータを、スペースとコスト効率に優れた方法で保存し、無期限に保存する
* ほぼリアルタイムのSQLクエリ
* SQ でクエリされる少なくとも 2 年間の履歴データを保持します。これらの要件を満たすにはどのパイプラインを使用する必要がありますか?
  • Professional-Data-Engineer 試験問題 212

    あなたのスタートアップには、現在アジア地域の 1 つの顧客にサービスを提供している Web アプリケーションがあります。スタートアップが世界中の顧客にサービスを提供できるようにするための資金調達を目標としています。現在の目標はコストの最適化であり、資金調達後の目標はグローバルなプレゼンスとパフォーマンスの最適化です。ネイティブ JDBC ドライバーを使用する必要があります。どうすればよいでしょうか。
  • Professional-Data-Engineer 試験問題 213

    ユーザーが何を食べたいかを予測する機械学習ベースの食品注文サービス用のデータベース スキーマを設計しています。保存する必要がある情報の一部を以下に示します。
    ユーザープロフィール: ユーザーが好んで食べるものと好まないもの

    ユーザーアカウント情報: 名前、住所、希望する食事時間

    注文情報: 注文がいつ、どこから、誰に行われたか

    データベースは、製品のすべてのトランザクション データを保存するために使用されます。データ スキーマを最適化したいと考えています。どの Google Cloud Platform 製品を使用すればよいでしょうか。
  • Professional-Data-Engineer 試験問題 214

    あなたは、さまざまなストレージ サービスでそれぞれのデータ所有者によってデータが整理および管理されている医療組織の一員です。この分散型エコシステムの結果、データの検出と管理が困難になっています。組織を支援するために、コストを最適化したソリューションを迅速に特定して実装する必要があります。
    * データの管理と発見
    * データ系統の追跡
    * データ品質の検証
    ソリューションをどのように構築すればよいでしょうか?
  • Professional-Data-Engineer 試験問題 215

    あなたの会社では、オンプレミスのデータ ウェアハウス ソリューションを BigQuery に移行中です。既存のデータ ウェアハウスでは、トリガー ベースの変更データ キャプチャ (CDC) を使用して、複数のトランザクション データベース ソースからの更新を毎日適用しています。BigQuery では、CDC の処理を​​改善し、ログ ベースの CDC ストリームを使用してソース システムへの変更をほぼリアルタイムで BigQuery でクエリできるようにし、同時にデータ ウェアハウスへの変更の適用パフォーマンスを最適化したいと考えています。
    コンピューティングのオーバーヘッドを削減しながら、最小限のレイテンシで BigQuery レポート テーブルに変更を反映できるようにするには、どの 2 つの手順を実行する必要がありますか? (2 つ選択してください。)