Professional-Data-Engineer 試験問題 141
天気予報アプリは、15 分ごとにデータベースにクエリを実行して、現在の気温を取得します。フロントエンドは Google App Engine を利用しており、数百万のユーザーにサーバーを提供します。データベース障害に対応するフロントエンドをどのように設計すればよいでしょうか?
Professional-Data-Engineer 試験問題 142
あなたの会社は、データの取り込みと配信を一元化するシステムを選択しています。あなたは、要件に対処するためにメッセージング システムとデータ統合システムを検討しています。主な要件は次のとおりです。
* トピック内の特定のオフセット (おそらくこれまでにキャプチャされたすべてのデータの先頭に戻る) をシークする機能
* 数百のトピックに関するパブリッシュ/サブスクライブ セマンティクスのサポート
* キーごとの順序を保持
どのシステムを選択すればよいでしょうか?
* トピック内の特定のオフセット (おそらくこれまでにキャプチャされたすべてのデータの先頭に戻る) をシークする機能
* 数百のトピックに関するパブリッシュ/サブスクライブ セマンティクスのサポート
* キーごとの順序を保持
どのシステムを選択すればよいでしょうか?
Professional-Data-Engineer 試験問題 143
あなたの会社は、Google Cloud Dataflow で学習アルゴリズムのデータ前処理を実行しています。このステップ中に多数のデータ ログが生成されており、チームはそれらを分析したいと考えています。キャンペーンの動的な性質により、データは時間ごとに指数関数的に増加しています。
データ サイエンティストは、ログ内の新しい重要な機能のデータを読み取るために次のコードを作成しました。
BigQueryIO.Read
.named("ReadLogData")
.from("clouddataflow-readonly:samples.log_data")
このデータ読み取りのパフォーマンスを向上させたいと考えています。あなたは何をするべきか?
データ サイエンティストは、ログ内の新しい重要な機能のデータを読み取るために次のコードを作成しました。
BigQueryIO.Read
.named("ReadLogData")
.from("clouddataflow-readonly:samples.log_data")
このデータ読み取りのパフォーマンスを向上させたいと考えています。あなたは何をするべきか?
Professional-Data-Engineer 試験問題 144
あなたはストリーミング Cloud Dataflow パイプラインを操作しています。エンジニアは、異なるウィンドウ処理アルゴリズムとトリガー戦略を備えた新しいバージョンのパイプラインを使用しています。実行中のパイプラインを新しいバージョンで更新したいと考えています。更新中にデータが失われないようにしたいと考えています。あなたは何をするべきか?
Professional-Data-Engineer 試験問題 145
あなたは会社用に新しいリアルタイム データ ウェアハウスを構築しており、Google BigQuery ストリーミング挿入を使用する予定です。データが 1 回だけ送信されるという保証はありませんが、データの各行に一意の ID とイベント タイムスタンプがあります。対話的にデータをクエリするときに、重複が含まれないようにしたいと考えています。どのクエリ タイプを使用する必要がありますか?
