Professional-Data-Engineer 試験問題 86
以下の図に示すようなデータがあります。2 つの次元は X と Y で、各ドットの影はそれがどのクラスであるかを表します。線形アルゴリズムを使用して、このデータを正確に分類したいと考えています。これを行うには、合成機能を追加する必要があります。その機能の価値は何であるべきでしょうか?


Professional-Data-Engineer 試験問題 87
データポイントを取得して GUID を返すサービスを使用して、新しい Web サイトのユーザーにグローバル一意識別子 (GUID) を与える必要があります。このデータは、パイプライン内のマイクロサービスを介して行う HTTP 呼び出しを介して内部システムと外部システムの両方から取得されます。 1 秒あたり数万のメッセージが発生し、マルチスレッド化される可能性があるため、システムのバックプレッシャーが心配です。バックプレッシャーを最小限に抑えるには、パイプラインをどのように設計すればよいでしょうか?
Professional-Data-Engineer 試験問題 88
Flowlogistic は、リアルタイム在庫追跡システムを展開しています。すべての追跡デバイスはパッケージ追跡メッセージを送信し、Apache Kafka クラスターではなく単一の Google Cloud Pub/Sub トピックに送信されるようになります。その後、サブスクライバー アプリケーションがリアルタイム レポート用にメッセージを処理し、履歴分析のために Google BigQuery に保存します。パッケージ データを長期にわたって確実に分析できるようにしたいと考えています。
どのアプローチを取るべきですか?
どのアプローチを取るべきですか?
Professional-Data-Engineer 試験問題 89
ソーシャル メディアの投稿を Google BigQuery に保存し、1 分あたり 10,000 メッセージの速度でほぼリアルタイムで分析する必要があります。最初に、個々の投稿にストリーミング挿入を使用するようにアプリケーションを設計します。
アプリケーションは、ストリーミング挿入の直後にデータ集計も実行します。ストリーミング挿入後のクエリは強い整合性を示しておらず、クエリからのレポートには処理中のデータが欠落している可能性があることがわかりました。アプリケーションのデザインを調整するにはどうすればよいでしょうか?
アプリケーションは、ストリーミング挿入の直後にデータ集計も実行します。ストリーミング挿入後のクエリは強い整合性を示しておらず、クエリからのレポートには処理中のデータが欠落している可能性があることがわかりました。アプリケーションのデザインを調整するにはどうすればよいでしょうか?
Professional-Data-Engineer 試験問題 90
あなたは、Google Cloud 上のレコメンデーション エンジンを使用するアプリケーションを開発しています。ソリューションでは、過去の視聴に基づいて新しい動画を顧客に表示する必要があります。ソリューションでは、顧客が視聴したビデオ内のエンティティのラベルを生成する必要があります。設計では、数 TB のデータに関する他の顧客の好みのデータに基づいて、非常に高速なフィルター提案を提供できる必要があります。あなたは何をするべきか?
