Professional-Data-Engineer 試験問題 201
You are creating a data model in BigQuery that will hold retail transaction data. Your two largest tables, sales_transation_header and sales_transation_line. have a tightly coupled immutable relationship. These tables are rarely modified after load and are frequently joined when queried. You need to model the sales_transation_header and sales_transation_line tables to improve the performance of data analytics queries.
What should you do?
What should you do?
Professional-Data-Engineer 試験問題 202
Flowlogistic は、リアルタイムの在庫追跡システムを展開しています。追跡デバイスはすべて荷物追跡メッセージを送信しますが、そのメッセージは Apache Kafka クラスタではなく、単一の Google Cloud Pub/Sub トピックに送信されます。その後、サブスクライバー アプリケーションがメッセージを処理してリアルタイム レポートを作成し、履歴分析のために Google BigQuery に保存します。荷物データを時間の経過とともに分析できるようにする必要があります。
どのようなアプローチを取るべきでしょうか?
どのようなアプローチを取るべきでしょうか?
Professional-Data-Engineer 試験問題 203
最近の価格履歴に基づいて特定の株式の価格を予測する機械学習モデルを作成する場合、どのようなタイプの推定器を使用すればよいでしょうか?
Professional-Data-Engineer 試験問題 204
あなたの会社の経営者から銀行取引のデータベースを渡されました。各行には、ユーザー ID、取引タイプ、取引場所、取引金額が含まれています。彼らは、データにどのようなタイプの機械学習を適用できるかを調査するように依頼しています。どの 3 つの機械学習アプリケーションを使用できますか? (3 つ選択してください。)
Professional-Data-Engineer 試験問題 205
Which Cloud Dataflow / Beam feature should you use to aggregate data in an unbounded data source every hour based on the time when the data entered the pipeline?
