Professional-Data-Engineer 試験問題 71
BigQueryで小売取引データを保持するデータモデルを作成しています。2つの最も大きなテーブル、sales_transation_headerとsales_transation_lineは、密結合された不変の関係にあります。これらのテーブルは、ロード後に変更されることはほとんどなく、クエリ実行時に頻繁に結合されます。データ分析クエリのパフォーマンスを向上させるには、sales_transation_headerテーブルとsales_transation_lineテーブルをモデル化する必要があります。
何をすべきでしょうか?
何をすべきでしょうか?
Professional-Data-Engineer 試験問題 72
ニューラル ネットワークがトレーニング データセットから学習するときに調整される数値はどれですか (2 つの回答を選択)。
Professional-Data-Engineer 試験問題 73
数百万台のモノのインターネット(IoT)デバイスから送信されるテレメトリデータを処理するために、NoSQLデータベースを選択しています。データ量は年間100TBのペースで増加しており、各データエントリには約100個の属性があります。データ処理パイプラインには、原子性、一貫性、独立性、永続性(ACID)は不要ですが、高可用性と低レイテンシは必要です。
個々のフィールドに対してクエリを実行してデータを分析する必要があります。要件を満たすデータベースを3つ選択してください。
個々のフィールドに対してクエリを実行してデータを分析する必要があります。要件を満たすデータベースを3つ選択してください。
Professional-Data-Engineer 試験問題 74
次の条件を満たすクラウドネイティブの履歴データ処理システムを設計しています。
* 分析対象のデータは CSV、Avro、PDF 形式で、Cloud Dataproc、BigQuery、Compute Engine などの複数の分析ツールからアクセスされます。
* ストリーミング データ パイプラインは毎日新しいデータを保存します。
* パフォーマンスはソリューションの要素ではありません。
* ソリューション設計では可用性を最大化する必要があります。
このソリューションのデータストレージをどのように設計すればよいでしょうか?
* 分析対象のデータは CSV、Avro、PDF 形式で、Cloud Dataproc、BigQuery、Compute Engine などの複数の分析ツールからアクセスされます。
* ストリーミング データ パイプラインは毎日新しいデータを保存します。
* パフォーマンスはソリューションの要素ではありません。
* ソリューション設計では可用性を最大化する必要があります。
このソリューションのデータストレージをどのように設計すればよいでしょうか?
Professional-Data-Engineer 試験問題 75
生放送のテレビ番組で、視聴者に携帯電話を使った投票を呼びかけています。このイベントでは、3分間で大量のデータが生成されます。あなたは投票システムの再構築*を担当し、プラットフォームが負荷に対応し、すべての投票が処理されるよう保証する必要があります。投票結果の一部を表示し、「投票受付中」と表示する必要があります。投票終了後、コストを最適化しながら、投票を1回だけ正確に集計する必要があります。どうすればよいでしょうか?


