Professional-Data-Engineer 試験問題 246
数百万台のモノのインターネット(IoT)デバイスから送信されるテレメトリデータを処理するために、NoSQLデータベースを選択しています。データ量は年間100TBのペースで増加しており、各データエントリには約100個の属性があります。データ処理パイプラインには、原子性、一貫性、独立性、永続性(ACID)は不要ですが、高可用性と低レイテンシは必要です。個々のフィールドに対してクエリを実行してデータを分析する必要があります。要件を満たすデータベースを3つ選択してください。
Professional-Data-Engineer 試験問題 247
組織サンプルに関する情報データベースを用いて、将来の組織サンプルを正常か変異かに分類したいと考えています。組織サンプルの分類に教師なし異常検出法を適用したいと考えています。この方法を支持する2つの特性はどれですか?(2つ選択してください。)
Professional-Data-Engineer 試験問題 248
あなたは広告会社に勤務しており、広告ブロックのクリックスルー率を予測する Spark ML モデルを開発しました。これまではすべてオンプレミスのデータセンターで開発していましたが、現在、Google Cloud への移行を進めています。データセンターは間もなく閉鎖されるため、迅速なリフト&シフト方式の移行が必要です。ただし、これまで使用していたデータは BigQuery に移行されます。
Spark ML モデルを定期的に再トレーニングするため、既存のトレーニング パイプラインを Google Cloud に移行する必要があります。どうすればよいでしょうか。
Spark ML モデルを定期的に再トレーニングするため、既存のトレーニング パイプラインを Google Cloud に移行する必要があります。どうすればよいでしょうか。
Professional-Data-Engineer 試験問題 249
Cloud Dataproc でサポートされているジョブタイプは次のどれですか (3 つ選択してください)。
Professional-Data-Engineer 試験問題 250
組織内の様々なチームが、顧客データとパフォーマンスデータをBigOueryに保存しています。各チームは収集したデータを完全に管理し、プロジェクト内でデータクエリを実行し、他のチームとデータを交換できる必要があります。運用タスクとコストを最小限に抑えながら、組織全体にわたるソリューションを実装する必要があります。どうすればよいでしょうか?
