Professional-Data-Engineer 試験問題 231
顧客の販売コンバージョンにつながる要因を識別するモデルを開発しています。データ a の処理は完了しました。モデル開発ライフサイクルを続行します。次に何をすべきでしょうか。
Professional-Data-Engineer 試験問題 232
3 つのクリニックの数百人の患者を対象にしたパイロット プロジェクトとして、患者記録用のデータベースを設計しました。設計では、すべての患者とその診察を 1 つのデータベース テーブルで表し、自己結合を使用してレポートを生成しました。サーバー リソースの使用率は 50% でした。その後、プロジェクトの範囲は拡大しました。データベースには、100 倍の患者記録を保存する必要があります。レポートは実行できなくなりました。時間がかかりすぎるか、コンピューティング リソースが不足してエラーが発生するためです。データベース設計をどのように調整すればよいでしょうか。
Professional-Data-Engineer 試験問題 233
ストリーミング Cloud Dataflow パイプラインを運用しています。エンジニアは、異なるウィンドウ アルゴリズムとトリガー戦略を備えた新しいバージョンのパイプラインを持っています。実行中のパイプラインを新しいバージョンに更新したいと考えています。更新中にデータが失われないようにする必要があります。どうすればよいでしょうか。
Professional-Data-Engineer 試験問題 234
Cloud Machine Learning Engine の CUSTOM 層では、どのタイプのクラスタ ノードの数を指定できますか?
Professional-Data-Engineer 試験問題 235
BigQuery を集中分析プラットフォームとして使用しています。新しいデータが毎日読み込まれ、ETL パイプラインが元のデータを変更して最終ユーザー向けに準備します。この ETL パイプラインは定期的に変更され、エラーが発生する可能性がありますが、エラーが 2 週間後にのみ検出されることもあります。これらのエラーから回復する方法を提供する必要があり、バックアップはストレージ コストに合わせて最適化する必要があります。BigQuery でデータをどのように整理し、バックアップをどのように保存すればよいでしょうか。
