Professional-Data-Engineer 試験問題 61
MariaDB SQL データベースを GCE VM インスタンスにデプロイしており、モニタリングとアラートを構成する必要があります。最小限の開発労力でネットワーク接続、ディスク IO、レプリケーション ステータスなどの指標を MariaDB から収集し、ダッシュボードとアラートに StackDriver を使用したいと考えています。
あなたは何をするべきか?
あなたは何をするべきか?
Professional-Data-Engineer 試験問題 62
テーブルの最初の 3 列のみに対する読み取り権限をユーザーに与えるには、どのアクセス制御方法を使用しますか?
Professional-Data-Engineer 試験問題 63
あなたは、e コマース会社向けにバスケット放棄システムを設計しています。システムは、次のルールに基づいてユーザーにメッセージを送信します。
サイト上でユーザーによる操作が 1 時間行われない

30 ドル以上の商品をバスケットに追加した

取引
Google Cloud Dataflow を使用してデータを処理し、メッセージを送信するかどうかを決定します。パイプラインをどのように設計すればよいでしょうか?
サイト上でユーザーによる操作が 1 時間行われない

30 ドル以上の商品をバスケットに追加した

取引
Google Cloud Dataflow を使用してデータを処理し、メッセージを送信するかどうかを決定します。パイプラインをどのように設計すればよいでしょうか?
Professional-Data-Engineer 試験問題 64
オンライン証券会社には、大量の取引処理アーキテクチャが必要です。ジョブをトリガーする安全なキュー システムを作成する必要があります。ジョブは Google Cloud で実行され、同社の Python API を利用して取引を実行します。ソリューションを効率的に実装する必要があります。あなたは何をするべきか?
Professional-Data-Engineer 試験問題 65
MJTelco の導入事例
会社概要
MJTelco は、急速に成長している世界中の十分なサービスが提供されていない市場にネットワークを構築することを計画している新興企業です。同社は革新的な光通信ハードウェアに関する特許を取得しています。これらの特許に基づいて、安価なハードウェアを使用して信頼性の高い高速バックボーン リンクを多数作成できます。
会社背景
経験豊富な通信会社幹部によって設立された MJTelco は、もともと宇宙での通信の課題を克服するために開発されたテクノロジーを使用しています。運用の基礎として、リアルタイム分析を推進し、機械学習を組み込んでトポロジを継続的に最適化する分散データ インフラストラクチャを作成する必要があります。同社のハードウェアは安価であるため、場所の可用性とコストに対する動的な地域政治の影響を考慮して、ネットワークを過剰に展開することを計画しています。
同社の管理および運用チームは世界中に配置されており、システム内のデータ利用者と提供の間に多対多の関係を構築しています。慎重に検討した結果、パブリック クラウドがニーズをサポートするのに最適な環境であると判断しました。
ソリューションコンセプト
MJTelco は、自社の研究所で概念実証 (PoC) プロジェクトを成功させています。彼らには 2 つの主要なニーズがあります。
* PoC を拡張および強化して、次の値を超える場合に生成される大幅に多くのデータ フローをサポートします。
50,000 インストール。
* 機械学習サイクルを改良して、トポロジー定義の制御に使用する動的モデルを検証および改善します。
また、MJTelco は、実験の実行、新機能の導入、および実稼働顧客へのサービス提供のニーズを満たすために、開発/テスト、ステージング、実稼働という 3 つの異なるオペレーティング環境を使用します。
ビジネス要件
* 最小限のコストで運用環境をスケールアップし、予測不可能な分散型通信ユーザー コミュニティで必要なときに必要な場所でリソースをインスタンス化します。
* 独自のデータのセキュリティを確保して、最先端の機械学習と分析を保護します。
* 分散した研究員が分析用データに確実かつタイムリーにアクセスできるようにする
* 顧客に影響を与えることなく、機械学習モデルの迅速な反復をサポートする隔離された環境を維持します。
技術的要件
テレメトリ データの安全かつ効率的な転送と保存を確保します。
インスタンスを迅速に拡張して、それぞれ複数のフローを持つ 10,000 ~ 100,000 のデータ プロバイダーをサポートします。
1 日あたり約 100m レコードを保存する最大 2 年間のデータを追跡するデータ テーブルに対する分析とプレゼンテーションが可能 テレメトリ フローと実稼働学習サイクルの両方におけるデータ パイプラインの問題の認識に焦点を当てたモニタリング インフラストラクチャの迅速な反復をサポートします。
CEOの声明
当社のビジネス モデルは、特許、分析、動的機械学習に依存しています。当社の安価なハードウェアは信頼性が高くなるように構成されているため、コスト面でのメリットが得られます。信頼性と容量の約束を満たすために、大規模な分散データ パイプラインを迅速に安定させる必要があります。
CTO ステートメント
当社のパブリック クラウド サービスは、宣伝どおりに動作する必要があります。データを拡張し、安全に保つためのリソースが必要です。
データサイエンティストがモデルを注意深く研究し、迅速に適応できる環境も必要です。
私たちは自動化に依存してデータを処理しているため、反復中に機能する開発環境とテスト環境も必要です。
CFO ステートメント
プロジェクトが大きすぎるため、データと分析に必要なハードウェアとソフトウェアを維持できません。また、非常に多くのデータ フィードを監視するための運用チームに人員を配置する余裕はないため、自動化とインフラストラクチャに依存することになります。Google Cloud の機械学習により、定量的研究者はデータ パイプラインの問題ではなく、価値の高い問題に取り組むことができるようになります。
次の要件を満たす運用チーム向けのビジュアライゼーションを作成する必要があります。
* テレメトリには、最近 6 週間の 50,000 件のインストールすべてからのデータが含まれている必要があります (1 分ごとにサンプリング)
* レポートはライブ データから 3 時間以上遅れてはいけません。
* 実用的なレポートには、最適ではないリンクのみが表示されます。
* ほとんどの次善のリンクは上部にソートされる必要があります。
* 最適ではないリンクは、地域ごとにグループ化およびフィルタリングできます。
* レポートをロードするためのユーザーの応答時間は 5 秒未満である必要があります。
過去 6 週間のデータを保存するデータ ソースを作成し、複数の日付範囲、個別の地理的地域、および固有のインストール タイプを表示できるビジュアライゼーションを作成します。ビジュアライゼーションを変更することなく、常に最新のデータを表示できます。毎月新しいビジュアライゼーションを作成および更新することは避けたいと考えています。あなたは何をするべきか?
会社概要
MJTelco は、急速に成長している世界中の十分なサービスが提供されていない市場にネットワークを構築することを計画している新興企業です。同社は革新的な光通信ハードウェアに関する特許を取得しています。これらの特許に基づいて、安価なハードウェアを使用して信頼性の高い高速バックボーン リンクを多数作成できます。
会社背景
経験豊富な通信会社幹部によって設立された MJTelco は、もともと宇宙での通信の課題を克服するために開発されたテクノロジーを使用しています。運用の基礎として、リアルタイム分析を推進し、機械学習を組み込んでトポロジを継続的に最適化する分散データ インフラストラクチャを作成する必要があります。同社のハードウェアは安価であるため、場所の可用性とコストに対する動的な地域政治の影響を考慮して、ネットワークを過剰に展開することを計画しています。
同社の管理および運用チームは世界中に配置されており、システム内のデータ利用者と提供の間に多対多の関係を構築しています。慎重に検討した結果、パブリック クラウドがニーズをサポートするのに最適な環境であると判断しました。
ソリューションコンセプト
MJTelco は、自社の研究所で概念実証 (PoC) プロジェクトを成功させています。彼らには 2 つの主要なニーズがあります。
* PoC を拡張および強化して、次の値を超える場合に生成される大幅に多くのデータ フローをサポートします。
50,000 インストール。
* 機械学習サイクルを改良して、トポロジー定義の制御に使用する動的モデルを検証および改善します。
また、MJTelco は、実験の実行、新機能の導入、および実稼働顧客へのサービス提供のニーズを満たすために、開発/テスト、ステージング、実稼働という 3 つの異なるオペレーティング環境を使用します。
ビジネス要件
* 最小限のコストで運用環境をスケールアップし、予測不可能な分散型通信ユーザー コミュニティで必要なときに必要な場所でリソースをインスタンス化します。
* 独自のデータのセキュリティを確保して、最先端の機械学習と分析を保護します。
* 分散した研究員が分析用データに確実かつタイムリーにアクセスできるようにする
* 顧客に影響を与えることなく、機械学習モデルの迅速な反復をサポートする隔離された環境を維持します。
技術的要件
テレメトリ データの安全かつ効率的な転送と保存を確保します。
インスタンスを迅速に拡張して、それぞれ複数のフローを持つ 10,000 ~ 100,000 のデータ プロバイダーをサポートします。
1 日あたり約 100m レコードを保存する最大 2 年間のデータを追跡するデータ テーブルに対する分析とプレゼンテーションが可能 テレメトリ フローと実稼働学習サイクルの両方におけるデータ パイプラインの問題の認識に焦点を当てたモニタリング インフラストラクチャの迅速な反復をサポートします。
CEOの声明
当社のビジネス モデルは、特許、分析、動的機械学習に依存しています。当社の安価なハードウェアは信頼性が高くなるように構成されているため、コスト面でのメリットが得られます。信頼性と容量の約束を満たすために、大規模な分散データ パイプラインを迅速に安定させる必要があります。
CTO ステートメント
当社のパブリック クラウド サービスは、宣伝どおりに動作する必要があります。データを拡張し、安全に保つためのリソースが必要です。
データサイエンティストがモデルを注意深く研究し、迅速に適応できる環境も必要です。
私たちは自動化に依存してデータを処理しているため、反復中に機能する開発環境とテスト環境も必要です。
CFO ステートメント
プロジェクトが大きすぎるため、データと分析に必要なハードウェアとソフトウェアを維持できません。また、非常に多くのデータ フィードを監視するための運用チームに人員を配置する余裕はないため、自動化とインフラストラクチャに依存することになります。Google Cloud の機械学習により、定量的研究者はデータ パイプラインの問題ではなく、価値の高い問題に取り組むことができるようになります。
次の要件を満たす運用チーム向けのビジュアライゼーションを作成する必要があります。
* テレメトリには、最近 6 週間の 50,000 件のインストールすべてからのデータが含まれている必要があります (1 分ごとにサンプリング)
* レポートはライブ データから 3 時間以上遅れてはいけません。
* 実用的なレポートには、最適ではないリンクのみが表示されます。
* ほとんどの次善のリンクは上部にソートされる必要があります。
* 最適ではないリンクは、地域ごとにグループ化およびフィルタリングできます。
* レポートをロードするためのユーザーの応答時間は 5 秒未満である必要があります。
過去 6 週間のデータを保存するデータ ソースを作成し、複数の日付範囲、個別の地理的地域、および固有のインストール タイプを表示できるビジュアライゼーションを作成します。ビジュアライゼーションを変更することなく、常に最新のデータを表示できます。毎月新しいビジュアライゼーションを作成および更新することは避けたいと考えています。あなたは何をするべきか?
