Professional-Data-Engineer 試験問題 101
Google Cloud Bigtable は、各行の単一の値にインデックスを付けます。この値は_______と呼ばれます。
Professional-Data-Engineer 試験問題 102
Google データポータル 360 で大規模なチーム用の新しいレポートを作成します。このレポートは、データ ソースとして Google BigQuery を使用します。従業員が自分の地域に関連付けられたデータのみを表示できるようにすることが会社のポリシーであるため、地域ごとにテーブルを作成してデータを入力します。データへの地域アクセス ポリシーを適用する必要があります。
どの 2 つのアクションを取る必要がありますか? (2つお選びください。)
どの 2 つのアクションを取る必要がありますか? (2つお選びください。)
Professional-Data-Engineer 試験問題 103
ケーススタディ: 2、
フローロジスティックのケーススタディ
会社概要
Flowlogistic は、物流およびサプライ チェーンの大手プロバイダーです。これらは、世界中の企業がリソースを管理し、最終目的地に輸送するのに役立ちます。同社は急速に成長し、そのサービスを鉄道、トラック、航空機、海洋輸送にまで拡大しました。
会社背景
同社は地域のトラック運送会社としてスタートし、その後他の物流市場にも拡大しました。
インフラストラクチャを更新していないため、注文と出荷の管理と追跡がボトルネックになっています。業務を改善するために、Flowlogistic は荷物レベルでリアルタイムに出荷を追跡する独自のテクノロジーを開発しました。ただし、Apache Kafka に基づくテクノロジー スタックが処理量をサポートできないため、これをデプロイすることはできません。さらに、Flowlogistic は注文と出荷をさらに分析して、リソースを最適に配置する方法を決定したいと考えています。
ソリューションコンセプト
Flowlogistic は、クラウドを使用して 2 つのコンセプトを実装したいと考えています。
荷物の位置を示すリアルタイムの在庫追跡システムで独自のテクノロジーを使用します。構造化データと非構造化データの両方を含むすべての注文と出荷ログの分析を実行して、リソースを配置する最適な方法と拡大する市場を決定します。情報。また、予測分析を使用して、出荷がいつ遅れるかを早期に把握したいと考えています。
既存の技術環境
フローロジスティック アーキテクチャは単一のデータ センターに存在します。
データベース
2 つのクラスターに 8 台の物理サーバー
SQL Server - ユーザー データ、インベントリ、静的データ
3 つの物理サーバー
Cassandra - メタデータ、メッセージの追跡
10 台の Kafka サーバー - メッセージの集約とバッチ挿入の追跡
アプリケーション サーバー - 顧客のフロント エンド、注文/カスタム用のミドルウェア 20 台の物理サーバーにわたる 60 台の仮想マシン Tomcat - Java サービス Nginx - 静的コンテンツ バッチ サーバー ストレージ アプライアンス 仮想マシン (VM) ホスト用の iSCSI ファイバー チャネル ストレージ エリア ネットワーク (FC SAN) ?SQLサーバー ストレージ ネットワーク接続ストレージ (NAS) イメージ ストレージ、ログ、バックアップ Apache Hadoop /Spark サーバー Core Data Lake データ分析ワークロード
20 のさまざまなサーバー
Jenkins、モニタリング、要塞ホスト、
ビジネス要件
スケールの大きな実稼働環境を使用して、信頼性が高く再現可能な環境を構築します。分析のために一元化されたデータレイクにデータを集約 履歴データを使用して、将来の出荷に関する予測分析を実行 独自のテクノロジーを使用して世界中のすべての出荷を正確に追跡 新しいリソースの迅速なプロビジョニングにより、ビジネスの機敏性とイノベーションの速度を向上 クラウドでのパフォーマンスのためのアーキテクチャを分析および最適化 移行他のすべての要件が満たされている場合、完全にクラウドに移行する 技術要件 ストリーミング データとバッチ データの両方を処理する 既存の Hadoop ワークロードを移行する 企業の変化する要求に対応できるスケーラブルで弾力性のあるアーキテクチャを確保する
可能な限りマネージド サービスを使用する
データ フライトと保存時の暗号化
本番データセンターとクラウド環境の間に VPN を接続する SEO ステートメント 当社は急速に成長してきたため、インフラストラクチャをアップグレードできないことが、さらなる成長と効率性を実際に妨げています。当社は世界中で荷物を効率的に移動させますが、データを移動させるのは非効率的です。
顧客がどこにいるのか、何を出荷しているのかをより簡単に理解できるように、情報を整理する必要があります。
CTO ステートメント
当社にとって IT はこれまで決して優先事項ではなかったので、データが増大する一方でテクノロジーへの投資が十分ではありませんでした。IT を管理する優秀なスタッフがいますが、彼らはインフラストラクチャの管理で忙しいため、データの整理、分析の構築、CFO の実装方法の検討など、本当に重要なことを彼らにやってもらうことができません。追跡技術。
CFO ステートメント
当社の競争上の優位性の 1 つは、出荷と配達の遅延に対してペナルティを課していることです。出荷品がどこにあるかを常に把握することは、当社の収益と収益性と直接的な相関関係があります。
さらに、サーバー環境の構築に資金を投入したくありません。
Flowlogistic は Google BigQuery を主要な分析システムとして使用したいと考えていますが、BigQuery に移行できない Apache Hadoop と Spark のワークロードがまだ残っています。Flowlogistic は、両方のワークロードに共通のデータを保存する方法を知りません。彼らは何をすべきでしょうか?
フローロジスティックのケーススタディ
会社概要
Flowlogistic は、物流およびサプライ チェーンの大手プロバイダーです。これらは、世界中の企業がリソースを管理し、最終目的地に輸送するのに役立ちます。同社は急速に成長し、そのサービスを鉄道、トラック、航空機、海洋輸送にまで拡大しました。
会社背景
同社は地域のトラック運送会社としてスタートし、その後他の物流市場にも拡大しました。
インフラストラクチャを更新していないため、注文と出荷の管理と追跡がボトルネックになっています。業務を改善するために、Flowlogistic は荷物レベルでリアルタイムに出荷を追跡する独自のテクノロジーを開発しました。ただし、Apache Kafka に基づくテクノロジー スタックが処理量をサポートできないため、これをデプロイすることはできません。さらに、Flowlogistic は注文と出荷をさらに分析して、リソースを最適に配置する方法を決定したいと考えています。
ソリューションコンセプト
Flowlogistic は、クラウドを使用して 2 つのコンセプトを実装したいと考えています。
荷物の位置を示すリアルタイムの在庫追跡システムで独自のテクノロジーを使用します。構造化データと非構造化データの両方を含むすべての注文と出荷ログの分析を実行して、リソースを配置する最適な方法と拡大する市場を決定します。情報。また、予測分析を使用して、出荷がいつ遅れるかを早期に把握したいと考えています。
既存の技術環境
フローロジスティック アーキテクチャは単一のデータ センターに存在します。
データベース
2 つのクラスターに 8 台の物理サーバー
SQL Server - ユーザー データ、インベントリ、静的データ
3 つの物理サーバー
Cassandra - メタデータ、メッセージの追跡
10 台の Kafka サーバー - メッセージの集約とバッチ挿入の追跡
アプリケーション サーバー - 顧客のフロント エンド、注文/カスタム用のミドルウェア 20 台の物理サーバーにわたる 60 台の仮想マシン Tomcat - Java サービス Nginx - 静的コンテンツ バッチ サーバー ストレージ アプライアンス 仮想マシン (VM) ホスト用の iSCSI ファイバー チャネル ストレージ エリア ネットワーク (FC SAN) ?SQLサーバー ストレージ ネットワーク接続ストレージ (NAS) イメージ ストレージ、ログ、バックアップ Apache Hadoop /Spark サーバー Core Data Lake データ分析ワークロード
20 のさまざまなサーバー
Jenkins、モニタリング、要塞ホスト、
ビジネス要件
スケールの大きな実稼働環境を使用して、信頼性が高く再現可能な環境を構築します。分析のために一元化されたデータレイクにデータを集約 履歴データを使用して、将来の出荷に関する予測分析を実行 独自のテクノロジーを使用して世界中のすべての出荷を正確に追跡 新しいリソースの迅速なプロビジョニングにより、ビジネスの機敏性とイノベーションの速度を向上 クラウドでのパフォーマンスのためのアーキテクチャを分析および最適化 移行他のすべての要件が満たされている場合、完全にクラウドに移行する 技術要件 ストリーミング データとバッチ データの両方を処理する 既存の Hadoop ワークロードを移行する 企業の変化する要求に対応できるスケーラブルで弾力性のあるアーキテクチャを確保する
可能な限りマネージド サービスを使用する
データ フライトと保存時の暗号化
本番データセンターとクラウド環境の間に VPN を接続する SEO ステートメント 当社は急速に成長してきたため、インフラストラクチャをアップグレードできないことが、さらなる成長と効率性を実際に妨げています。当社は世界中で荷物を効率的に移動させますが、データを移動させるのは非効率的です。
顧客がどこにいるのか、何を出荷しているのかをより簡単に理解できるように、情報を整理する必要があります。
CTO ステートメント
当社にとって IT はこれまで決して優先事項ではなかったので、データが増大する一方でテクノロジーへの投資が十分ではありませんでした。IT を管理する優秀なスタッフがいますが、彼らはインフラストラクチャの管理で忙しいため、データの整理、分析の構築、CFO の実装方法の検討など、本当に重要なことを彼らにやってもらうことができません。追跡技術。
CFO ステートメント
当社の競争上の優位性の 1 つは、出荷と配達の遅延に対してペナルティを課していることです。出荷品がどこにあるかを常に把握することは、当社の収益と収益性と直接的な相関関係があります。
さらに、サーバー環境の構築に資金を投入したくありません。
Flowlogistic は Google BigQuery を主要な分析システムとして使用したいと考えていますが、BigQuery に移行できない Apache Hadoop と Spark のワークロードがまだ残っています。Flowlogistic は、両方のワークロードに共通のデータを保存する方法を知りません。彼らは何をすべきでしょうか?
Professional-Data-Engineer 試験問題 104
Cloud Dataproc Viewer はどのアクションを実行できますか?
Professional-Data-Engineer 試験問題 105
天気予報アプリは、15 分ごとにデータベースにクエリを実行して、現在の気温を取得します。フロントエンドは Google App Engine を利用しており、数百万のユーザーにサーバーを提供します。データベース障害に対応するフロントエンドをどのように設計すればよいでしょうか?
