Hadoop エコシステムの 3 つのコア コンポーネントは、HDFS (大量のデータを保存および管理するための信頼性とスケーラブルなファイル システム)、MapReduce (大量のデータ セットを処理するための分散コンピューティング フレームワーク)、YARN (リソース管理フレームワーク) です。 、Hadoop クラスター内のリソースの管理とスケジュールを担当します)。
Hadoop の 3 つのコア コンポーネントの役割と機能
Hadoop 分散ファイル システム (HDFS)、MapReduce YARN は Hadoop エコシステムの 3 つのコア コンポーネントであり、データの処理と管理において重要な役割を果たします。
1. HDFS (Hadoop 分散ファイル システム)
-
機能: ストレージ用の信頼性が高く、スケーラブルなファイル システムであり、大量のファイルを管理しますデータ。
-
機能:
- データをチャンクに分割し、クラスター内の複数のノードに分散します。
- 高い耐障害性を提供し、冗長ストレージによってデータを障害から保護します。
- 高スループット要件を満たすために、同時読み取りおよび書き込みアクセスをサポートします。
2. MapReduce
-
関数: 大量のデータセットの処理と処理に使用されます。コンピューティングフレームワーク。
-
関数:
- ジョブを Map (マッピング) と Reduce (リデュース) の 2 つのステージに分解します。
- クラスター内の複数のノードでジョブを並行して実行します。
- 中間結果を並べ替えて集計することにより、最終結果を提供します。
3. YARN (もう一つのリソース ネゴシエーター)
-
役割: リソース管理フレームワーク、Hadoop クラスター内のリソースの管理とスケジュールを担当します。
-
機能:
- アプリケーションのコンピューティング、メモリ、ストレージ リソースを割り当てて管理します。
- 統合されたスケジューリング メカニズムを提供し、さまざまなコンピューティング フレームワークをサポートします。
- 需要に応じてクラスターを動的にスケールアップおよびスケールダウンできるようにします。
以上がHadoop の 3 つのコア コンポーネントの役割と機能の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。