Greenplum (GPDB) はオープンソースです! ~
Greenplum Database (GPDB) は、シェアードナッシングの超並列処理データベースであり、主にデータ ウェアハウジング、ビジネス インテリジェンス (OLAP)、データ マイニングなどの大規模なデータ分析タスクを処理するために使用されます。 GPDB は、大規模なデータ分析用に特別に設計されており、最先端のコストベースのクエリ オプティマイザーを使用しており、ペタバイト レベルのデータを迅速かつ効率的にクエリおよび分析できます。
PostgresQL に基づく商用バージョンのデータベース GreenPlum は、現在 GitHub に公開されています: https://github.com/greenplum-db/gpdb。データベース愛好家は、いくつかの高度な SQL クエリをより簡単に参照できます。機能の実装方法を分析します。
Greenplum データベース サーバー ソフトウェアは、高度なフル機能のオープンソース データ ウェアハウス管理ソフトウェアです。ペタバイトレベルのデータに対して強力かつ効率的な分析機能を提供します。特にビッグデータ分析の分野では、Greenplum Database はコンピューティングコストに基づいた世界最先端のクエリオプティマイザーを備えており、ビッグデータに対する高いクエリおよび分析パフォーマンスを実現します。
Greenplum オープンソース プロジェクトは現在、Apache 2 著作権契約を使用しています。 Greenplum はまた、製品に貢献してくださったコミュニティ貢献者やその他の愛好家に感謝の意を表したいと思います。 Greenplus コミュニティにとって、製品へのいかなる形態の貢献も非常に意味があり、Greenplum もあらゆる形態の貢献を高く評価し、奨励します。
「オープンソースの大規模並列データ ウェアハウス」
Greenplum データベースの概要
- Greenplum は PostgreSQL に基づいて開発され、データ ウェアハウスの運用に関連する多くの重要な革新的な開発が追加されています。並列処理 処理アーキテクチャ: Greenplum のデータベースは、すべてのデータとクエリに対して並列処理機能を自動的に提供します。
- PB レベルの負荷処理機能: MPP テクノロジーを使用することで、高負荷下でも高いパフォーマンスを維持でき、各ラックは 1 時間あたり最大で処理できます。 10Tのデータ。
- 革新的なクエリ オプティマイザー: Greenplum は、ビッグ データ ロードのコスト優先原則に基づいてクエリ オプティマイザーを設計した業界初の製品で、インタラクティブ モードまたはバッチ処理モードでパフォーマンスを低下させることなく、PB レベルのビッグ データを実現できます。クエリのパフォーマンスとデータ処理のスループットを前提として実行されます。
- ポリモーフィックなデータの保存と実行: テーブルまたはパーティションの保存、実行、圧縮設定は、アクセス方法に応じて柔軟に構成できます。行レベルまたは列レベルのデータを保存または処理する場合、ユーザーはニーズに応じて選択できます。
- 高度な機械学習機能: Apache MADLib ライブラリの導入後、Greenplum Database ではユーザーのカスタマイズ機能を通じて内部分析機能が拡張されています。
- 関連リンク:
1. Greenplum のソース コードとドキュメントおよび関連情報: http://greenplum.org/
2. Greenplum のソース コード: https://github.com/greenplum-db
3.ウェブサイト: https://pivotal.io/big-data/pivotal-greenplum
http://www.bkjia.com/PHPjc/1067481.html
www.bkjia.comtruehttp://www.bkjia.com/PHPjc/1067481.html技術記事 Greenplum (GPDB) はオープンソースです。 ~ Greenplum Database (GPDB) は、シェアードナッシングの超並列処理データベースであり、主にデータ ウェアハウスなどの大規模なデータ分析タスクを処理するために使用されます...