Jadual Kandungan
0.写在前面:
1. Greenplum概述及架构
1.1. 什么是Greenplum
1.2. Greenplum 体系架构
1.2.1.Master Host
1.2.2.Segment Host
1.2.3.Interconnect
1.3.网络配置示例
1.4.Greenplum 高可用性体系架构
1.5.Master/Standby 镜像保护
1.6.数据冗余-Segment 镜像保护
1.7.Segment 主机硬件配置示例
1.8.网络冗余
Rumah pangkalan data tutorial mysql BigData-09-Greenplum概述及架构

BigData-09-Greenplum概述及架构

Jun 07, 2016 pm 04:12 PM
Seni bina

0.写在前面: 0.1. 此笔记是参考《Greenplum企业应用实战》、《PostgreSQL8.2.3 中文文档》和《Getting Started with Greenplum for Big Data Analytics》整理; 0.2. 《Greenplum企业应用实战》购买地址:【京东商城】 【 当当网】 0.3.参考网页(持续更新)

0.写在前面:

0.1. 此笔记是参考《Greenplum企业应用实战》、《PostgreSQL8.2.3 中文文档》和《Getting Started with Greenplum for Big Data Analytics》整理;

0.2. 《Greenplum企业应用实战》购买地址:【京东商城】 【 当当网】

0.3.参考网页(持续更新)

1) Shared Disk VS Shared Nothing分布式架构

1. Greenplum概述及架构

1.1. 什么是Greenplum

1) 为全球大型企业用户提供新型企业级数据仓库(EDW)、企业级数据云(EDC)和商务智能(BI)提供解决方案和咨询服务,专注于OLAP系统数据引擎开发;

2) 海量并行处理(Massively Parallel Processing) DBMS:

Greenplum的架构采用了MPP(大规模并行处理),在 MPP 系统中,每个 SMP节点也可以运行自己的操作系统、数据库等。换言之,每个节点内的 CPU 不能访问另一个节点的内存。节点之间的信息交互是通过节点互联网络实现的,这个过程一般称为数据重分配(Data Redistribution) 。

SMP(SymmetricMulti-Processing),对称多处理结构的简称,是指在一个计算机上汇集了一组处理器(多CPU),各CPU之间共享内存子系统以及总线结构。在这种技术的支持下,一个服务器系统可以同时运行多个处理器,并共享内存和其他的主机资源。传统的ORACLE和DB2均是此种类型,ORACLE RAC 是半共享状态;

与传统的SMP架构明显不同,通常情况下,MPP系统因为要在不同处理单元之间传送信息,所以它的效率要比SMP要差一点,但是这也不是绝对的,因为 MPP系统不共享资源,因此对它而言,资源比SMP要多,当需要处理的事务达到一定规模时,MPP的效率要比SMP好。这就是看通信时间占用计算时间的比例而定,如果通信时间比较多,那MPP系统就不占优势了,相反,如果通信时间比较少,那MPP系统可以充分发挥资源的优势,达到高效率。

3) 基于PostgreSQL 8.2开源版本,具有相同的客户端功能,增加支持并行处理的技术,增加支持数据仓库和BI的特性;

4) 外部表(external tables)/并行加载(parallel loading):外部表是指数据库可以直接使用操作系统中的数据文件,在Greenplum 4.2版本中支持对外部表的读写操作;

5) 资源管理:基于PostgreSQL增加了并行度的处理;

6) 查询优化器增强(query optimizer enhancements):增加对分布式的支持,空间的回收和分析,不需要进行多方面的调优。

1.2. Greenplum 体系架构

\

图一

Greenplum是一种基于ProstgreSQL的分布式数据库,其采用Shared-Nothing架构、主机、操作系统、内存、存储都是自我控制的,不存在共享。

补充:SharedDisk与Shared Nothing介绍

\

图二

\

图三

比较事项

概述

优点

缺点

使用场景

Shared Disk

如图二所示,所有节点共享一份数据

只要有一个节点就可以访问所有数据

内存融合限制水平扩展能力

Oracle RAC,24*7的高可用性核心业务

Shared Nothing

如图三所示,数据和节点有一一对应关系

每个节点交互少,很容易扩展

如果需要访问所有数据,需要所有节点都可用

SQL Server、DB2、Hadoop以及Greenplum

1.2.1.Master Host

1) 建立与客户端的会话连接和管理;

2) SQL的解析并形成分布式的执行计划;

3) 将生成好的执行计划分发到每个Segment上执行;

4) 收集Segment的执行结果;

5) 不存储业务数据,只存储数据字典;

6) 可以一主一备,分布在两台机器上,为了提高性能,最好单独占用一台机器。

1.2.2.Segment Host

1) 业务数据的存储和存取;

2) 执行由Master分发的SQL语句;

3) 对于Master来说,每个Segment都是对等的,负责对应数据的存储和计算;

4) 每一台机器上可以配置一到多个Segment,因此建议采用相同的机器配置。

1.2.3.Interconnect

1) 是GP数据库的网络层,在每个Segment中起到一个IPC作用;

2) 推荐使用千兆以太网交换机做Interconnect;

3) 支持UDP和TCP两种协议,推荐使用UDP协议,因为其高可靠性、高性能以及可扩展性;而TCP协议最高只能使用1000个Segment实例。

1.3.网络配置示例

\

图四

图四显示一个常见的网络配置示例,其中X4200是主节点,X4500(Segment host1)是主从节点,当主节点宕机后会主节点服务切换到此节点上,X4500(Segment host2)是从节点。

每个网络接口对应不同的网口,隔离到独立网络,保证不会竞争其他端口的网络带宽,提高网络的可靠性;串口连接到交换机是管理员管理的窗口。

1.4.Greenplum 高可用性体系架构

\

图五

图五中显示高可用性体系的示例图,其中按照从左到右且从上到下依次是主从节点,主节点,客户端,私有局域网以及从节点集群,实现功能和图一基本一致。

1.5.Master/Standby 镜像保护

\

图六

图六说明:Standby 节点用于当 Master 节点损坏时提供 Master服务,Standby 实时与Master 节点的Catalog 和事务日志保持同步,确保系统的变更信息不会丢失,提升系统的健壮性。

1.6.数据冗余-Segment 镜像保护

\

图七

图七说明:

1) 当GP配置了镜像节点之后,主节点不可用时会自动切换到镜像节点,集群仍然保持可用状态。当主节点恢复并启动之后,主节点会自动恢复期间的变更;

2) 只要Master不能连接上Segment实例时,就会在系统表中将此实例标识为不可用,并用镜像节点来代替,一般需要和主节点位于不同的服务器上,当Primary Segment失败时,Mirror Segment将自动提供服务,Primary Segment恢复正常后,使用gprecoverseg –F 同步数据

1.7.Segment 主机硬件配置示例

\

图八

1.8.网络冗余

\

图九

图九说明:

1) 数据之间存在冗余,网络也存在冗余;

2) 公共网络连接到主节点,主节点通过一台或者多台交换机连接到子节点。


Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Analisis perbandingan seni bina pembelajaran mendalam Analisis perbandingan seni bina pembelajaran mendalam May 17, 2023 pm 04:34 PM

Konsep pembelajaran mendalam berasal daripada penyelidikan rangkaian saraf tiruan Perceptron berbilang lapisan yang mengandungi berbilang lapisan tersembunyi ialah struktur pembelajaran mendalam. Pembelajaran mendalam menggabungkan ciri peringkat rendah untuk membentuk perwakilan peringkat tinggi yang lebih abstrak untuk mewakili kategori atau ciri data. Ia dapat menemui perwakilan ciri teragih bagi data. Pembelajaran mendalam ialah sejenis pembelajaran mesin, dan pembelajaran mesin ialah satu-satunya cara untuk mencapai kecerdasan buatan. Jadi, apakah perbezaan antara pelbagai seni bina sistem pembelajaran mendalam? 1. Rangkaian Bersambung Sepenuhnya (FCN) Rangkaian bersambung sepenuhnya (FCN) terdiri daripada satu siri lapisan bersambung sepenuhnya, dengan setiap neuron dalam setiap lapisan disambungkan kepada setiap neuron dalam lapisan lain. Kelebihan utamanya ialah ia adalah "struktur agnostik", iaitu tiada andaian khas tentang input diperlukan. Walaupun agnostik struktur ini membuat lengkap

Berbilang laluan, berbilang domain, merangkumi semua! Google AI mengeluarkan model am pembelajaran berbilang domain MDL Berbilang laluan, berbilang domain, merangkumi semua! Google AI mengeluarkan model am pembelajaran berbilang domain MDL May 28, 2023 pm 02:12 PM

Model pembelajaran mendalam untuk tugas penglihatan (seperti klasifikasi imej) biasanya dilatih hujung ke hujung dengan data daripada domain visual tunggal (seperti imej semula jadi atau imej yang dijana komputer). Secara amnya, aplikasi yang menyelesaikan tugas penglihatan untuk berbilang domain perlu membina berbilang model untuk setiap domain yang berasingan dan melatihnya secara berasingan Data tidak dikongsi antara domain yang berbeza, setiap model akan mengendalikan data input tertentu. Walaupun ia berorientasikan kepada bidang yang berbeza, beberapa ciri lapisan awal antara model ini adalah serupa, jadi latihan bersama model ini adalah lebih cekap. Ini mengurangkan kependaman dan penggunaan kuasa, dan mengurangkan kos memori untuk menyimpan setiap parameter model Pendekatan ini dipanggil pembelajaran berbilang domain (MDL). Selain itu, model MDL juga boleh mengatasi prestasi tunggal

Apakah seni bina dan prinsip kerja Spring Data JPA? Apakah seni bina dan prinsip kerja Spring Data JPA? Apr 17, 2024 pm 02:48 PM

SpringDataJPA adalah berdasarkan seni bina JPA dan berinteraksi dengan pangkalan data melalui pemetaan, ORM dan pengurusan transaksi. Repositorinya menyediakan operasi CRUD, dan pertanyaan terbitan memudahkan akses pangkalan data. Selain itu, ia menggunakan pemuatan malas untuk hanya mendapatkan semula data apabila perlu, sekali gus meningkatkan prestasi.

'Kesilapan' ini sebenarnya bukan satu kesilapan: mulakan dengan empat kertas klasik untuk memahami apa yang 'salah' dengan gambar rajah seni bina Transformer 'Kesilapan' ini sebenarnya bukan satu kesilapan: mulakan dengan empat kertas klasik untuk memahami apa yang 'salah' dengan gambar rajah seni bina Transformer Jun 14, 2023 pm 01:43 PM

Beberapa ketika dahulu, tweet yang menunjukkan ketidakkonsistenan antara gambar rajah seni bina Transformer dan kod dalam kertas kerja pasukan Google Brain "AttentionIsAllYouNeed" mencetuskan banyak perbincangan. Sesetengah orang berpendapat bahawa penemuan Sebastian adalah kesilapan yang tidak disengajakan, tetapi ia juga mengejutkan. Lagipun, memandangkan populariti kertas Transformer, ketidakkonsistenan ini sepatutnya disebut seribu kali. Sebastian Raschka berkata sebagai tindak balas kepada komen netizen bahawa kod "paling asli" sememangnya konsisten dengan gambar rajah seni bina, tetapi versi kod yang diserahkan pada 2017 telah diubah suai, tetapi gambar rajah seni bina tidak dikemas kini pada masa yang sama. Ini juga punca perbincangan "tidak konsisten".

1.3ms mengambil masa 1.3ms! Seni bina rangkaian neural mudah alih sumber terbuka terbaru Tsinghua RepViT 1.3ms mengambil masa 1.3ms! Seni bina rangkaian neural mudah alih sumber terbuka terbaru Tsinghua RepViT Mar 11, 2024 pm 12:07 PM

Alamat kertas: https://arxiv.org/abs/2307.09283 Alamat kod: https://github.com/THU-MIG/RepViTRepViT berprestasi baik dalam seni bina ViT mudah alih dan menunjukkan kelebihan yang ketara. Seterusnya, kami meneroka sumbangan kajian ini. Disebutkan dalam artikel bahawa ViT ringan biasanya berprestasi lebih baik daripada CNN ringan pada tugas visual, terutamanya disebabkan oleh modul perhatian diri berbilang kepala (MSHA) mereka yang membolehkan model mempelajari perwakilan global. Walau bagaimanapun, perbezaan seni bina antara ViT ringan dan CNN ringan belum dikaji sepenuhnya. Dalam kajian ini, penulis menyepadukan ViT ringan ke dalam yang berkesan

Sepuluh elemen seni bina sistem pembelajaran mesin Sepuluh elemen seni bina sistem pembelajaran mesin Apr 13, 2023 pm 11:37 PM

Ini ialah era pemerkasaan AI, dan pembelajaran mesin ialah cara teknikal yang penting untuk mencapai AI. Jadi, adakah terdapat seni bina sistem pembelajaran mesin universal? Dalam skop kognitif pengaturcara berpengalaman, Apa-apa sahaja bukanlah apa-apa, terutamanya untuk seni bina sistem. Walau bagaimanapun, adalah mungkin untuk membina seni bina sistem pembelajaran mesin berskala dan boleh dipercayai jika terpakai pada kebanyakan sistem didorong pembelajaran mesin atau kes penggunaan. Daripada perspektif kitaran hayat pembelajaran mesin, seni bina universal yang dipanggil ini merangkumi peringkat pembelajaran mesin utama, daripada membangunkan model pembelajaran mesin, untuk menggunakan sistem latihan dan sistem perkhidmatan kepada persekitaran pengeluaran. Kita boleh cuba menerangkan seni bina sistem pembelajaran mesin sedemikian daripada dimensi 10 elemen. 1.

Reka bentuk seni bina perisian dan metodologi penyahgandingan perisian dan perkakasan dalam SOA Reka bentuk seni bina perisian dan metodologi penyahgandingan perisian dan perkakasan dalam SOA Apr 08, 2023 pm 11:21 PM

Untuk seni bina elektronik dan elektrik berpusat generasi seterusnya, penggunaan unit pengkomputeran pusat zon + pusat dan susun atur pengawal serantau telah menjadi pilihan yang mesti ada untuk pelbagai pemain OEM atau tier1 Mengenai seni bina unit pengkomputeran pusat, terdapat tiga cara: SOC pemisahan, pengasingan perkakasan, virtualisasi perisian. Unit pengkomputeran pusat berpusat akan menyepadukan fungsi perniagaan teras tiga domain utama pemanduan autonomi, kokpit pintar dan kawalan kenderaan Pengawal serantau yang diseragamkan mempunyai tiga tanggungjawab utama: pengagihan kuasa, perkhidmatan data dan pintu masuk wilayah. Oleh itu, unit pengkomputeran pusat akan menyepadukan suis Ethernet throughput tinggi. Apabila tahap integrasi keseluruhan kenderaan semakin tinggi, semakin banyak fungsi ECU akan diserap secara perlahan ke dalam pengawal serantau. Dan platformisasi

Infrastruktur AI: Kepentingan Kerjasama Pasukan IT dan Sains Data Infrastruktur AI: Kepentingan Kerjasama Pasukan IT dan Sains Data May 18, 2023 pm 11:08 PM

Kecerdasan buatan (AI) telah mengubah permainan dalam banyak industri, membolehkan perniagaan meningkatkan kecekapan, membuat keputusan dan pengalaman pelanggan. Memandangkan AI terus berkembang dan menjadi lebih kompleks, adalah penting bagi perusahaan untuk melabur dalam infrastruktur yang betul untuk menyokong pembangunan dan penggunaannya. Aspek utama infrastruktur ini ialah kerjasama antara IT dan pasukan sains data, kerana kedua-duanya memainkan peranan penting dalam memastikan kejayaan inisiatif AI. Perkembangan pesat kecerdasan buatan telah membawa kepada peningkatan permintaan untuk kuasa pengkomputeran, storan dan keupayaan rangkaian. Permintaan ini memberi tekanan pada infrastruktur IT tradisional, yang tidak direka bentuk untuk mengendalikan beban kerja yang kompleks dan intensif sumber yang diperlukan oleh AI. Akibatnya, perusahaan kini sedang mencari untuk membina sistem yang boleh menyokong beban kerja AI.

See all articles