1、环境说明集群环境至少需要3个节点（也就是3台服务器设备）：1个Master，2个Slave，节点之间局域网连接，可以相互ping通，下面举例说明，配置节点IP分配如下： Hostname IP 新建用户新建用户密码 Master 10.10.10.213 hadoop 123456 Slave1 10.10.10.214

1、环境说明

集群环境至少需要3个节点（也就是3台服务器设备）：1个Master，2个Slave，节点之间局域网连接，可以相互ping通，下面举例说明，配置节点IP分配如下：

Hostname	IP	新建用户	新建用户密码
Master	10.10.10.213	hadoop	123456
Slave1	10.10.10.214	hadoop	123456
Slave2	10.10.10.215	hadoop	123456

三个节点均使用centos?6.3系统，为了便于维护，集群环境配置项最好使用相同用户名、用户密码、相同hadoop、hbase、zookeeper目录结构。

2、准备工作

2.1、修改Hostname

为了集群能够正常稳定的运行，我们需要将每个节点的hostname分别配置为对应的Master、Slave1、Slave2。

（1）在Master服务器中执行以下命令：

hostname Master	//当前有效

Salin selepas log masuk

vi /etc/sysconfig/network	//重启后生效

Salin selepas log masuk

HOSTNAME=Master

Salin selepas log masuk

（2）在Slave1服务器中执行以下命令：

hostname Slave1	//当前有效

Salin selepas log masuk

vi /etc/sysconfig/network	//重启后生效

Salin selepas log masuk

HOSTNAME=Slave1

Salin selepas log masuk

（3）在Slave2服务器中执行以下命令：

hostname Slave2	//当前有效

Salin selepas log masuk

vi /etc/sysconfig/network	//重启后生效

Salin selepas log masuk

HOSTNAME=Slave2

Salin selepas log masuk

2.2、添加Hosts映射关系

分别在三个节点下通过如下命令修改hosts映射关系：

vi /etc/hosts

Salin selepas log masuk

添加内容如下：

Master	10.10.10.213
Slave1	10.10.10.214
Slave2	10.10.10.215

Salin selepas log masuk

2.3、配置JDK环境

Hadoop集群必须依赖JDK环境，所以这里我们首先需要配置好JDK环境，同样为了管理，我们建议服务器中的节点JDK安装环境均在相同路径下。

2.3.1、解压安装包

拷贝jdk文件jdk-6u25-linux-x64.bin到/usr/lib/java文件目录（该目录可自行定义）下，解压安装包，如果文件权限被限制，可通过如下命令进行赋权限操作：

chmod u+w jdk-6u25-linux-x64.bin

Salin selepas log masuk

2.3.2、修改环境配置信息

vi /etc/profile

Salin selepas log masuk

在最后加上：

export JAVA_HOME=/usr/lib/java/jdk1.6.0_25
export PATH=$PATH:$JAVA_HOME/bin 
export CLASSPATH=.:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/rt.jar

Salin selepas log masuk

通过注销或者以下命令使修改生效：

source /etc/profile

Salin selepas log masuk

2.3.3、检查当前JDK版本信息

java -version

Salin selepas log masuk

2.3.4、补充（可选）

如果查看当前的JDK版本不是刚才设置的JDK版本，则可以进行默认JDK版本设置操作：

sudo update-alternatives --install /usr/bin/java java /usr/lib/java/jdk1.6.0_25/bin/java 300   
sudo update-alternatives --install /usr/bin/javac javac /usr/lib/java/jdk1.6.0_25/bin/javac 300   
sudo update-alternatives --config java（选择jdk1.6.0_25版本的序号就行）

Salin selepas log masuk

2.4、安装SSH

Centos系统安装时默认可以选择安装SSH，ubuntu下可以通过如下命令进行安装（前提是必须联网）：

sudo apt-get install ssh
sudo apt-get install rsync

Salin selepas log masuk

2.5、新建用户

为了hadoop集群的安全与方便管理，我们要另外新建用户，并设置密码，命令如下：

sudo adduser hadoop
sudo passwd hadoop

Salin selepas log masuk

上述命令中，第一行命令新建了一个user为hadoop的用户，第二行命令是为这个hadoop用户设置密码，同样最好服务器之间均保持一致。

2.6、配置集群之间SSH无密码登陆

集群环境的使用必须通过ssh无密码登陆来执行，本机登陆本机必须无密码登陆，主机与从机之间必须可以双向无密码登陆，从机与从机之间无限制。以本次为例，比如Master与Slave1之间的无密码登陆设置步骤如下：

（1）进入Master服务器，进行无密码自登陆设置

ssh hadoop@Master	//登陆Master
ssh-keygen  -t  rsa  -P  ''  -f  ~/.ssh/id_rsa
cat  ~/.ssh/id_rsa.pub  >>  ~/.ssh/authorized_keys	//生成密钥
chmod 700 ~/.ssh && chmod 600 ~/.ssh/*	//设置权限

Salin selepas log masuk

如果不知道是否配置成功，可通过如下命令进行验证：

ssh localhost

Salin selepas log masuk

如果上述命令不需要输入密码则表示配置成功。

进入Slave1服务器，进行无密码自登陆设置，操作同上，只需将对应的Master改为Slave1即可，此处省略。

（2）进入Master服务器，设置Master->Slave1的无密码登陆

ssh hadoop@Master	//登陆Master
cat ~/.ssh/id_rsa.pub | ssh hadoop@Slave1 'cat - >> ~/.ssh/authorized_keys'
ssh hadoop@Slave1	//若此处不需要输入密码则配置成功

Salin selepas log masuk

（3）进入Slave1服务器，设置Slave1->Master的无密码登陆

ssh hadoop@Slave1	//登陆Slave1
cat ~/.ssh/id_rsa.pub | ssh hadoop@Master 'cat - >> ~/.ssh/authorized_keys'
ssh hadoop@Master	//若此处不需要输入密码则成功

Salin selepas log masuk

以上便是Master与Slave1之间的双向无密码登陆配置。Master与Slave2之间的配置原理同上述基本一样，所以不再赘述。

3、Hadoop集群安装配置

3.1、修改hadoop配置文件

在centos系统下解压hadoop安装包hadoop-1.0.3.tar.gz，修改conf目录下的6个文件：

（1）core-site.xml

		fs.default.name
		hdfs://Master:9000

Salin selepas log masuk

（2）hadoop-env.sh

在该文件中加上如下一行代码：

export JAVA_HOME=（你配置的jdk路径，比如：/usr/java/jdk1.6.0_25）

Salin selepas log masuk

（3）hdfs-site.xml

	
		dfs.name.dir
		/home/hadoop/temp/hadoop
		dfs.data.dir
		/home/hadoop/temp/hadoop
		dfs.replication
		1
		dfs.support.append
		true

Salin selepas log masuk

（4）mapred-site.xml

		mapred.job.tracker
		Master:9001
		mapred.acls.enabled
		false

Salin selepas log masuk

（5）Masters

Master

Salin selepas log masuk

（6）Slaves

Slave1
Slave2

Salin selepas log masuk

3.2、同步安装包

将解压修改后的hadoop-1.0.3文件夹分别拷贝到Master、Slave1、Slave2的相同hadoop安装路径下。

3.3、启动Hadoop集群

进入Master的hadoop-1.0.3目录，执行以下操作：

bin/hadoop namenode -format	//格式化namenode，第一次启动服务前执行的操作，以后不需要执行
bin/start-all.sh	 //启动hadoop
jps	//用jps命令能看到除jps外有5个进程

Salin selepas log masuk

至此，hadoop集群配置过程结束。可通过浏览器地址http://10.10.10.213:50070?查看节点启用状态验证配置是否成功。

4、Zookeeper集群安装配置

4.1、修改zookeeper配置文件zoo.cfg

在centos系统下解压zookeeper安装包zookeeper-3.4.3.tar.gz?，进入到conf目录，将zoo_sample.cfg拷贝一份命名为zoo.cfg（Zookeeper?在启动时会找这个文件作为默认配置文件），打开该文件进行修改为以下格式（注意权限问题，如果最后配置有问题请检查过程中权限是否正确）。

dataDir=/home/hadoop/temp/zookeeper/data
server.0=10.10.10.213:2888:3888
server.1=10.10.10.214:2888:3888
server.2=10.10.10.215:2888:3888

Salin selepas log masuk

4.2、新建目录、新建并编辑myid文件

（本次配置myid文件放在/home/hadoop/temp/zookeeper/data目录下）

mkdir /home/hadoop/temp/zookeeper/data	//dataDir目录
vi /home/hadoop/temp/zookeeper/data/myid

Salin selepas log masuk

注意myid文件中的内容为：Master中为0，Slave1中为1，Slave2中为2，分别与zoo.cfg中对应起来。

4.3、同步安装包

将解压修改后的zookeeper-3.4.3文件夹分别拷贝到Master、Slave1、Slave2的相同zookeeper安装路径下。注意：myid文件的内容不是一样的，各服务器中分别是对应zoo.cfg中的设置。

4.4、启动zookeeper

Zookeeper的启动与hadoop不一样，需要每个节点都执行，分别进入3个节点的zookeeper-3.4.3目录，启动zookeeper：

bin/zkServer.sh start

Salin selepas log masuk

注意：此时如果报错先不理会，继续在另两台服务器中执行相同操作。

4.5、检查zookeeper是否配置成功

待3台服务器均启动后，如果过程正确的话zookeeper应该已经自动选好leader，进入每台服务器的zookeeper-3.4.3目录，执行以下操作查看zookeeper启动状态：

bin/zkServer.sh status

Salin selepas log masuk

如果出现以下代码表示安装成功了。

[java] view plaincopy
JMX enabled by default  
Using config: /home/hadoop/zookeeper-3.4.3/bin/../conf/zoo.cfg  
Mode: follower	//或者有且只有一个leader

Salin selepas log masuk

5、HBase集群安装配置

5.1、修改hbase配置文件

在centos系统下解压hadoop安装包hadoop-1.0.3.tar.gz，修改conf目录下的3个文件：

（1）hbase-env.sh

export JAVA_HOME=/usr/lib/java/jdk1.6.0_25	//JDK的安装目录
export HBASE_CLASSPATH=/home/hadoop/hadoop-1.0.3/conf	//hadoop的安装目录
export HBASE_MANAGES_ZK=true

Salin selepas log masuk

（2）hbase-site.xml

		hbase.rootdir
		hdfs://Master:9000/hbase
		hbase.cluster.distributed
		true
		hbase.zookeeper.property.clientPort
		2181
		hbase.zookeeper.quorum
		Master
		hbase.zookeeper.property.dataDir
		/home/hadoop/temp/zookeeper
		dfs.support.append
		true

Salin selepas log masuk

（3）regionservers

Slave1
Slave2

Salin selepas log masuk

5.2、同步安装包

将解压修改后的hbase-0.94.1-security文件夹分别拷贝到Master、Slave1、Slave2的相同hbase安装路径下。

5.3、启动HBase

进入Master的hbase-0.94.1-security目录，执行以下操作：

bin/start-hbase.sh	//之后用jps查看是否所有进程都已启动

Salin selepas log masuk

至此，hbase服务配置过程结束。可通过浏览器地址http://10.10.10.213:60010?查看hbase是否可用。

也可以执行以下命令，进入hbase?shell进行验证。

6、结语

关于hadoop、zookeeper、hbase的启动与关闭顺序：启动时hadoop和zookeeper随意先后，但是hbase必须最后启动，关闭时hbase必须首先关闭，然后随意先后关闭hadoop、zookeeper。否则，会出现异常。

关于各软件的安装包可以去官网下载，不同版本的安装配置可能会有少许的变动，而且版本搭配如果不一样的话也可能出现问题，有问题就针对性地去查，这样学习才有进步。

作者：jinnchang 发表于2013-5-8 16:29:30 原文链接

阅读：44 评论：0 查看评论

分布式集群环境hadoop、hbase、zookeeper搭建（全）

原文地址：分布式集群环境hadoop、hbase、zookeeper搭建（全）, 感谢原作者分享。

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Tunjukkan Lagi

Artikel Panas

Assassin's Creed Shadows: Penyelesaian Riddle Seashell

3 minggu yang lalu By DDD

Apa yang Baru di Windows 11 KB5054979 & Cara Memperbaiki Masalah Kemas Kini

3 minggu yang lalu By DDD

Di mana untuk mencari kad kunci kawalan kren di atomfall

3 minggu yang lalu By DDD

<🎜>: Rails Dead - Cara Melengkapkan Setiap Cabaran

4 minggu yang lalu By DDD

Panduan Atomfall: Lokasi Item, Panduan Pencarian, dan Petua

1 bulan yang lalu By DDD

Tunjukkan Lagi

Alat panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

7694

Tutorial Java

1640

Tutorial CakePHP

1393

Tutorial Laravel

1287

Tutorial PHP

1229

Tunjukkan Lagi

Related knowledge

Tidak dapat boot ke dalam persekitaran pemulihan Windows Feb 19, 2024 pm 11:12 PM

Persekitaran Pemulihan Windows (WinRE) ialah persekitaran yang digunakan untuk membaiki ralat sistem pengendalian Windows. Selepas memasuki WinRE, anda boleh melakukan pemulihan sistem, tetapan semula kilang, menyahpasang kemas kini, dsb. Jika anda tidak dapat boot ke WinRE, artikel ini akan membimbing anda melalui pembetulan untuk menyelesaikan isu tersebut. Tidak dapat boot ke dalam Persekitaran Pemulihan Windows Jika anda tidak boleh but ke dalam Persekitaran Pemulihan Windows, gunakan pembetulan yang disediakan di bawah: Semak status Persekitaran Pemulihan Windows Gunakan kaedah lain untuk memasuki Persekitaran Pemulihan Windows Adakah anda secara tidak sengaja memadam Pembahagian Pemulihan Windows? Lakukan peningkatan di tempat atau pemasangan bersih Windows di bawah, kami telah menerangkan semua pembaikan ini secara terperinci. 1] Semak Wi

Node berpindah sepenuhnya daripada Proxmox VE dan menyertai semula kluster Feb 21, 2024 pm 12:40 PM

Perihalan senario untuk nod mengosongkan sepenuhnya daripada ProxmoxVE dan menyertai semula kluster Apabila nod dalam kluster ProxmoxVE rosak dan tidak boleh dibaiki dengan cepat, nod yang rosak perlu ditendang keluar dari kluster dengan bersih dan maklumat baki mesti dibersihkan. Jika tidak, nod baharu yang menggunakan alamat IP yang digunakan oleh nod yang rosak tidak akan dapat menyertai kluster secara normal, selepas nod rosak yang telah dipisahkan daripada kluster dibaiki, walaupun ia tidak ada kaitan dengan kluster, ia akan; tidak dapat mengakses pengurusan web nod tunggal ini Di latar belakang, maklumat tentang nod lain dalam kelompok ProxmoxVE asal akan muncul, yang sangat menjengkelkan. Usir nod daripada kluster Jika ProxmoxVE ialah kluster hiper-tumpu Ceph, anda perlu log masuk ke mana-mana nod dalam kluster (kecuali nod yang anda mahu padamkan) pada sistem hos Debian, dan jalankan arahan

Cara menggunakan Redis untuk mencapai penyegerakan data teragih Nov 07, 2023 pm 03:55 PM

Cara menggunakan Redis untuk mencapai penyegerakan data teragih Dengan perkembangan teknologi Internet dan senario aplikasi yang semakin kompleks, konsep sistem teragih semakin diterima pakai secara meluas. Dalam sistem teragih, penyegerakan data merupakan isu penting. Sebagai pangkalan data dalam memori berprestasi tinggi, Redis bukan sahaja boleh digunakan untuk menyimpan data, tetapi juga boleh digunakan untuk mencapai penyegerakan data teragih. Untuk penyegerakan data teragih, biasanya terdapat dua mod biasa: mod terbitkan/langgan (Terbitkan/Langgan) dan replikasi induk-hamba (Master-slave).

Cara Redis melaksanakan pengurusan sesi teragih Nov 07, 2023 am 11:10 AM

Cara Redis melaksanakan pengurusan sesi teragih memerlukan contoh kod khusus Pengurusan sesi teragih adalah salah satu topik hangat di Internet hari ini Dalam menghadapi kesesuaian yang tinggi dan volum data yang besar, kaedah pengurusan sesi tradisional secara beransur-ansur menjadi tidak mencukupi. Sebagai pangkalan data nilai kunci berprestasi tinggi, Redis menyediakan penyelesaian pengurusan sesi teragih. Artikel ini akan memperkenalkan cara menggunakan Redis untuk melaksanakan pengurusan sesi teragih dan memberikan contoh kod khusus. 1. Pengenalan kepada Redis sebagai storan sesi teragih Kaedah pengurusan sesi tradisional adalah untuk menyimpan maklumat sesi

Berkongsi pengalaman menggunakan MongoDB untuk melaksanakan penjadualan dan pelaksanaan tugas teragih Nov 02, 2023 am 09:39 AM

MongoDB ialah pangkalan data NoSQL sumber terbuka dengan prestasi tinggi, berskala dan fleksibiliti. Dalam sistem teragih, penjadualan tugas dan pelaksanaan adalah isu utama Dengan menggunakan ciri-ciri MongoDB, penjadualan tugasan dan penyelesaian pelaksanaan boleh direalisasikan. 1. Analisis Keperluan untuk Penjadualan Tugasan Teragih Dalam sistem teragih, penjadualan tugas ialah proses memperuntukkan tugas kepada nod yang berbeza untuk dilaksanakan. Keperluan penjadualan tugas biasa termasuk: 1. Pengagihan permintaan tugas: Hantar permintaan tugas ke nod pelaksanaan yang tersedia.

Cara menggunakan Docker untuk mengurus dan mengembangkan kluster berbilang nod Nov 07, 2023 am 10:06 AM

Dalam era pengkomputeran awan hari ini, teknologi kontena telah menjadi salah satu teknologi paling popular di dunia sumber terbuka. Kemunculan Docker telah menjadikan pengkomputeran awan lebih mudah dan cekap, dan telah menjadi alat yang sangat diperlukan untuk pembangun dan kakitangan operasi dan penyelenggaraan. Aplikasi teknologi kluster berbilang nod digunakan secara meluas berdasarkan Docker. Melalui penggunaan kluster berbilang nod, kami boleh menggunakan sumber dengan lebih berkesan, meningkatkan kebolehpercayaan dan kebolehskalaan, dan juga menjadi lebih fleksibel dalam penggunaan dan pengurusan. Seterusnya, kami akan memperkenalkan cara menggunakan Docker untuk

Cara menggunakan Swoole untuk melaksanakan penjadualan tugas berjadual teragih Nov 07, 2023 am 11:04 AM

Cara menggunakan Swoole untuk melaksanakan penjadualan tugas berjadual teragih Pengenalan: Dalam pembangunan PHP tradisional, kami sering menggunakan cron untuk melaksanakan penjadualan tugas berjadual, tetapi cron hanya boleh melaksanakan tugas pada pelayan tunggal dan tidak dapat menangani senario konkurensi yang tinggi. Swoole ialah rangka kerja serentak tak segerak berprestasi tinggi berdasarkan PHP Ia menyediakan keupayaan komunikasi rangkaian yang lengkap dan sokongan berbilang proses, membolehkan kami melaksanakan penjadualan tugas berjadual dengan mudah. Artikel ini akan memperkenalkan cara menggunakan Swoole untuk melaksanakan penjadualan tugas berjadual teragih

Menggunakan Redis untuk mencapai ketekalan cache yang diedarkan Nov 07, 2023 pm 12:05 PM

Menggunakan Redis untuk mencapai ketekalan cache teragih Dalam sistem teragih moden, cache memainkan peranan yang sangat penting. Ia boleh mengurangkan kekerapan capaian sistem kepada pangkalan data dan meningkatkan prestasi dan daya pemprosesan sistem. Dalam sistem yang diedarkan, untuk memastikan ketekalan cache, kita perlu menyelesaikan masalah penyegerakan data antara berbilang nod. Dalam artikel ini, kami akan memperkenalkan cara menggunakan Redis untuk mencapai ketekalan cache yang diedarkan dan memberikan contoh kod khusus. Redis ialah pangkalan data nilai kunci berprestasi tinggi yang menyokong kegigihan, replikasi dan pengumpulan

See all articles