Hadoop2.2.0集群搭建过程-MySQL 튜토리얼-php.cn

집

데이터 베이스

MySQL 튜토리얼

Hadoop2.2.0集群搭建过程

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 07, 2016 pm 03:08 PM

짓다 프로세스 무리

第一部分 Hadoop 2.2 下载 Hadoop我们从Apache官方网站直接下载最新版本Hadoop2.2。官方目前是提供了linux32位系统可执行文件，所以如果需要在64位系统上部署则需要单独下载src源码自行编译（10楼评论中提供了一个解决方法链接）。下载地址:http://apache.c

第一部分 Hadoop 2.2 下载

Hadoop我们从Apache官方网站直接下载最新版本Hadoop2.2。官方目前是提供了linux32位系统可执行文件，所以如果需要在64位系统上部署则需要单独下载src 源码自行编译（10楼评论中提供了一个解决方法链接）。

下载地址:http://apache.claz.org/hadoop/common/hadoop-2.2.0/

如下图所示，下载红色标记部分即可。如果要自行编译则下载src.tar.gz.

Hadoop2.2.0集群搭建过程

第二部分集群环境搭建

1、这里我们搭建一个由三台机器组成的集群：

192.168.0.1 hduser/passwd cloud001 nn/snn/rm CentOS6 64bit

192.168.0.2 hduser/passwd cloud002 dn/nm Ubuntu13.04 32bit

192.168.0.3 hduser/passwd cloud003 dn/nm Ubuntu13.0432bit

1.1 上面各列分别为IP、user/passwd、hostname、在cluster中充当的角色（namenode, secondary namenode, datanode , resourcemanager, nodemanager）

1.2 Hostname可以在/etc/hostname中修改（ubuntu是在这个路径下，redhat稍有不同）

1.3 这里我们为每台机器新建了一个账户hduser.这里需要给每个账户分配sudo的权限。（切换到root账户，修改/etc/sudoers文件，增加：hduser ALL=(ALL) ALL ）

2、修改/etc/hosts 文件，增加三台机器的ip和hostname的映射关系

192.168.0.1 cloud001

192.168.0.2 cloud002

192.168.0.3 cloud003

3、打通cloud001到cloud002、cloud003的SSH无密码登陆

3.1 安装ssh

一般系统是默认安装了ssh命令的。如果没有，或者版本比较老，则可以重新安装：

sodu apt-get install ssh

3.2设置local无密码登陆

安装完成后会在~目录（当前用户主目录，即这里的/home/hduser）下产生一个隐藏文件夹.ssh（ls -a 可以查看隐藏文件）。如果没有这个文件，自己新建即可（mkdir .ssh）。

具体步骤如下：

1、进入.ssh文件夹

2、 ssh-keygen -t rsa 之后一路回车（产生秘钥）

3、把id_rsa.pub 追加到授权的 key 里面去（cat id_rsa.pub >> authorized_keys）

4、重启 SSH 服务命令使其生效 :service sshd restart（这里RedHat下为sshdUbuntu下为ssh）

此时已经可以进行ssh localhost的无密码登陆

【注意】：以上操作在每台机器上面都要进行。

3.3设置远程无密码登陆

这里只有cloud001是master，如果有多个namenode，或者rm的话则需要打通所有master都其他剩余节点的免密码登陆。（将001的authorized_keys追加到002和003的authorized_keys）

进入001的.ssh目录

scp authorized_keys hduser@cloud002:~/.ssh/ authorized_keys_from_cloud001

进入002的.ssh目录

cat authorized_keys_from_cloud001>> authorized_keys

至此，可以在001上面sshhduser@cloud002进行无密码登陆了。003的操作相同。

4、安装jdk(建议每台机器的JAVA_HOME路径信息相同)

注意：这里选择下载jdk并自行安装，而不是通过源直接安装（apt-get install）

4.1、下载jkd（ http://www.oracle.com/technetwork/java/javase/downloads/index.html）

4.1.1 对于32位的系统可以下载以下两个Linux x86版本（uname -a 查看系统版本）

4.1.2 64位系统下载Linux x64版本(即x64.rpm和x64.tar.gz)

Hadoop2.2.0集群搭建过程

4.2、安装jdk（这里以.tar.gz版本，32位系统为例）

安装方法参考http://docs.oracle.com/javase/7/docs/webnotes/install/linux/linux-jdk.html

4.2.1 选择要安装java的位置，如/usr/目录下，新建文件夹java(mkdirjava)

4.2.2 将文件jdk-7u40-linux-i586.tar.gz移动到/usr/java

4.2.3 解压：tar -zxvf jdk-7u40-linux-i586.tar.gz

4.2.4 删除jdk-7u40-linux-i586.tar.gz（为了节省空间）

至此，jkd安装完毕，下面配置环境变量

4.3、打开/etc/profile（vim /etc/profile）

在最后面添加如下内容：

JAVA_HOME=/usr/java/jdk1.7.0_40（这里的版本号1.7.40要根据具体下载情况修改）

CLASSPATH=.:$JAVA_HOME/lib.tools.jar

PATH=$JAVA_HOME/bin:$PATH

export JAVA_HOMECLASSPATH PATH

4.4、source /etc/profile

4.5、验证是否安装成功：java–version

【注意】每台机器执行相同操作，最后将java安装在相同路径下（不是必须的，但这样会使后面的配置方便很多）

5、关闭每台机器的防火墙

RedHat:

/etc/init.d/iptables stop 关闭防火墙。

chkconfig iptables off 关闭开机启动。

Ubuntu:

ufw disable (重启生效)

第三部分 Hadoop 2.2安装过程

由于hadoop集群中每个机器上面的配置基本相同，所以我们先在namenode上面进行配置部署，然后再复制到其他节点。所以这里的安装过程相当于在每台机器上面都要执行。但需要注意的是集群中64位系统和32位系统的问题。

1、解压文件

将第一部分中下载的hadoop-2.2.tar.gz解压到/home/hduser路径下（或者将在64位机器上编译的结果存放在此路径下）。然后为了节省空间，可删除此压缩文件，或将其存放于其他地方进行备份。

注意：每台机器的安装路径要相同！！

2、 hadoop配置过程

配置之前，需要在cloud001本地文件系统创建以下文件夹：

~/dfs/name

~/dfs/data

~/temp

这里要涉及到的配置文件有7个：

~/hadoop-2.2.0/etc/hadoop/hadoop-env.sh

~/hadoop-2.2.0/etc/hadoop/yarn-env.sh

~/hadoop-2.2.0/etc/hadoop/slaves

~/hadoop-2.2.0/etc/hadoop/core-site.xml

~/hadoop-2.2.0/etc/hadoop/hdfs-site.xml

~/hadoop-2.2.0/etc/hadoop/mapred-site.xml

~/hadoop-2.2.0/etc/hadoop/yarn-site.xml

以上个别文件默认不存在的，可以复制相应的template文件获得。

配置文件1：hadoop-env.sh

修改JAVA_HOME值（export JAVA_HOME=/usr/java/jdk1.7.0_40）

配置文件2：yarn-env.sh

修改JAVA_HOME值（exportJAVA_HOME=/usr/java/jdk1.7.0_40）

配置文件3：slaves （这个文件里面保存所有slave节点）

写入以下内容：

cloud002

cloud003

配置文件4：core-site.xml

fs.defaultFS

hdfs://cloud001:9000

io.file.buffer.size

131072

hadoop.tmp.dir

file:/home/hduser/tmp

Abase for other temporary directories.

hadoop.proxyuser.hduser.hosts

hadoop.proxyuser.hduser.groups

配置文件5：hdfs-site.xml

dfs.namenode.secondary.http-address

cloud001:9001

dfs.namenode.name.dir

file:/home/hduser/dfs/name

dfs.datanode.data.dir

file:/home/hduser/dfs/data

dfs.replication

dfs.webhdfs.enabled

true

配置文件6：mapred-site.xml

mapreduce.framework.name

yarn

mapreduce.jobhistory.address

cloud001:10020

mapreduce.jobhistory.webapp.address

cloud001:19888

配置文件7：yarn-site.xml

yarn.nodemanager.aux-services

mapreduce_shuffle

yarn.nodemanager.aux-services.mapreduce.shuffle.class

org.apache.hadoop.mapred.ShuffleHandler

yarn.resourcemanager.address

cloud001:8032

yarn.resourcemanager.scheduler.address

cloud001:8030

yarn.resourcemanager.resource-tracker.address

cloud001:8031

yarn.resourcemanager.admin.address

cloud001:8033

yarn.resourcemanager.webapp.address

cloud001:8088

3、复制到其他节点

这里可以写一个shell脚本进行操作（有大量节点时比较方便）

cp2slave.sh

#!/bin/bash

scp–r /home/hduser/hadoop-2.2.0 hduser@cloud002:~/

scp–r /home/hduser/hadoop-2.2.0 hduser@cloud003:~/

注意：由于我们集群里面001是64bit 而002和003是32bit的，所以不能直接复制，而采用单独安装hadoop，复制替换相关配置文件：

Cp2slave2.sh

#!/bin/bash

scp /home/hduser/hadoop-2.2.0/etc/hadoop/slaveshduser@cloud002:~/hadoop-2.2.0/etc/hadoop/slaves

scp /home/hduser/hadoop-2.2.0/etc/hadoop/slaveshduser@cloud003:~/hadoop-2.2.0/etc/hadoop/slaves

scp /home/hduser/hadoop-2.2.0/etc/hadoop/core-site.xmlhduser@cloud002:~/hadoop-2.2.0/etc/hadoop/core-site.xml

scp /home/hduser/hadoop-2.2.0/etc/hadoop/core-site.xml hduser@cloud003:~/hadoop-2.2.0/etc/hadoop/core-site.xml

scp /home/hduser/hadoop-2.2.0/etc/hadoop/hdfs-site.xmlhduser@cloud002:~/hadoop-2.2.0/etc/hadoop/hdfs-site.xml

scp /home/hduser/hadoop-2.2.0/etc/hadoop/hdfs-site.xmlhduser@cloud003:~/hadoop-2.2.0/etc/hadoop/hdfs-site.xml

scp /home/hduser/hadoop-2.2.0/etc/hadoop/mapred-site.xmlhduser@cloud002:~/hadoop-2.2.0/etc/hadoop/mapred-site.xml

scp /home/hduser/hadoop-2.2.0/etc/hadoop/mapred-site.xmlhduser@cloud003:~/hadoop-2.2.0/etc/hadoop/mapred-site.xml

scp /home/hduser/hadoop-2.2.0/etc/hadoop/yarn-site.xmlhduser@cloud002:~/hadoop-2.2.0/etc/hadoop/yarn-site.xml

scp /home/hduser/hadoop-2.2.0/etc/hadoop/yarn-site.xmlhduser@cloud003:~/hadoop-2.2.0/etc/hadoop/yarn-site.xml

4、启动验证

4.1 启动hadoop

进入安装目录： cd ~/hadoop-2.2.0/

格式化namenode：./bin/hdfs namenode –format

启动hdfs: ./sbin/start-dfs.sh

此时在001上面运行的进程有：namenode secondarynamenode

002和003上面运行的进程有：datanode

启动yarn: ./sbin/start-yarn.sh

此时在001上面运行的进程有：namenode secondarynamenoderesourcemanager

002和003上面运行的进程有：datanode nodemanaget

查看集群状态：./bin/hdfs dfsadmin –report

查看文件块组成： ./bin/hdfsfsck / -files -blocks

查看HDFS: http://16.187.94.161:50070

查看RM: http:// 16.187.94.161:8088

4.2 运行示例程序：

先在hdfs上创建一个文件夹

./bin/hdfs dfs –mkdir /input

./bin/hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-2.2.0.jarrandomwriter input

PS：dataNode 无法启动是配置过程中最常见的问题，主要原因是多次format namenode 造成namenode 和datanode的clusterID不一致。建议查看datanode上面的log信息。解决办法:修改每一个datanode上面的CID(位于dfs/data/current/VERSION文件夹中)使两者一致。

본 웹사이트의 성명

핫 AI 도구

뜨거운 도구

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7322

자바 튜토리얼

1625

Cakephp 튜토리얼

1350

라라벨 튜토리얼

1262

PHP 튜토리얼

1209

Related knowledge

Vue 프레임워크에서 통계 차트 시스템을 빠르게 구축하는 방법 Aug 21, 2023 pm 05:48 PM

Vue 프레임워크에서 통계 차트 시스템을 빠르게 구축하는 방법 최신 웹 애플리케이션에서 통계 차트는 필수 구성 요소입니다. 널리 사용되는 프런트엔드 프레임워크인 Vue.js는 통계 차트 시스템을 신속하게 구축하는 데 도움이 되는 많은 편리한 도구와 구성 요소를 제공합니다. 이 기사에서는 Vue 프레임워크와 일부 플러그인을 사용하여 간단한 통계 차트 시스템을 구축하는 방법을 소개합니다. 먼저 Vue 스캐폴딩 및 일부 관련 플러그인 설치를 포함하여 Vue.js 개발 환경을 준비해야 합니다. 명령줄에서 다음 명령을 실행합니다.

Mistlock Kingdom의 야생에서도 건물을 지을 수 있나요? Mar 07, 2024 pm 08:28 PM

플레이어는 Mistlock 왕국에서 플레이할 때 건물을 짓기 위해 다양한 재료를 수집할 수 있습니다. 많은 플레이어가 야생에서 건물을 지을 수 있는지 알고 싶어합니다. Mistlock 왕국에서는 건물이 제단 범위 내에 있어야 합니다. . Mistlock Kingdom에서는 야생에 건물을 지을 수 있나요? 답변: 아니요. 1. 미스트락 왕국의 야생 지역에는 건물을 지을 수 없습니다. 2. 건물은 제단의 범위 내에서 건축되어야 한다. 3. 플레이어 스스로 Spirit Fire Altar를 설치할 수 있지만, 범위를 벗어나면 건물을 지을 수 없습니다. 4. 산에 직접 구멍을 파서 집으로 삼을 수도 있어 건축자재를 소모할 필요가 없습니다. 5. 플레이어가 직접 지은 건물에는 편안함 메커니즘이 있습니다. 즉, 인테리어가 좋을수록 편안함이 높아집니다. 6. 높은 편안함은 플레이어에게 다음과 같은 속성 보너스를 제공합니다.

노드는 Proxmox VE에서 완전히 대피하고 클러스터에 다시 합류합니다. Feb 21, 2024 pm 12:40 PM

ProxmoxVE에서 노드를 완전히 제거하고 클러스터에 다시 합류하는 시나리오 설명 ProxmoxVE 클러스터의 노드가 손상되어 신속하게 복구할 수 없는 경우 결함이 있는 노드를 클러스터에서 완전히 추방하고 잔여 정보를 정리해야 합니다. 그렇지 않으면 결함이 있는 노드가 사용하는 IP 주소를 사용하는 새 노드는 클러스터에 정상적으로 합류할 수 없습니다. 마찬가지로 클러스터에서 분리된 결함이 있는 노드가 복구된 후에는 클러스터와 관련이 없지만 이 단일 노드의 웹 관리에 액세스할 수 없습니다. 백그라운드에서 원래 ProxmoxVE 클러스터의 다른 노드에 대한 정보가 표시되므로 매우 짜증납니다. 클러스터에서 노드를 제거합니다. ProxmoxVE가 Ceph 하이퍼 수렴형 클러스터인 경우 호스트 시스템 Debian에서 클러스터의 모든 노드(삭제하려는 노드 제외)에 로그인하고 명령을 실행해야 합니다.

PHP 고동시성 환경에서 데이터베이스 최적화 방법 Aug 11, 2023 pm 03:55 PM

PHP 높은 동시성 환경에서 데이터베이스 최적화 방법 인터넷의 급속한 발전으로 인해 점점 더 많은 웹사이트와 애플리케이션이 높은 동시성 문제에 직면해야 합니다. 이 경우 데이터베이스 성능 최적화가 특히 중요하며, 특히 PHP를 백엔드 개발 언어로 사용하는 시스템의 경우 더욱 그렇습니다. 이 기사에서는 PHP 높은 동시성 환경에서 몇 가지 데이터베이스 최적화 방법을 소개하고 해당 코드 예제를 제공합니다. 연결 풀링 사용 동시성이 높은 환경에서는 데이터베이스 연결을 자주 생성하고 삭제하면 성능 병목 현상이 발생할 수 있습니다. 따라서 연결 풀링을 사용하면

CentOS 7에서 웹 서버 구축을 위한 네트워크 보안 강화 기술 Aug 05, 2023 pm 01:12 PM

CentOS7에서 웹 서버 구축을 위한 네트워크 보안 강화 기술 웹 서버는 현대 인터넷의 중요한 부분이므로 웹 서버의 보안을 지키는 것이 매우 중요합니다. 네트워크 보안을 강화하면 위험을 줄이고 잠재적인 공격을 방지할 수 있습니다. 이 기사에서는 CentOS7에서 웹 서버를 구축할 때 일반적으로 사용되는 네트워크 보안 강화 기술을 소개하고 해당 코드 예제를 제공합니다. 시스템 및 소프트웨어 업데이트 먼저 시스템과 소프트웨어가 최신 상태인지 확인하세요. 다음 명령을 사용하여 업데이트할 수 있습니다.

계정 매트릭스를 구축하는 방법은 무엇입니까? 행렬 구성의 기능은 무엇입니까? Mar 23, 2024 pm 06:46 PM

오늘날 정보가 풍부한 시대에 소셜 미디어 플랫폼은 사람들이 정보를 얻고 공유하는 주요 수단이 되었습니다. 개인과 기업에게 정보의 최대 전파와 영향력 강화를 위한 효과적인 계정 네트워크 구축은 해결해야 할 시급한 과제가 되었습니다. 1. 계정 매트릭스를 구축하는 방법은 무엇입니까? 1. 타겟 고객을 명확히 합니다. 계정 매트릭스를 구축하기 전에 핵심은 타겟 고객을 명확하게 정의하고 그들의 요구, 관심사 및 소비 습관을 심층적으로 이해하여 보다 타겟화된 콘텐츠 전략을 개발할 수 있다는 것입니다. 2. 적절한 플랫폼을 선택하십시오. 대상 그룹의 특성에 따라 레이아웃에 적합한 소셜 미디어 플랫폼을 선택하십시오. 현재 주류 소셜 미디어 플랫폼에는 Weibo, WeChat, Douyin, Kuaishou 등이 있습니다. 각 플랫폼에는 고유한 사용자 그룹과 커뮤니케이션 특성이 있으므로 실제 상황에 따라 선택해야 합니다.

PHP의 일반적인 클러스터는 무엇입니까? Aug 31, 2023 pm 05:45 PM

PHP의 일반적인 클러스터에는 LAMP 클러스터, Nginx 클러스터, Memcached 클러스터, Redis 클러스터 및 Hadoop 클러스터가 포함됩니다. 자세한 소개: 1. LAMP 클러스터는 Linux, Apache, MySQL 및 PHP의 조합을 의미합니다. LAMP 클러스터에서는 여러 서버가 동일한 애플리케이션을 실행하고 로드 밸런서를 통해 균형을 유지합니다. 2. Nginx 클러스터, Nginx는 고성능 웹 서버 등입니다.

PyCharm에 PyTorch를 빠르게 설치하기: 쉬운 가이드 Feb 24, 2024 pm 09:54 PM

PyTorch 설치 가이드: PyCharm에서 개발 환경을 빠르게 설정하십시오. PyTorch는 현재 딥 러닝 분야에서 가장 널리 사용되는 프레임워크 중 하나이며 사용 용이성과 유연성이 특징이며 개발자들이 선호합니다. 이 글에서는 딥 러닝 프로젝트 개발을 시작할 수 있도록 PyCharm에서 PyTorch 개발 환경을 빠르게 설정하는 방법을 소개합니다. 1단계: PyTorch 설치 먼저 PyTorch를 설치해야 합니다. PyTorch 설치는 일반적으로 시스템 환경을 고려해야 합니다.

See all articles

Hadoop2.2.0集群搭建过程

핫 AI 도구

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

인기 기사

뜨거운 도구

메모장++7.3.1

SublimeText3 중국어 버전

스튜디오 13.0.1 보내기

드림위버 CS6

SublimeText3 Mac 버전

뜨거운 주제