BigData大数据运维-linux运维-PHP中文网

大数据运维" > 大数据运维

首页

运维

linux运维

BigData大数据运维

重铸

Jul 23, 2020 pm 05:24 PM

大数据运维

一.HDFS分布式文件系统运维

1.在 HDFS 文件系统的根目录下创建递归目录“1daoyun/file”，将附件中的BigDataSkills.txt 文件，上传到 1daoyun/file 目录中，使用相关命令查看文件系统中 1daoyun/file 目录的文件列表信息。

hadoop fs -mkdir -p /1daoyun/file

hadoop fs -put BigDataSkills.txt /1daoyun/file

hadoop fs -ls /1daoyun/file

2.在 HDFS 文件系统的根目录下创建递归目录“1daoyun/file”，将附件中的BigDataSkills.txt 文件，上传到 1daoyun/file 目录中，并使用 HDFS 文件系统检查工具检查文件是否受损。

hadoop fs -mkdir -p /1daoyun/file

hadoop fs -put BigDataSkills.txt/1daoyun/file

hadoop fsck /1daoyun/file/BigDataSkills.txt

3.在 HDFS 文件系统的根目录下创建递归目录“1daoyun/file”，将附件中的BigDataSkills.txt 文件，上传到 1daoyun/file 目录中，上传过程指定BigDataSkills.txt 文件在 HDFS 文件系统中的复制因子为 2，并使用 fsck 工具检查存储块的副本数。

hadoop fs -mkdir -p /1daoyun/file

hadoop fs -D dfs.replication=2 -put BigDataSkills.txt /1daoyun/file

hadoop fsck /1daoyun/file/BigDataSkills.txt

4.HDFS 文件系统的根目录下存在一个/apps 的文件目录，要求开启该目录的可创建快照功能，并为该目录文件创建快照，快照名称为 apps_1daoyun，使用相关命令查看该快照文件的列表信息。

hadoop dfsadmin -allowSnapshot /apps

hadoop fs -createSnapshot /apps apps_1daoyun

hadoop fs -ls /apps/.snapshot

5.当 Hadoop 集群启动的时候，会首先进入到安全模式的状态，该模式默认30 秒后退出。当系统处于安全模式时，只能对 HDFS 文件系统进行读取，无法进行写入修改删除等的操作。现假设需要对 Hadoop 集群进行维护，需要使集群进入安全模式的状态，并检查其状态。

hdfs dfsadmin -safemode enter

hdfs dfsadmin -safemode get

6.为了防止操作人员误删文件，HDFS 文件系统提供了回收站的功能，但过多的垃圾文件会占用大量的存储空间。要求在先电大数据平台的 WEB 界面将HDFS 文件系统回收站中的文件彻底删除的时间间隔为 7 天。高级core-sitefs.trash.interval：10080

7.为了防止操作人员误删文件，HDFS 文件系统提供了回收站的功能，但过多的垃圾文件会占用大量的存储空间。要求在 Linux Shell 中使用“vi”命令修改相应的配置文件以及参数信息，关闭回收站功能。完成后，重启相应的服务。高级core-sitefs.trash.interval：0

vi /etc/hadoop/2.4.3.0-227/0/core-site.xml

fs.trash.interval

sbin/stop-dfs.sh

sbin/start-dfs.sh

8.Hadoop 集群中的主机在某些情况下会出现宕机或者系统损坏的问题，一旦遇到这些问题，HDFS 文件系统中的数据文件难免会产生损坏或者丢失，为了保证 HDFS 文件系统的可靠性，现需要在先电大数据平台的 WEB 界面将集群的冗余复制因子修改为 5。

General
Block replication
5

9.Hadoop 集群中的主机在某些情况下会出现宕机或者系统损坏的问题，一旦遇到这些问题，HDFS 文件系统中的数据文件难免会产生损坏或者丢失，为了保证 HDFS 文件系统的可靠性，需要将集群的冗余复制因子修改为 5，在 Linux Shell 中使用“vi”命令修改相应的配置文件以及参数信息，完成后，重启相应的服务。

或者

vi/etc/hadoop/2.4.3.0-227/0/hdfs-site.xml

dfs.replication

su - hdfs

/usr/hdp/current/hadoop-client/sbin/hadoop-daemon.sh --config /usr/hdp/current/hadoop-client/conf stop {namenode/datenode}

/usr/hdp/current/hadoop-client/sbin/hadoop-daemon.sh --config /usr/hdp/current/hadoop-client/conf start {namenode/datenode}

10.使用命令查看 hdfs 文件系统中/tmp 目录下的目录个数，文件个数和文件总大小。

hadoop fs -count /tmp

2.MapREDUCE 案例题

1.在集群节点中/usr/hdp/2.4.3.0-227/hadoop-mapreduce/目录下，存在一个案例JAR 包 hadoop-mapreduce-examples.jar。运行 JAR 包中的 PI 程序来进行计算圆周率π的近似值，要求运行 5 次 Map 任务，每个 Map 任务的投掷次数为 5。

cd /usr/hdp/2.4.3.0-227/hadoop-mapreduce/

hadoop jar hadoop-mapreduce-examples-2.7.1.2.4.3.0-227.jar pi 5 5

2.在集群节点中/usr/hdp/2.4.3.0-227/hadoop-mapreduce/目录下，存在一个案例JAR 包 hadoop-mapreduce-examples.jar。运行 JAR 包中的 wordcount 程序来对/1daoyun/file/BigDataSkills.txt 文件进行单词计数，将运算结果输出到/1daoyun/output 目录中，使用相关命令查询单词计数结果。

hadoop jar/usr/hdp/2.4.3.0-227/hadoop-mapreduce/hadoop-mapreduce-examples-2.7.1.2.4.3.0-227.jar wordcount /1daoyun/file/BigDataSkills.txt /1daoyun/output

3.在集群节点中/usr/hdp/2.4.3.0-227/hadoop-mapreduce/目录下，存在一个案例JAR 包 hadoop-mapreduce-examples.jar。运行 JAR 包中的 sudoku 程序来计算下表中数独运算题的结果。。

cat puzzle1.dta

hadoop jarhadoop-mapreduce-examples-2.7.1.2.4.3.0-227.jar sudoku /root/puzzle1.dta

4.在集群节点中/usr/hdp/2.4.3.0-227/hadoop-mapreduce/目录下，存在一个案例JAR 包 hadoop-mapreduce-examples.jar。运行 JAR 包中的 grep 程序来统计文件系统中/1daoyun/file/BigDataSkills.txt 文件中“Hadoop”出现的次数，统计完成后，查询统计结果信息。

hadoop jarhadoop-mapreduce-examples-2.7.1.2.4.3.0-227.jar grep /1daoyun/file/BigDataSkills.txt /output hadoop

以上是BigData大数据运维的详细内容。更多信息请关注PHP中文网其他相关文章！

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

热AI工具

Undresser.AI Undress

人工智能驱动的应用程序，用于创建逼真的裸体照片

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

免费脱衣服图片

Clothoff.io

AI脱衣机

AI Hentai Generator

免费生成ai无尽的。

显示更多

热工具

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

中文版，非常好用

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

显示更多

热门话题

gmail邮箱登陆入口在哪里

7510

CakePHP 教程

1378

steam的账户名称是什么格式

win11激活密钥永久

NYT连接提示和答案

显示更多

Related knowledge

如何在Linux中使用正则表达式（REGEX）进行模式匹配？ Mar 17, 2025 pm 05:25 PM

本文介绍了如何在Linux中使用正则表达式（REGEX）进行模式匹配，文件搜索和文本操作，详细列式，命令和工具，例如GREP，SED和AWK。

如何使用TOP，HTOP和VMSTAT等工具来监视Linux中的系统性能？ Mar 17, 2025 pm 05:28 PM

本文讨论了使用TOP，HTOP和VMSTAT监视Linux系统性能，并详细介绍其独特功能和自定义选项，以进行有效的系统管理。

如何在Linux中实现SSH的两因素身份验证（2FA）？ Mar 17, 2025 pm 05:31 PM

本文提供了有关使用Google Authenticator在Linux上设置两因素身份验证（2FA）的指南，详细介绍了安装，配置和故障排除步骤。它突出了2FA的安全益处，例如增强的SEC

如何使用软件包管理器（APT，YUM，DNF）管理Linux中的软件包？ Mar 17, 2025 pm 05:26 PM

文章讨论了使用APT，YUM和DNF在Linux中管理软件包，涵盖安装，更新和删除。它比较了它们对不同分布的功能和适用性。

如何使用sudo向Linux的用户授予高架特权？ Mar 17, 2025 pm 05:32 PM

本文解释了如何管理Linux中的Sudo特权，包括授予，撤销和安全性最佳实践。关键重点是安全和sudoers安全和限制访问。Character数量：159

关键Linux操作：初学者指南 Apr 09, 2025 pm 04:09 PM

Linux初学者应掌握文件管理、用户管理和网络配置等基本操作。1)文件管理：使用mkdir、touch、ls、rm、mv、cp命令。2)用户管理：使用useradd、passwd、userdel、usermod命令。3)网络配置：使用ifconfig、echo、ufw命令。这些操作是Linux系统管理的基础，熟练掌握它们可以有效管理系统。