Hadoop 运行环境搭建(开发重点)
创始人
2024-05-30 03:58:23
0

文章目录

  • Hadoop 运行环境搭建(开发重点)
    • 一、安装JDK
    • 二、安装配置 Hadoop
      • 1、安装 hadoop
      • 2、hadoop 目录结构
      • 3、设置免密登录
      • 4、完全分布式模式(开发重点)
        • 1)分发jdk
        • 2)集群配置
          • (1) 集群部署规划
          • (2) 配置文件说明
          • (3) 配置集群
        • 4) 集群基本测试
          • (1) 上传文件到集群
        • 5) 配置历史服务器

Hadoop 运行环境搭建(开发重点)

一、安装JDK

将 hadoop 的安装包和 jdk 的安装包,上传到 hadoop102 的 /opt/software 目录下
在这里插入图片描述
输入命令:tar -zxvf jdk-8u212-linux-x64.tar.gz -C /opt/ 将jdk压缩包解压到 /opt 目录下
在这里插入图片描述
输入命令: mv jdk1.8.0_212/ jdk1.8 包的名字太长了我们给他改成jdk1.8
在这里插入图片描述
然后接下来,配置jdk的环境变量
输入命令:vim /etc/profile 添加以下的变量
在这里插入图片描述

export JAVA_HOME=/opt/jdk1.8
export PATH=$PATH:$JAVA_HOME/bin

输入命令:source /etc/profile 保存配置
输入命令:java -version 可以看到jdk安装成功了

在这里插入图片描述

二、安装配置 Hadoop

1、安装 hadoop

/opt/software 目录下的hadoop压缩包,解压到 /opt 目录下
输入命令: tar -zxvf hadoop-3.1.3.tar.gz -C /opt 可以看到 opt目录下就有hadoop包了
在这里插入图片描述
输入命令:vim /etc/profile 配置Hadoop的环境变量
在这里插入图片描述

export HADOOP_HOME=/opt/hadoop-3.1.3
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH
export HDFS_NAMENODE_USER=root
export HDFS_DATANODE_USER=root
export HDFS_SECONDARYNAMENODE_USER=root

输入命令:source /etc/profile 让环境生效
输入命令:hadoop version,可以看到hadoop安装成功
在这里插入图片描述

2、hadoop 目录结构

查看 hadoop 的目录结构
在这里插入图片描述
hdfs 是存储的,mapred 是计算的,yarn是资源调度的
hadoop 重要目录:
(1)bin 目录:存放对 Hadoop 相关服务(hdfs,yarn,mapred)进行操作的脚本
(2)etc 目录:Hadoop 的配置文件目录,存放 Hadoop 的配置文件
(3)lib 目录:存放 Hadoop 的本地库(对数据进行压缩解压缩功能)
(4)sbin 目录:存放启动或停止 Hadoop 相关服务的脚本
(5)share 目录:存放 Hadoop 的依赖 jar 包、文档、和官方案例

3、设置免密登录

输入命令:cd .ssh
在这里插入图片描述
输入命令:ssh-keygen -t rsa 然后按三次回车
就会生成两个文件 id_rsa(私钥)、id_rsa.pub(公钥)
在这里插入图片描述)将公钥拷将公钥拷贝到要免密登录的目标机器上
ssh-copy-id hadoop102
ssh-copy-id hadoop103
ssh-copy-id hadoop104
在这里插入图片描述
现在登录到其他的虚拟机上就不会输密码了
在这里插入图片描述
注意
还需要在 hadoop103 上采用 root 账号配置一下无密登录到 hadoop102、hadoop103、
hadoop104 服务器上。
还需要在 hadoop104 上采用 root 账号配置一下无密登录到 hadoop102、hadoop103、
hadoop104 服务器上。
还需要在 hadoop102 上采用 root 账号,配置一下无密登录到 hadoop102、hadoop103、
hadoop104
在这里插入图片描述

4、完全分布式模式(开发重点)

1)准备三台客户机(关闭防火墙,静态IP,主机名称)
2)安装JDK
3)配置环境变量
4)安装 Hadoop
5)配置环境变量
6)配置集群
7)单点启动
8)配置ssh
9)群起并测试集群

1)分发jdk

在 hadoop102 上,将hadoop12 中 /opt/jdk1.8 目录拷贝到 hadoop103,hadoop104 上面去
输入命令:scp -r $JAVA_HOME root@hadoop103:/opt
输入命令:scp -r $JAVA_HOME root@hadoop104:/opt
可以看到 hadoop103 和 hadoop104 也有jdk文件了
在这里插入图片描述
hadoop 也是同样的拷贝,拷贝到 hadoop103 和 hadoop104
输入命令: scp -r $HADOOP_HOME root@hadoop103:/opt
可以看到hadoop103 和 hadoop104 也有hadoop包了
在这里插入图片描述

2)集群配置

(1) 集群部署规划

注意:
NameNodeSecondaryNameNode 不要安装在同一台服务器
ResourceManager 也很消耗内存,不要和 NameNodeSecondaryNameNode 配置在
同一台机器上
在这里插入图片描述

(2) 配置文件说明

Hadoop 配置文件分两类:默认配置文件和自定义配置文件,只有用户想修改某一默认
配置值时,才需要修改自定义配置文件,更改相应属性值。
1、默认配置文件
在这里插入图片描述
2、自定义配置文件
core-site.xmlhdfs-site.xmlyarn-site.xmlmapred-site.xml 四个配置文件存放在
$HADOOP_HOME/etc/hadoop 这个路径上,用户可以根据项目需求重新进行修改配置

(3) 配置集群

1、核心配置文件
配置 core-site.xml
输入命令:cd $HADOOP_HOME/etc/hadoop 进入hadoop的配置的目录
在这里插入图片描述
输入命令:vim core-site.xml 配置core-site.xml 文件
在这里插入图片描述



fs.defaultFShdfs://hadoop102:8020hadoop.tmp.dir/opt/hadoop-3.1.3/datahadoop.http.staticuser.useraex

2、HDFS 配置文件
配置 hdfs-site.xml
输入命令:vim hdfs-site.xml
在这里插入图片描述





dfs.namenode.http-addresshadoop102:9870
dfs.namenode.secondary.http-addresshadoop104:9868

3、YARN 配置文件
配置yarn-site.xml
输入命令:vim yarn-site.xml
在这里插入图片描述



yarn.nodemanager.aux-servicesmapreduce_shuffleyarn.resourcemanager.hostnamehadoop103yarn.nodemanager.env-whitelistJAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CO
NF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAP
RED_HOME

4、MapReduce 配置文件
输入命令:vim mapred-site.xml




mapreduce.framework.nameyarn

在这里插入图片描述
5、在集群上分发1配置好的Hadoop配置文件
输入命令: scp -r $HADOOP_HOME root@hadoop103:$HADOOP_HOME 将配置分发给hadoop103
输入命令: scp -r $HADOOP_HOME root@hadoop104:$HADOOP_HOME 将配置分发给hadoop104
6、配置worekers
输入命令:vim worekers
在这里插入图片描述
5、进行初始化
输入命令:hdfs namenode -format 下面会出现很长一串
在这里插入图片描述
启动节点
输入命令:start-all.sh
在这里插入图片描述
在webUI 界面上查看 hdfs,浏览器输入 hadoop102:9870
在这里插入图片描述

4) 集群基本测试

(1) 上传文件到集群

输入命令:hdfs dfs -mkdrir /input 先在hdfs上创建一个 input目录
在这里插入图片描述
可以看到 hdfs 上已经有这个文件了
在这里插入图片描述
上传一个文件上去
输入命令: hdfs dfs -put jdk-8u212-linux-x64.tar.gz /input
在这里插入图片描述
可以看到文件已经上传上去了
在这里插入图片描述

5) 配置历史服务器

为了查看程序的历史运行情况,需要配置一下历史服务器,具体配置如下:
1、配置 mapred-site.xml
输入命令:vim mapred-site.xml
在这里插入图片描述




mapreduce.framework.nameyarn

mapreduce.jobhistory.addresshadoop102:10020


mapreduce.jobhistory.webapp.addresshadoop102:19888


2、分发配置
输入命令:scp -r /opt/hadoop-3.1.3/etc/hadoop/mapred-site.xml root@hadoop103:/opt/hadoop-3.1.3/etc/hadoop/mapred-site.xml mapred-site.xml
输入命令:scp -r /opt/hadoop-3.1.3/etc/hadoop/mapred-site.xml root@hadoop104:/opt/hadoop-3.1.3/etc/hadoop/mapred-site.xml mapred-site.xml
在这里插入图片描述
3、在hadoop102启动历史服务器
输入命令:mapred --daemon start historyserver
在这里插入图片描述

相关内容

热门资讯

天津市古文化街导游词 天津市古文化街导游词  来自××的朋友大家好!  首先我代表青年旅行社欢迎各...
杭州西湖中英文导游词 杭州西湖中英文导游词  杭州西湖的导游词怎么写?下面小编为大家推荐2篇中英文的范文,希望对大家有帮助...
西安秦始皇兵马俑博物馆导游词 西安秦始皇兵马俑博物馆导游词  一篇完整的导游词,其结构一般包括习惯用语、概括介绍、重点讲解三个部分...
杭州山沟沟概况导游词 杭州山沟沟概况导游词  作为一名默默奉献的导游,总归要编写导游词,导游词作为一种解说的文体,它的作用...
我是大连小导游作文共60篇 我是大连小导游作文 第一篇亲爱的朋友们,旅途辛苦了,欢迎来到我的家乡—福州永泰,我是今天的小导游,大...
呼和浩特大昭寺导游词 呼和浩特大昭寺导游词  大昭寺成为藏式宗教建筑的千古典范,是旅游的胜地,吸引了很多游客来参观,导游要...
逍遥津导游词 逍遥津导游词位于合肥市旧城的东北角,是一座约20万平方米的城市公园。逍遥津古为淝水上的一个津渡。公园...
导游词开场白 导游词开场白导游词开场白有一句广告词说:心随我动,沟通无限,那我与在座各位朋友的沟通就从我的自我介绍...
苏州盘门三景导游词 苏州盘门三景导游词范例  苏州历史文化名城遐迩闻名在于她的历史悠久、人文荟萃、风景优美。盘门景区位于...
游长城导游词 游长城导游词  长城是世界七大奇迹之一。它像一条巨龙盘踞在中国北方的辽阔的土地上。它是中国古代劳动人...
颐和园导游词400字 颐和园导游词400字  一、颐和园简介  颐和园,中国清朝时期皇家园林,前身为清漪园,坐落在北京西郊...
辽宁省五女山导游词 辽宁省五女山导游词  作为一名具备丰富知识的导游,时常需要用到导游词,导游词的主要特点是口语化,此外...
介绍平遥古城导游词 介绍平遥古城导游词(通用15篇)  作为一位杰出的导游,往往需要进行导游词编写工作,导游词是导游员进...
太乙洞导游词 太乙洞导游词1、[洞口太乙神像]亲爱的游客,大家好!热烈欢迎观光!我们太乙洞有360万年历史,主洞全...
沈阳故宫导游词 沈阳故宫导游词  作为一名专门为游客提供帮助的导游,就有可能用到导游词,导游词具有注重口语化、精简凝...
广化寺导游词 广化寺导游词  广化寺,又称莆田南山广化寺,大家不妨来看看小编推送的广化寺导游词,希望给大家带来帮助...
学校的导游词 学校的导游词  作为一名专门引导游客、助人为乐的导游,就不得不需要编写导游词,导游词事实上是一种对旅...
云冈石窟介绍导游词 云冈石窟介绍导游词(精选10篇)  作为一无名无私奉献的导游,常常需要准备导游词,导游词是讲解当地的...
福建鼓山十八景精彩导游词参考 福建鼓山十八景精彩导游词参考  各位游客朋友们,大家早上好!欢迎你们来到鼓山十八景,我是你们的导游小...
成都武侯祠导游词 成都武侯祠导游词精选  成都武侯祠号称“三国圣地”,是全国保存最好的纪念三国文化的地方。保存得好的原...