3.5 实训1 Hadoop搭建_大数据技术与应用-QQ阅读短篇女生网

大数据技术与应用

上QQ阅读APP看书，第一时间看更新

上一章目录下一章

3.5 实训1 Hadoop搭建

1．实训目的

掌握Hadoop平台的安装和配置。

2．实训内容

搭建Hadoop平台的第一步，就是根据实际情况选择最合适的Hadoop版本。目前，由于Hadoop飞速发展，功能更新和错误修复在不断地迭代着，所以版本特别多，显得有些杂乱。结合功能和稳定性两方面，这里选择CDH5。该版本是目前生产环境中装机量较大的版本之一，涵盖了所有Hadoop版本的主要功能和模块，稳定且有很多有用的新特性。下载地址为https://archive.cloudera.com/cdh5/cdh/5/hadoop-2.6.0-cdh5.6.0.tar.gz。

Hadoop的运行环境有以下两种。

● Windows。虽然Hadoop社区目前已经支持Windows，但由于Windows操作系统本身不适合作为服务器操作系统，因此本书不介绍Windows下Hadoop的安装方式。

● Linux。Hadoop的最佳运行环境无疑是开源操作系统Linux。Linux的发行版本众多，常见的有CentOS、Ubuntu、RedHat等。本书选择的就是CentOS。

（1）安装虚拟机

1）进入VMware安装向导，如图3-12所示，单击“下一步”按钮。

2）选择自定义安装，进入“自定义安装”界面，如图3-13所示，单击“下一步”按钮。

图3-12 VMware安装向导

图3-13 “自定义安装”界面

3）进入“用户体验设置”界面，设置用户体验，单击“下一步”按钮，如图3-14所示。

4）进入“快捷方式”界面，选择创建快捷方式的位置，单击“下一步”按钮，如图3-15所示。

图3-14 “用户体验设置”界面

图3-15 “快捷方式”界面

5）准备工作完成，单击“安装”按钮，开始安装，如图3-16所示。

6）在安装过程中不需要用户执行任何操作，如图3-17所示。

图3-16 开始安装

图3-17 安装过程

7）单击“完成”按钮，退出安装向导，安装完成，如图3-18所示。

（2）新建虚拟机并安装CentOS

1）选择“自定义（高级）”单选按钮，进入新建虚拟机向导，单击“下一步”按钮，如图3-19所示。

图3-18 安装完成

图3-19 新建虚拟机向导

2）选择虚拟机硬件兼容性，单击“下一步”按钮，如图3-20所示。

3）安装客户机操作系统，单击“下一步”按钮，如图3-21所示。

图3-20 选择虚拟机硬件兼容性

图3-21 安装客户机操作系统

4）设置安装信息，单击“下一步”按钮，如图3-22所示。

5）命名虚拟机为“hadoop”，并选择安装位置，单击“下一步”按钮，如图3-23所示。

图3-22 设置安装信息

图3-23 命名虚拟机

6）配置处理器参数，单击“下一步”按钮，如图3-24所示。

7）给虚拟机分配内存，单击“下一步”按钮，如图3-25所示。

图3-24 配置处理器

图3-25 设置虚拟机内存

8）选择“使用网络地址转换（NAT）”单选按钮，为虚拟机添加网络，单击“下一步”按钮，如图3-26所示。

9）选择“LSI Logic（L）（推荐）”单选按钮，设置I/O控制器类型，单击“下一步”按钮，如图3-27所示。

10）选择“SCSI（S）（推荐）”单选按钮，设置磁盘类型，单击“下一步”按钮，如图3-28所示。

11）选择“创建新虚拟磁盘”单选按钮，单击“下一步”按钮，如图3-29所示。

图3-26 选择网络类型

图3-27 选择I/O控制器类型

图3-28 选择磁盘类型

图3-29 选择磁盘

12）设置“最大磁盘大小”为20GB，单击“下一步”按钮，如图3-30所示。

13）选择磁盘文件存储位置，单击“下一步”按钮，如图3-31所示。

图3-30 指定磁盘容量

图3-31 指定磁盘文件存储位置

14）单击“完成”按钮，虚拟机创建结束，如图3-32所示。

图3-32 创建完成

15）安装完成后，可以看到前面创建的hadoop虚拟机，设置用户名为“root”，如图3-33所示。

图3-33 设置用户名

（3）配置CentOS网卡

1）执行“vi/etc/sysconfig/network-scripts/ifcfg-eth0”命令编辑ifcfg-eth0网卡，如图3-34所示。

图3-34 输入编辑网卡命令

2）在该网卡内修改其IP地址、子网掩码及网关，如图3-35所示。

图3-35 设置IP地址

3）修改完成后，执行“service network restart”命令重启网卡，如图3-36所示。

图3-36 重启网卡

4）重启后，执行“ifconfig”命令查看网卡相关信息，如图3-37所示。

图3-37 查看网卡信息

5）执行“vi/etc/system/network”命令编辑network文件，如图3-38所示。

图3-38 输入编辑文件命令

6）进入CentOS系统名称修改界面，修改系统名称（HOSTNAME）为“hadoop”，如图3-39所示。

图3-39 修改系统名称

7）设置完成后，执行“reboot”命令重启虚拟机，如图3-40所示。

图3-40 重启虚拟机

8）执行“vi/etc/host”命令编辑hosts文件，如图3-41所示。

图3-41 输入编辑文件命令

9）进入绑定IP地址与主机名界面，输入要绑定的IP地址与主机名，如图3-42所示。

图3-42 输入要绑定的IP地址与主机名

（4）配置ssh无密码连接

1）执行“ssh-keygen”命令生成公钥。生成公钥后执行“ssh-copy-id 192.168.137.10”命令，将其转发至本机的authorized_keys列表，如图3-43所示。

图3-43 生成公钥并转发

2）使用SecureCRT工具上传JDK安装包至hadoop主机，为下一步安装JDK做准备，如图3-44所示。

图3-44 上传JDK安装包

（5）安装JDK与Hadoop环境

1）使用tar命令解压JDK安装包，如图3-45所示。

图3-45 解压JDK安装包

2）执行“vi/etc/profile”命令编辑profile文件，配置JDK环境变量，如JAVA_HOME和PATH，如图3-46所示。

3）执行“source/etc/profile”命令使profile文件立即生效，如图3-47所示。

图3-46 配置JDK环境变量

图3-47 使profile文件生效

4）执行“java-version”命令查看JDK安装结果，能看到已经安装成功，如图3-48所示。

图3-48 查看JDK安装结果

5）上传Hadoop安装包文件至虚拟机，如图3-49所示。

图3-49 上传Hadoop安装包

6）使用tar命令解压Hadoop安装包，如图3-50所示。

图3-50 解压Hadoop安装包

7）使用mv命令将解压后的Hadoop安装文件从上传目录移动至opt目录下，如图3-51所示。

图3-51 移动Hadoop安装文件

8）执行“vi/etc/profile”命令编辑profile文件，为Hadoop配置环境变量，如图3-52所示。执行“source/etc/profile”命令使profile文件立即生效。

图3-52 配置Hadoop环境变量

9）使用vi命令修改Hadoop配置文件，即hadoop-env.sh、core-site.xml、hdfs-site.xml、mapred-site.xml、yarn-site.xml和slaves文件，如图3-53所示。

图3-53 修改Hadoop配置文件

① 修改hadoop-env.sh文件，在文件末尾追加环境变量语句。

② 修改core-site.xml文件，修改如下。

③ 修改hdfs-site.xml文件，修改如下。

④ 修改mapred-site.xml文件，修改如下。

⑤ 修改yarn-site.xml文件，修改如下。

⑥ 修改slaves文件，修改如下。

10）执行“hadoop namenode-format”命令格式化HDFS。最后执行“hadoop version”命令查看安装完成后的Hadoop，如图3-54所示。至此，Hadoop已经安装并配置完成。

图3-54 查看Hadoop安装信息

上一章目录下一章