array(2) {
  ["docs"]=>
  array(10) {
    [0]=>
    array(10) {
      ["id"]=>
      string(3) "428"
      ["text"]=>
      string(77) "Visual Studio 2017 单独启动MSDN帮助（Microsoft Help Viewer）的方法"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(8) "DonetRen"
      ["tagsname"]=>
      string(55) "Visual Studio 2017|MSDN帮助|C#程序|.NET|Help Viewer"
      ["tagsid"]=>
      string(23) "[401,402,403,"300",404]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511400964"
      ["_id"]=>
      string(3) "428"
    }
    [1]=>
    array(10) {
      ["id"]=>
      string(3) "427"
      ["text"]=>
      string(42) "npm -v；报错 cannot find module "wrapp""
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(4) "zzty"
      ["tagsname"]=>
      string(50) "node.js|npm|cannot find module &quot;wrapp“|node"
      ["tagsid"]=>
      string(19) "[398,"239",399,400]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511400760"
      ["_id"]=>
      string(3) "427"
    }
    [2]=>
    array(10) {
      ["id"]=>
      string(3) "426"
      ["text"]=>
      string(54) "说说css中pt、px、em、rem都扮演了什么角色"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(12) "zhengqiaoyin"
      ["tagsname"]=>
      string(0) ""
      ["tagsid"]=>
      string(2) "[]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511400640"
      ["_id"]=>
      string(3) "426"
    }
    [3]=>
    array(10) {
      ["id"]=>
      string(3) "425"
      ["text"]=>
      string(83) "深入学习JS执行--创建执行上下文（变量对象，作用域链，this）"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(7) "Ry-yuan"
      ["tagsname"]=>
      string(33) "Javascript|Javascript执行过程"
      ["tagsid"]=>
      string(13) "["169","191"]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511399901"
      ["_id"]=>
      string(3) "425"
    }
    [4]=>
    array(10) {
      ["id"]=>
      string(3) "424"
      ["text"]=>
      string(30) "C# 排序技术研究与对比"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(9) "vveiliang"
      ["tagsname"]=>
      string(0) ""
      ["tagsid"]=>
      string(2) "[]"
      ["catesname"]=>
      string(8) ".Net Dev"
      ["catesid"]=>
      string(5) "[199]"
      ["createtime"]=>
      string(10) "1511399150"
      ["_id"]=>
      string(3) "424"
    }
    [5]=>
    array(10) {
      ["id"]=>
      string(3) "423"
      ["text"]=>
      string(72) "【算法】小白的算法笔记：快速排序算法的编码和优化"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(9) "penghuwan"
      ["tagsname"]=>
      string(6) "算法"
      ["tagsid"]=>
      string(7) "["344"]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511398109"
      ["_id"]=>
      string(3) "423"
    }
    [6]=>
    array(10) {
      ["id"]=>
      string(3) "422"
      ["text"]=>
      string(64) "JavaScript数据可视化编程学习（二）Flotr2，雷达图"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(7) "chengxs"
      ["tagsname"]=>
      string(28) "数据可视化|前端学习"
      ["tagsid"]=>
      string(9) "[396,397]"
      ["catesname"]=>
      string(18) "前端基本知识"
      ["catesid"]=>
      string(5) "[198]"
      ["createtime"]=>
      string(10) "1511397800"
      ["_id"]=>
      string(3) "422"
    }
    [7]=>
    array(10) {
      ["id"]=>
      string(3) "421"
      ["text"]=>
      string(36) "C#表达式目录树（Expression）"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(4) "wwym"
      ["tagsname"]=>
      string(0) ""
      ["tagsid"]=>
      string(2) "[]"
      ["catesname"]=>
      string(4) ".NET"
      ["catesid"]=>
      string(7) "["119"]"
      ["createtime"]=>
      string(10) "1511397474"
      ["_id"]=>
      string(3) "421"
    }
    [8]=>
    array(10) {
      ["id"]=>
      string(3) "420"
      ["text"]=>
      string(47) "数据结构 队列_队列实例：事件处理"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(7) "idreamo"
      ["tagsname"]=>
      string(40) "C语言|数据结构|队列|事件处理"
      ["tagsid"]=>
      string(23) "["246","247","248",395]"
      ["catesname"]=>
      string(12) "数据结构"
      ["catesid"]=>
      string(7) "["133"]"
      ["createtime"]=>
      string(10) "1511397279"
      ["_id"]=>
      string(3) "420"
    }
    [9]=>
    array(10) {
      ["id"]=>
      string(3) "419"
      ["text"]=>
      string(47) "久等了,博客园官方Android客户端发布"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(3) "cmt"
      ["tagsname"]=>
      string(0) ""
      ["tagsid"]=>
      string(2) "[]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511396549"
      ["_id"]=>
      string(3) "419"
    }
  }
  ["count"]=>
  int(200)
}
222<!DOCTYPE html>
<html lang="zh-CN">
<head>
<meta charset="utf-8" />
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<meta http-equiv="content-language" content="zh-CN" />
<meta http-equiv="X-UA-Compatible" content="IE=edge" /> 
    <title>Apache Hadoop 集群安装文档 - 爱码网</title>
     
<meta name="keywords" content="Apache Hadoop 集群安装文档" />
<meta name="description" content="目录ECharts异步加载ECharts数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。chart.setOption({    color: [" />
<meta name="viewport" content="width=device-width, initial-scale=1.0" />
<link rel="stylesheet" type="text/css" href="/statics/css/base.css?v=2.7" />
<script src="/statics/js/detail.min.js?v=2.2"></script>   
<script>
   $(document).ready(function () { 
		$("img").error(function () {
			$(this).hide();
		}); 
	}); 
</script>
</head>
<body class="home-template dtpg">
<nav class="main-nav clearfix">
    <div class="inner">
        <ul class="nav">
            <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/" title="爱码网">首页</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/1.html" title="前端技术">前端技术</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/9.html" title="编程语言">编程语言</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/31.html" title="人工智能">人工智能</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/41.html" title="运维知识">运维知识</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/52.html" title="资源下载">资源下载</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/68.html" title="常用小工具">常用小工具</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/72.html" title="技术问答">技术问答</a></li>
                    </ul>            
	 
    </div>
</nav><div class="site-wrapper">
 
    <header style="height: auto;padding: 10px 0px;" class="main-header">
        <div style="max-width:910px" class="main-header-content inner">
                        <h1 class="page-title"><a href="/show-306309011.html" title="Apache Hadoop 集群安装文档">Apache Hadoop 集群安装文档</a></h1>
            
        </div>

    </header>
    <main class="content" role="main">
	

        <div class="leftbox">
    <article class="post tag-uifont tag-webview">
        <header class="post-header">
            <footer class="tc">  
                <time class="post-date" datetime="2021-05-25">2021-05-25</time>
            </footer>
        </header>
        <section class="post-content">
            <div class="contentbef">  
                  
                              </div>

            
<p><br>简介：</p>
<p>  Apache Hadoop 集群安装文档<br><br>  软件：jdk-8u111-linux-x64.rpm、hadoop-2.8.0.tar.gz<br><br><a href="http://www.apache.org/dyn/closer.cgi/hadoop/common/hadoop-2.8.0/hadoop-2.8.0.tar.gz" target="_blank" rel="nofollow">http://www.apache.org/dyn/closer.cgi/hadoop/common/hadoop-2.8.0/hadoop-2.8.0.tar.gz</a></p>
<div class="likecs_code">
<pre>  系统：CentOS <span style="color: rgba(128, 0, 128, 1)">6.8</span><span style="color: rgba(0, 0, 0, 1)"> x64
  
  主机列表及配置信息：
  
                    master.hadoop     datanode[</span><span style="color: rgba(128, 0, 128, 1)">01</span>:<span style="color: rgba(128, 0, 128, 1)">03</span><span style="color: rgba(0, 0, 0, 1)">].hadoop

  CPU：                  </span><span style="color: rgba(128, 0, 128, 1)">8</span>                     <span style="color: rgba(128, 0, 128, 1)">4</span><span style="color: rgba(0, 0, 0, 1)">

  MEM:                  16G                    8G

  DISK：               100G</span>*<span style="color: rgba(128, 0, 128, 1)">2</span>                100G*<span style="color: rgba(128, 0, 128, 1)">2</span></pre>
</div>
<p>一、系统初始化</p>
<p># master.hadoop</p>
<div class="likecs_code">
<pre>shell &gt; vim /etc/<span style="color: rgba(0, 0, 0, 1)">hosts

</span><span style="color: rgba(128, 0, 128, 1)">192.168</span>.<span style="color: rgba(128, 0, 128, 1)">1.25</span><span style="color: rgba(0, 0, 0, 1)">  master.hadoop
</span><span style="color: rgba(128, 0, 128, 1)">192.168</span>.<span style="color: rgba(128, 0, 128, 1)">1.27</span><span style="color: rgba(0, 0, 0, 1)">  datanode01.hadoop
</span><span style="color: rgba(128, 0, 128, 1)">192.168</span>.<span style="color: rgba(128, 0, 128, 1)">1.28</span><span style="color: rgba(0, 0, 0, 1)">  datanode02.hadoop
</span><span style="color: rgba(128, 0, 128, 1)">192.168</span>.<span style="color: rgba(128, 0, 128, 1)">1.29</span><span style="color: rgba(0, 0, 0, 1)">  datanode03.hadoop

shell </span>&gt; <span style="color: rgba(0, 0, 255, 1)">yum</span> -y <span style="color: rgba(0, 0, 255, 1)">install</span> epel-<span style="color: rgba(0, 0, 0, 1)">release
shell </span>&gt; <span style="color: rgba(0, 0, 255, 1)">yum</span> -y <span style="color: rgba(0, 0, 255, 1)">install</span><span style="color: rgba(0, 0, 0, 1)"> ansible

shell </span>&gt; <span style="color: rgba(0, 0, 255, 1)">ssh-keygen</span><span style="color: rgba(0, 0, 0, 1)">  # 生成密钥
shell </span>&gt; <span style="color: rgba(0, 0, 255, 1)">ssh</span>-copy-<span style="color: rgba(0, 0, 255, 1)">id</span> -i ~/.<span style="color: rgba(0, 0, 255, 1)">ssh</span>/id_rsa.pub <span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">-p 22 root@datanode01.hadoop</span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(0, 0, 0, 1)">
shell </span>&gt; <span style="color: rgba(0, 0, 255, 1)">ssh</span>-copy-<span style="color: rgba(0, 0, 255, 1)">id</span> -i ~/.<span style="color: rgba(0, 0, 255, 1)">ssh</span>/id_rsa.pub <span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">-p 22 root@datanode02.hadoop</span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(0, 0, 0, 1)">
shell </span>&gt; <span style="color: rgba(0, 0, 255, 1)">ssh</span>-copy-<span style="color: rgba(0, 0, 255, 1)">id</span> -i ~/.<span style="color: rgba(0, 0, 255, 1)">ssh</span>/id_rsa.pub <span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">-p 22 root@datanode03.hadoop</span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(0, 0, 0, 1)">

shell </span>&gt; vim /etc/ansible/<span style="color: rgba(0, 0, 0, 1)">hosts

# datanode.hadoop

[datanode]

datanode[</span><span style="color: rgba(128, 0, 128, 1)">01</span>:<span style="color: rgba(128, 0, 128, 1)">03</span><span style="color: rgba(0, 0, 0, 1)">].hadoop

shell </span>&gt; ansible datanode -m shell -a <span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(128, 0, 0, 1)">useradd hadoop &amp;&amp; echo hadoop | passwd --stdin hadoop</span><span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(0, 0, 0, 1)">

shell </span>&gt; ansible datanode -m shell -a <span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">echo '* - nofile 65536' &gt;&gt; /etc/security/limits.conf</span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(0, 0, 0, 1)">

shell </span>&gt; ansible datanode -m copy -a <span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(128, 0, 0, 1)">src=/etc/hosts dest=/etc/hosts</span><span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(0, 0, 0, 1)">  # 同步 hosts

shell </span>&gt; ansible datanode -m shell -a <span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(128, 0, 0, 1)">/etc/init.d/iptables stop &amp;&amp; chkconfig --del iptables</span><span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(0, 0, 0, 1)">  # 关闭防火墙

shell </span>&gt; ansible datanode -m shell -a <span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(128, 0, 0, 1)">sed -i </span><span style="color: rgba(128, 0, 0, 1)">'</span>/SELINUX/s/enforcing/disabled/<span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(128, 0, 0, 1)"> /etc/selinux/config</span><span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(0, 0, 0, 1)">  # 关闭 SELinux

shell </span>&gt; ansible datanode -m shell -a <span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(128, 0, 0, 1)">echo </span><span style="color: rgba(128, 0, 0, 1)">'</span>vm.swappiness = <span style="color: rgba(128, 0, 128, 1)">0</span><span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(128, 0, 0, 1)"> &gt;&gt; /etc/sysctl.conf</span><span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(0, 0, 0, 1)">  # 修改内核参数

shell </span>&gt; ansible datanode -m shell -a <span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(128, 0, 0, 1)">echo </span><span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(0, 0, 255, 1)">echo</span> never &gt; /sys/kernel/mm/redhat_transparent_hugepage/defrag<span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(128, 0, 0, 1)">  # 关闭透明大页</span>
<span style="color: rgba(0, 0, 0, 1)">
shell </span>&gt; ansible datanode -m shell -a <span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(128, 0, 0, 1)">echo </span><span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(0, 0, 255, 1)">echo</span> never &gt; /sys/kernel/mm/redhat_transparent_hugepage/defrag<span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(128, 0, 0, 1)"> &gt;&gt; /etc/rc.local</span><span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(0, 0, 0, 1)">

shell </span>&gt; ansible datanode -m shell -a <span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(128, 0, 0, 1)">reboot</span><span style="color: rgba(128, 0, 0, 1)">'</span></pre>
</div>
<p># 上面的 ansible 操作，master.hadoop 也要执行</p>
<p>二、时间同步</p>
<p># master.hadoop</p>
<div class="likecs_code">
<pre>shell &gt; /bin/<span style="color: rgba(0, 0, 255, 1)">cp</span> -f /usr/share/zoneinfo/Asia/Shanghai /etc/<span style="color: rgba(0, 0, 0, 1)">localtime

shell </span>&gt; <span style="color: rgba(0, 0, 255, 1)">yum</span> -y <span style="color: rgba(0, 0, 255, 1)">install</span><span style="color: rgba(0, 0, 0, 1)"> ntp

shell </span>&gt; /etc/init.d/ntpd stop &amp;&amp; chkconfig --<span style="color: rgba(0, 0, 0, 1)">del ntpd

shell </span>&gt; ntpdate us.pool.ntp.org | hwclock -<span style="color: rgba(0, 0, 255, 1)">w</span><span style="color: rgba(0, 0, 0, 1)">

shell </span>&gt; vim /etc/<span style="color: rgba(0, 0, 0, 1)">ntp.conf
# 允许时间同步客户端
restrict </span><span style="color: rgba(128, 0, 128, 1)">192.168</span>.<span style="color: rgba(128, 0, 128, 1)">1.0</span> mask <span style="color: rgba(128, 0, 128, 1)">255.255</span>.<span style="color: rgba(128, 0, 128, 1)">255.0</span><span style="color: rgba(0, 0, 0, 1)"> nomodify
# Server 向谁同步时间
server us.pool.ntp.org prefer
# Server 无法向时间服务器同步时，使用本地时钟
server </span><span style="color: rgba(128, 0, 128, 1)">127.127</span>.<span style="color: rgba(128, 0, 128, 1)">1.0</span><span style="color: rgba(0, 0, 0, 1)">
fudge </span><span style="color: rgba(128, 0, 128, 1)">127.127</span>.<span style="color: rgba(128, 0, 128, 1)">1.0</span> stratum <span style="color: rgba(128, 0, 128, 1)">10</span><span style="color: rgba(0, 0, 0, 1)">

shell </span>&gt; /etc/init.d/<span style="color: rgba(0, 0, 0, 1)">ntpd start

shell </span>&gt; <span style="color: rgba(0, 0, 255, 1)">echo</span> -e <span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(128, 0, 0, 1)">\n/usr/sbin/ntpdate us.pool.ntp.org | hwclock -w &gt; /dev/null</span><span style="color: rgba(128, 0, 0, 1)">'</span> &gt;&gt; /etc/<span style="color: rgba(0, 0, 0, 1)">rc.local

shell </span>&gt; <span style="color: rgba(0, 0, 255, 1)">echo</span> -e <span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(128, 0, 0, 1)">\n/etc/init.d/ntpd start &gt; /dev/null</span><span style="color: rgba(128, 0, 0, 1)">'</span> &gt;&gt; /etc/<span style="color: rgba(0, 0, 0, 1)">rc.local

shell </span>&gt; ansible datanode -m shell -a <span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(128, 0, 0, 1)">yum -y install ntpdate</span><span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(0, 0, 0, 1)">

shell </span>&gt; ansible datanode -m shell -a <span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(128, 0, 0, 1)">/bin/cp -f /usr/share/zoneinfo/Asia/Shanghai /etc/localtime</span><span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(0, 0, 0, 1)">

shell </span>&gt; ansible datanode -m shell -a <span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(128, 0, 0, 1)">ntpdate master.hadoop | hwclock -w</span><span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(0, 0, 0, 1)">

shell </span>&gt; ansible datanode -m cron -a <span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">name='ntpdate master.hadoop' minute=0 hour=0 job='/usr/sbin/ntpdate master.hadoop | hwclock -w &gt; /dev/null'</span><span style="color: rgba(128, 0, 0, 1)">"</span></pre>
</div>
<p>三、集群部署</p>
<p># master.hadoop</p>
<p>1、安装 jdk、下载、解压 apache hadoop、设置主机间 hadoop 用户无密码登录</p>
<div class="likecs_code">
<pre>shell &gt; rpm -ivh /usr/local/src/jdk-8u111-linux-<span style="color: rgba(0, 0, 0, 1)">x64.rpm

shell </span>&gt; <span style="color: rgba(0, 0, 255, 1)">echo</span> <span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(128, 0, 0, 1)">export JAVA_HOME=/usr/java/default</span><span style="color: rgba(128, 0, 0, 1)">'</span> &gt;&gt; /etc/profile &amp;&amp; source /etc/<span style="color: rgba(0, 0, 0, 1)">profile

shell </span>&gt; <span style="color: rgba(0, 0, 255, 1)">tar</span> zxf /usr/local/src/hadoop-<span style="color: rgba(128, 0, 128, 1)">2.8</span>.<span style="color: rgba(128, 0, 128, 1)">0</span>.<span style="color: rgba(0, 0, 255, 1)">tar</span>.gz -C /usr/local/<span style="color: rgba(0, 0, 0, 1)">

shell </span>&gt; <span style="color: rgba(0, 0, 255, 1)">chown</span> -R hadoop.hadoop /usr/local/hadoop-<span style="color: rgba(128, 0, 128, 1)">2.8</span>.<span style="color: rgba(128, 0, 128, 1)">0</span><span style="color: rgba(0, 0, 0, 1)">

shell </span>&gt; <span style="color: rgba(0, 0, 255, 1)">echo</span> -e <span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(128, 0, 0, 1)">\nexport PATH=$PATH:/usr/local/hadoop-2.8.0/bin</span><span style="color: rgba(128, 0, 0, 1)">'</span> &gt;&gt; /etc/profile &amp;&amp; source /etc/<span style="color: rgba(0, 0, 0, 1)">profile

shell </span>&gt; <span style="color: rgba(0, 0, 255, 1)">su</span> -<span style="color: rgba(0, 0, 0, 1)"> hadoop

hadoop shell </span>&gt; <span style="color: rgba(0, 0, 255, 1)">ssh-keygen</span><span style="color: rgba(0, 0, 0, 1)">

hadoop shell </span>&gt; <span style="color: rgba(0, 0, 255, 1)">cat</span> .<span style="color: rgba(0, 0, 255, 1)">ssh</span>/id_rsa.pub &gt; .<span style="color: rgba(0, 0, 255, 1)">ssh</span>/authorized_keys &amp;&amp; <span style="color: rgba(0, 0, 255, 1)">chmod</span> <span style="color: rgba(128, 0, 128, 1)">600</span> .<span style="color: rgba(0, 0, 255, 1)">ssh</span>/<span style="color: rgba(0, 0, 0, 1)">authorized_keys

hadoop shell </span>&gt; <span style="color: rgba(0, 0, 255, 1)">ssh</span>-copy-<span style="color: rgba(0, 0, 255, 1)">id</span> -i ~/.<span style="color: rgba(0, 0, 255, 1)">ssh</span>/id_rsa.pub <span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">-p 22 hadoop@datanode01.hadoop</span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(0, 0, 0, 1)">
hadoop shell </span>&gt; <span style="color: rgba(0, 0, 255, 1)">ssh</span>-copy-<span style="color: rgba(0, 0, 255, 1)">id</span> -i ~/.<span style="color: rgba(0, 0, 255, 1)">ssh</span>/id_rsa.pub <span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">-p 22 hadoop@datanode02.hadoop</span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(0, 0, 0, 1)">
hadoop shell </span>&gt; <span style="color: rgba(0, 0, 255, 1)">ssh</span>-copy-<span style="color: rgba(0, 0, 255, 1)">id</span> -i ~/.<span style="color: rgba(0, 0, 255, 1)">ssh</span>/id_rsa.pub <span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">-p 22 hadoop@datanode03.hadoop</span><span style="color: rgba(128, 0, 0, 1)">"</span></pre>
</div>
<p>2、配置 apache hadoop</p>
<p># 指定 Slave、即 DataNode、NodeManager 角色</p>
<div class="likecs_code">
<pre>hadoop shell &gt; vim /usr/local/hadoop-<span style="color: rgba(128, 0, 128, 1)">2.8</span>.<span style="color: rgba(128, 0, 128, 1)">0</span>/etc/hadoop/<span style="color: rgba(0, 0, 0, 1)">slaves
datanode01.hadoop
datanode02.hadoop
datanode03.hadoop</span></pre>
</div>
<p># 修改 hadoop-env.sh</p>
<div class="likecs_code">
<pre>hadoop shell &gt; vim /usr/local/hadoop-<span style="color: rgba(128, 0, 128, 1)">2.8</span>.<span style="color: rgba(128, 0, 128, 1)">0</span>/etc/hadoop/hadoop-<span style="color: rgba(0, 0, 255, 1)">env</span>.<span style="color: rgba(0, 0, 255, 1)">sh</span><span style="color: rgba(0, 0, 0, 1)">

export JAVA_HOME</span>=/usr/java/default</pre>
</div>
<p># 修改 core-site.xml</p>
<div class="likecs_code">
<pre>&lt;configuration&gt;

    &lt;property&gt;
        &lt;name&gt;fs.defaultFS&lt;/name&gt;
        &lt;value&gt;hdfs:<span style="color: rgba(0, 128, 0, 1)">//</span><span style="color: rgba(0, 128, 0, 1)">master.hadoop:8020&lt;/value&gt;</span>
    &lt;/property&gt;

    &lt;property&gt;
        &lt;name&gt;hadoop.tmp.<span style="color: rgba(0, 0, 255, 1)">dir</span>&lt;/name&gt;
        &lt;value&gt;<span style="color: rgba(0, 0, 255, 1)">file</span>:<span style="color: rgba(128, 128, 128, 1)">///</span><span style="color: rgba(0, 128, 0, 1)">data/hadoop/tmp</span><span style="color: rgba(128, 128, 128, 1)">&lt;/value&gt;</span>
    &lt;/property&gt;

    &lt;property&gt;
        &lt;name&gt;fs.trash.interval&lt;/name&gt;
        &lt;value&gt;<span style="color: rgba(128, 0, 128, 1)">1440</span>&lt;/value&gt;
    &lt;/property&gt;

    &lt;property&gt;
        &lt;name&gt;io.<span style="color: rgba(0, 0, 255, 1)">file</span>.buffer.size&lt;/name&gt;
        &lt;value&gt;<span style="color: rgba(128, 0, 128, 1)">131072</span>&lt;/value&gt;
    &lt;/property&gt;

&lt;/configuration&gt;</pre>
</div>
<p># hadoop 核心配置文件<br># 默认加载项 HADOOP_HOME/share/doc/hadoop/hadoop-project-dist/hadoop-common/core-default.xml</p>
<p># fs.defaultFS         NameNode IP:PORT，老版本为 fs.default.name<br># hadoop.tmp.dir       hadoop 临时目录，很多目录不明确配置时，都基于该目录 ( 默认 /tmp，系统重启时会被删除 )，很重要！<br># fs.trash.interval    开启垃圾回收，1440 分钟，默认 0 关闭 ( 用户文件系统级删除的数据会被移到回收站，24小时后被删除 )<br># io.file.buffer.size  读写流文件缓存大小，减少IO次数，默认 4096 字节</p>
<p># 修改 hdfs-site.xml</p>
<div class="likecs_code">
<pre>hadoop shell &gt; vim /usr/local/hadoop-<span style="color: rgba(128, 0, 128, 1)">2.8</span>.<span style="color: rgba(128, 0, 128, 1)">0</span>/etc/hadoop/hdfs-<span style="color: rgba(0, 0, 0, 1)">site.xml

</span>&lt;configuration&gt;

    &lt;property&gt;
        &lt;name&gt;dfs.blocksize&lt;/name&gt;
        &lt;value&gt;<span style="color: rgba(128, 0, 128, 1)">134217728</span>&lt;/value&gt;
    &lt;/property&gt;

    &lt;property&gt;
        &lt;name&gt;dfs.replication&lt;/name&gt;
        &lt;value&gt;<span style="color: rgba(128, 0, 128, 1)">3</span>&lt;/value&gt;
    &lt;/property&gt;

    &lt;property&gt;
        &lt;name&gt;dfs.namenode.name.<span style="color: rgba(0, 0, 255, 1)">dir</span>&lt;/name&gt;
        &lt;value&gt;<span style="color: rgba(0, 0, 255, 1)">file</span>:<span style="color: rgba(128, 128, 128, 1)">///</span><span style="color: rgba(0, 128, 0, 1)">data/dfs/nn</span><span style="color: rgba(128, 128, 128, 1)">&lt;/value&gt;</span>
    &lt;/property&gt;

    &lt;property&gt;
        &lt;name&gt;dfs.namenode.checkpoint.<span style="color: rgba(0, 0, 255, 1)">dir</span>&lt;/name&gt;
        &lt;value&gt;<span style="color: rgba(0, 0, 255, 1)">file</span>:<span style="color: rgba(128, 128, 128, 1)">///</span><span style="color: rgba(0, 128, 0, 1)">data/dfs/sn</span><span style="color: rgba(128, 128, 128, 1)">&lt;/value&gt;</span>
    &lt;/property&gt;

    &lt;property&gt;
        &lt;name&gt;dfs.datanode.data.<span style="color: rgba(0, 0, 255, 1)">dir</span>&lt;/name&gt;
        &lt;value&gt;<span style="color: rgba(0, 0, 255, 1)">file</span>:<span style="color: rgba(128, 128, 128, 1)">///</span><span style="color: rgba(0, 128, 0, 1)">data/dfs/dn</span><span style="color: rgba(128, 128, 128, 1)">&lt;/value&gt;</span>
    &lt;/property&gt;

    &lt;property&gt;
        &lt;name&gt;dfs.namenode.handler.count&lt;/name&gt;
        &lt;value&gt;<span style="color: rgba(128, 0, 128, 1)">20</span>&lt;/value&gt;
    &lt;/property&gt;
    
&lt;/configuration&gt;</pre>
</div>
<p># HDFS 配置文件<br># 默认加载项 HADOOP_HOME/share/doc/hadoop/hadoop-project-dist/hadoop-hdfs/hdfs-default.xml<br><br># dfs.hosts / dfs.hosts.exclude  允许或排除某些 DataNode 连接 NameNode</p>
<p># dfs.blocksize                块大小，默认 134217728 ( 128M )<br># dfs.replication              默认副本数，数据冗余<br># dfs.namenode.name.dir        NameNode 元数据存放位置，可以配置多个目录，以 , 分割，用作数据冗余！<br># dfs.namenode.checkpoint.dir  SecondaryNameNode 数据存储目录，该角色负责将 NameNode 的 edit log 合并到 fsimage<br># dfs.datanode.data.dir        DataNode   数据存放位置，可以配置多个目录，以 , 分割，数据轮询写入，增加写入速度 ( 多个目录应该对应多个设备 DISK )<br># dfs.namenode.handler.count   NameNode 线程数，用于跟 DataNode 通信，默认 10，增大该参数可以优化性能，但是资源也相应提升</p>
<p># 修改 yarn-site.xml</p>
<div class="likecs_code">
<pre>hadoop shell &gt; vim /usr/local/hadoop-<span style="color: rgba(128, 0, 128, 1)">2.8</span>.<span style="color: rgba(128, 0, 128, 1)">0</span>/etc/hadoop/yarn-<span style="color: rgba(0, 0, 0, 1)">site.xml

</span>&lt;configuration&gt;

    &lt;property&gt;
        &lt;name&gt;yarn.resourcemanager.<span style="color: rgba(0, 0, 255, 1)">hostname</span>&lt;/name&gt;
        &lt;value&gt;master.hadoop&lt;/value&gt;
    &lt;/property&gt;

    &lt;property&gt;
      &lt;name&gt;yarn.resourcemanager.scheduler.class&lt;/name&gt;
      &lt;value&gt;org.apache.hadoop.yarn.server.resourcemanager.scheduler.capacity.CapacityScheduler&lt;/value&gt;
    &lt;/property&gt;

    &lt;property&gt;
        &lt;name&gt;yarn.nodemanager.log-dirs&lt;/name&gt;
        &lt;value&gt;${yarn.log.<span style="color: rgba(0, 0, 255, 1)">dir</span>}/userlogs&lt;/value&gt;
    &lt;/property&gt;

    &lt;property&gt;
        &lt;name&gt;yarn.nodemanager.remote-app-log-<span style="color: rgba(0, 0, 255, 1)">dir</span>&lt;/name&gt;
        &lt;value&gt;/tmp/logs&lt;/value&gt;
    &lt;/property&gt;

    &lt;property&gt;
        &lt;name&gt;yarn.nodemanager.aux-services&lt;/name&gt;
        &lt;value&gt;mapreduce_shuffle&lt;/value&gt;
    &lt;/property&gt;

&lt;/configuration&gt;</pre>
</div>
<p># YARN 配置文件<br># 默认加载项 HADOOP_HOME/share/doc/hadoop/hadoop-yarn/hadoop-yarn-common/yarn-default.xml</p>
<p># yarn.resourcemanager.hostname         ReSourceManager 主机，其余关于端口的监听都基于该配置项<br># yarn.resourcemanager.scheduler.class  资源调度算法，CapacityScheduler 计算能力调度、FairScheduler 公平调度、Fifo Scheduler 先进先出调度<br># yarn.nodemanager.log-dirs             nodemanager 日志目录<br># yarn.nodemanager.remote-app-log-dir   nodemanager 中间结果保持目录</p>
<p># 修改 mapred-site.xml</p>
<div class="likecs_code">
<pre>hadoop shell &gt; <span style="color: rgba(0, 0, 255, 1)">cat</span> /usr/local/hadoop-<span style="color: rgba(128, 0, 128, 1)">2.8</span>.<span style="color: rgba(128, 0, 128, 1)">0</span>/etc/hadoop/mapred-site.xml.template &gt; /usr/local/hadoop-<span style="color: rgba(128, 0, 128, 1)">2.8</span>.<span style="color: rgba(128, 0, 128, 1)">0</span>/etc/hadoop/mapred-<span style="color: rgba(0, 0, 0, 1)">site.xml
hadoop shell </span>&gt; vim /usr/local/hadoop-<span style="color: rgba(128, 0, 128, 1)">2.8</span>.<span style="color: rgba(128, 0, 128, 1)">0</span>/etc/hadoop/mapred-<span style="color: rgba(0, 0, 0, 1)">site.xml

</span>&lt;configuration&gt;

    &lt;property&gt;
        &lt;name&gt;mapreduce.framework.name&lt;/name&gt;
        &lt;value&gt;yarn&lt;/value&gt;
    &lt;/property&gt;

    &lt;property&gt;
        &lt;name&gt;mapreduce.jobhistory.address&lt;/name&gt;
        &lt;value&gt;master.hadoop:<span style="color: rgba(128, 0, 128, 1)">10020</span>&lt;/value&gt;
    &lt;/property&gt;

    &lt;property&gt;
        &lt;name&gt;mapreduce.jobhistory.webapp.address&lt;/name&gt;
        &lt;value&gt;master.hadoop:<span style="color: rgba(128, 0, 128, 1)">19888</span>&lt;/value&gt;
    &lt;/property&gt;

    &lt;property&gt;
        &lt;name&gt;yarn.app.mapreduce.am.staging-<span style="color: rgba(0, 0, 255, 1)">dir</span>&lt;/name&gt;
        &lt;value&gt;/tmp/hadoop-yarn/staging&lt;/value&gt;
    &lt;/property&gt;

&lt;/configuration&gt;</pre>
</div>
<p># MAPREDUCE 配置文件<br># 默认加载项 HADOOP_HOME/share/doc/hadoop/hadoop-mapreduce-client/hadoop-mapreduce-client-core/mapred-default.xml</p>
<p># mapreduce.framework.name           使用 yarn 来管理资源<br># yarn.app.mapreduce.am.staging-dir  提交作业时的临时目录，提交作业历史目录 mapreduce.jobhistory.done-dir、mapreduce.jobhistory.intermediate-done-dir 都基于该目录</p>
<div class="likecs_code">
<pre>hadoop shell &gt; exit</pre>
</div>
<p>3、部署 Slave</p>
<div class="likecs_code">
<pre>shell &gt; ansible datanode -m copy -a <span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(128, 0, 0, 1)">src=/usr/local/src/jdk-8u111-linux-x64.rpm dest=/usr/local/src/</span><span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(0, 0, 0, 1)">

shell </span>&gt; <span style="color: rgba(0, 0, 255, 1)">yum</span> -y <span style="color: rgba(0, 0, 255, 1)">install</span><span style="color: rgba(0, 0, 0, 1)"> rsync

shell </span>&gt; ansible datanode -m shell -a <span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(128, 0, 0, 1)">yum -y install rsync</span><span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(0, 0, 0, 1)">

shell </span>&gt; ansible datanode -m synchronize -a <span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(128, 0, 0, 1)">src=/usr/local/hadoop-2.8.0 dest=/usr/local/</span><span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(0, 0, 0, 1)">

# 我还傻傻的用 copy 模块，结果慢的要死，synchroize 为 rsync 模块，好快！

shell </span>&gt; ansible datanode -m shell -a <span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(128, 0, 0, 1)">rpm -ivh /usr/local/src/jdk-8u111-linux-x64.rpm</span><span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(0, 0, 0, 1)">

shell </span>&gt; ansible datanode -m shell -a <span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">echo -e '\nexport JAVA_HOME=/usr/java/default' &gt;&gt; /etc/profile &amp;&amp; source /etc/profile</span><span style="color: rgba(128, 0, 0, 1)">"</span></pre>
</div>
<p>四、启动集群</p>
<p># master.hadoop</p>
<div class="likecs_code">
<pre>shell &gt; <span style="color: rgba(0, 0, 255, 1)">chmod</span> -R a+<span style="color: rgba(0, 0, 255, 1)">w</span> /<span style="color: rgba(0, 0, 0, 1)">data
shell </span>&gt; ansible datanode -m shell -a <span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(128, 0, 0, 1)">chmod -R a+w /data</span><span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(0, 0, 0, 1)">

# 需要给 </span>/data 目录写入权限，否则无法初始化文件系统 hdfs namenode -<span style="color: rgba(0, 0, 0, 1)">format

shell </span>&gt; <span style="color: rgba(0, 0, 255, 1)">su</span> -<span style="color: rgba(0, 0, 0, 1)"> hadoop

hadoop shell </span>&gt; hdfs namenode -<span style="color: rgba(0, 0, 0, 1)">format  # 初次启动需要格式化文件系统

hadoop shell </span>&gt; <span style="color: rgba(0, 0, 255, 1)">sh</span> /usr/local/hadoop-<span style="color: rgba(128, 0, 128, 1)">2.8</span>.<span style="color: rgba(128, 0, 128, 1)">0</span>/sbin/start-all.<span style="color: rgba(0, 0, 255, 1)">sh</span>  # 启动所有服务 / stop-all.<span style="color: rgba(0, 0, 255, 1)">sh</span><span style="color: rgba(0, 0, 0, 1)"> 关闭服务

hadoop shell </span>&gt;<span style="color: rgba(0, 0, 0, 1)"> jps
</span><span style="color: rgba(128, 0, 128, 1)">4386</span><span style="color: rgba(0, 0, 0, 1)"> ResourceManager
</span><span style="color: rgba(128, 0, 128, 1)">4659</span><span style="color: rgba(0, 0, 0, 1)"> Jps
</span><span style="color: rgba(128, 0, 128, 1)">3990</span><span style="color: rgba(0, 0, 0, 1)"> NameNode
</span><span style="color: rgba(128, 0, 128, 1)">4204</span> SecondaryNameNode</pre>
</div>
<p># 这是 master.hadoop 启动的角色<br># http://192.168.1.25:50070  # NameNode<br># http://192.168.1.25:8088  # ReSourceManagerv<br># http://192.168.1.25:10020  # MapReduce JobHistory Server :19888 webui</p>
<p># datanode.hadoop</p>
<div class="likecs_code">
<pre>hadoop shell &gt;<span style="color: rgba(0, 0, 0, 1)"> jps
</span><span style="color: rgba(128, 0, 128, 1)">2508</span><span style="color: rgba(0, 0, 0, 1)"> Jps
</span><span style="color: rgba(128, 0, 128, 1)">2238</span><span style="color: rgba(0, 0, 0, 1)"> DataNode
</span><span style="color: rgba(128, 0, 128, 1)">2351</span> NodeManager</pre>
</div>
<p># 这是 datanode.hadoop 启动的角色</p>
<div class="likecs_code">
<pre>hadoop shell &gt; hdfs dfs -<span style="color: rgba(0, 0, 255, 1)">ls</span>
<span style="color: rgba(0, 0, 255, 1)">ls</span>: `.<span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(128, 0, 0, 1)">: No such file or directory</span>
<span style="color: rgba(0, 0, 0, 1)">
hadoop shell </span>&gt; hdfs dfs -<span style="color: rgba(0, 0, 255, 1)">mkdir</span> /<span style="color: rgba(0, 0, 0, 1)">user
hadoop shell </span>&gt; hdfs dfs -<span style="color: rgba(0, 0, 255, 1)">mkdir</span> /user/<span style="color: rgba(0, 0, 0, 1)">hadoop

hadoop shell </span>&gt; hdfs dfs -<span style="color: rgba(0, 0, 255, 1)">ls</span></pre>
</div>
<p># 为 hadoop 用户创建家目录</p>
<p>五、运行示例</p>
<p># master.hadoop</p>
<div class="likecs_code">
<pre>hadoop shell &gt; hdfs dfs -<span style="color: rgba(0, 0, 0, 1)">put shakespeare.txt  # 上传本地文件到 hdfs
hadoop shell </span>&gt; hdfs dfs -<span style="color: rgba(0, 0, 255, 1)">ls</span><span style="color: rgba(0, 0, 0, 1)">
Found </span><span style="color: rgba(128, 0, 128, 1)">1</span><span style="color: rgba(0, 0, 0, 1)"> items
</span>-rw-r--r--   <span style="color: rgba(128, 0, 128, 1)">3</span> hadoop supergroup    <span style="color: rgba(128, 0, 128, 1)">5447165</span> <span style="color: rgba(128, 0, 128, 1)">2017</span>-<span style="color: rgba(128, 0, 128, 1)">05</span>-<span style="color: rgba(128, 0, 128, 1)">17</span> <span style="color: rgba(128, 0, 128, 1)">16</span>:<span style="color: rgba(128, 0, 128, 1)">49</span><span style="color: rgba(0, 0, 0, 1)"> shakespeare.txt

hadoop shell </span>&gt; hadoop jar /usr/local/hadoop-<span style="color: rgba(128, 0, 128, 1)">2.8</span>.<span style="color: rgba(128, 0, 128, 1)">0</span>/share/hadoop/mapreduce/hadoop-mapreduce-examples-<span style="color: rgba(128, 0, 128, 1)">2.8</span>.<span style="color: rgba(128, 0, 128, 1)">0</span>.jar <span style="color: rgba(0, 0, 255, 1)">grep</span><span style="color: rgba(0, 0, 0, 1)"> shakespeare.txt outfile what

# 执行官方示例，词频统计 ( 统计 what 出现次数 )

hadoop shell </span>&gt; hdfs dfs -<span style="color: rgba(0, 0, 255, 1)">ls</span><span style="color: rgba(0, 0, 0, 1)">
drwxr</span>-xr-x   - hadoop supergroup          <span style="color: rgba(128, 0, 128, 1)">0</span> <span style="color: rgba(128, 0, 128, 1)">2017</span>-<span style="color: rgba(128, 0, 128, 1)">04</span>-<span style="color: rgba(128, 0, 128, 1)">11</span> <span style="color: rgba(128, 0, 128, 1)">19</span>:<span style="color: rgba(128, 0, 128, 1)">38</span><span style="color: rgba(0, 0, 0, 1)"> outfile
</span>-rw-r--r--   <span style="color: rgba(128, 0, 128, 1)">3</span> hadoop supergroup    <span style="color: rgba(128, 0, 128, 1)">5447165</span> <span style="color: rgba(128, 0, 128, 1)">2017</span>-<span style="color: rgba(128, 0, 128, 1)">04</span>-<span style="color: rgba(128, 0, 128, 1)">11</span> <span style="color: rgba(128, 0, 128, 1)">19</span>:<span style="color: rgba(128, 0, 128, 1)">35</span><span style="color: rgba(0, 0, 0, 1)"> shakespeare.txt

hadoop shell </span>&gt; hdfs dfs -<span style="color: rgba(0, 0, 255, 1)">cat</span> outfile<span style="color: rgba(0, 128, 0, 1)">/*</span><span style="color: rgba(0, 128, 0, 1)">
2309    what</span></pre>
</div>
<p>报错管理：</p>
<p>1、bin/hdfs namenode -format # 初始化文件系统报错</p>
<div class="likecs_code">
<pre><span style="color: rgba(128, 0, 128, 1)">17</span>/<span style="color: rgba(128, 0, 128, 1)">04</span>/<span style="color: rgba(128, 0, 128, 1)">01</span> <span style="color: rgba(128, 0, 128, 1)">19</span>:<span style="color: rgba(128, 0, 128, 1)">04</span>:<span style="color: rgba(128, 0, 128, 1)">29</span><span style="color: rgba(0, 0, 0, 1)"> ERROR namenode.NameNode: Failed to start namenode.
java.io.IOException: Cannot create directory </span>/data/dfs/namenode/<span style="color: rgba(0, 0, 0, 1)">current
    at org.apache.hadoop.hdfs.server.common.Storage$StorageDirectory.clearDirectory(Storage.java:</span><span style="color: rgba(128, 0, 128, 1)">352</span><span style="color: rgba(0, 0, 0, 1)">)
    at org.apache.hadoop.hdfs.server.namenode.NNStorage.format(NNStorage.java:</span><span style="color: rgba(128, 0, 128, 1)">573</span><span style="color: rgba(0, 0, 0, 1)">)
    at org.apache.hadoop.hdfs.server.namenode.NNStorage.format(NNStorage.java:</span><span style="color: rgba(128, 0, 128, 1)">594</span><span style="color: rgba(0, 0, 0, 1)">)
    at org.apache.hadoop.hdfs.server.namenode.FSImage.format(FSImage.java:</span><span style="color: rgba(128, 0, 128, 1)">156</span><span style="color: rgba(0, 0, 0, 1)">)
    at org.apache.hadoop.hdfs.server.namenode.NameNode.format(NameNode.java:</span><span style="color: rgba(128, 0, 128, 1)">1102</span><span style="color: rgba(0, 0, 0, 1)">)
    at org.apache.hadoop.hdfs.server.namenode.NameNode.createNameNode(NameNode.java:</span><span style="color: rgba(128, 0, 128, 1)">1544</span><span style="color: rgba(0, 0, 0, 1)">)
    at org.apache.hadoop.hdfs.server.namenode.NameNode.main(NameNode.java:</span><span style="color: rgba(128, 0, 128, 1)">1671</span>)</pre>
</div>
<p># 解决方法</p>
<div class="likecs_code">
<pre>shell &gt; <span style="color: rgba(0, 0, 255, 1)">chmod</span> -R a+<span style="color: rgba(0, 0, 255, 1)">w</span> /<span style="color: rgba(0, 0, 0, 1)">data
shell </span>&gt; ansible datanode -m shell -a <span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(128, 0, 0, 1)">chmod -R a+w /data</span><span style="color: rgba(128, 0, 0, 1)">'</span></pre>
</div>
<p>2、WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable # 迷之警告</p>
 
                    
                <div style="margin-top: 10px;">
                  </div> 
        </section>
	 
        <footer class="post-footer">
            <section class="author">
                                            </section>
        </footer>
        <p class="mt10">相关文章：</p>
        <div style="width: 100%;" class="contentcard">
      
            <div style="width: 100%;height: auto;" class="carditem litem clearfix"> 
                    <ul style="padding-left: 0rem;" class="cardcont">
                                            </ul>
               </div>   
         </div>
    </article>

  
</div>

<div class="rigthbox contentcard mt10">
 
          <div style="height: auto;" class="carditem litem">
    <div class="cardtit">猜你喜欢 </div>
        <ul class="cardcont">
                        </ul>
   </div> 

<div style="height: auto;" class="carditem litem">
    <div class="cardtit">相关资源 </div>
        <ul class="cardcont">
              
                            </ul>
   </div>
   
    <div style="height: auto;" class="carditem litem">
     <div class="cardtit">相似解决方案 </div>
         <ul class="cardcont">
                          </ul>
    </div>
  
   <div style="height: auto;background-color: #ddd;text-align: center;" class="carditem litem">
    <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-5446233687289962" data-ad-slot="2607637140"  data-ad-format="auto"  data-full-width-responsive="true"></ins><script>(adsbygoogle = window.adsbygoogle || []).push({});</script>
</div> 
   <div  style="height: auto;" class="carditem litem mt20">
    <div class="cardtit">热门标签  </div>
    <div class="tagbox">
                    <a target="_blank" title="Java" href="/default/index/tags?cid=164&cname=Java" >Java</a>
                        <a target="_blank" title="Python" href="/default/index/tags?cid=367&cname=Python" >Python</a>
                        <a target="_blank" title="linux" href="/default/index/tags?cid=274&cname=linux" >linux</a>
                        <a target="_blank" title="javascript" href="/default/index/tags?cid=169&cname=javascript" >javascript</a>
                        <a target="_blank" title="Mysql" href="/default/index/tags?cid=237&cname=Mysql" >Mysql</a>
                        <a target="_blank" title="C#" href="/default/index/tags?cid=187&cname=C%23" >C#</a>
                        <a target="_blank" title="Docker" href="/default/index/tags?cid=243&cname=Docker" >Docker</a>
                        <a target="_blank" title="算法" href="/default/index/tags?cid=344&cname=%E7%AE%97%E6%B3%95" >算法</a>
                        <a target="_blank" title="前端" href="/default/index/tags?cid=160&cname=%E5%89%8D%E7%AB%AF" >前端</a>
                        <a target="_blank" title="SpringBoot" href="/default/index/tags?cid=168&cname=SpringBoot" >SpringBoot</a>
                        <a target="_blank" title="Redis" href="/default/index/tags?cid=227&cname=Redis" >Redis</a>
                        <a target="_blank" title="Vue" href="/default/index/tags?cid=236&cname=Vue" >Vue</a>
                        <a target="_blank" title="spring" href="/default/index/tags?cid=696&cname=spring" >spring</a>
                        <a target="_blank" title="设计模式" href="/default/index/tags?cid=632&cname=%E8%AE%BE%E8%AE%A1%E6%A8%A1%E5%BC%8F" >设计模式</a>
                        <a target="_blank" title=".net core" href="/default/index/tags?cid=381&cname=.net+core" >.net core</a>
                        <a target="_blank" title=".net" href="/default/index/tags?cid=300&cname=.net" >.net</a>
                        <a target="_blank" title="kubernetes" href="/default/index/tags?cid=2179&cname=kubernetes" >kubernetes</a>
                        <a target="_blank" title="c++" href="/default/index/tags?cid=312&cname=c%2B%2B" >c++</a>
                        <a target="_blank" title="数据库" href="/default/index/tags?cid=284&cname=%E6%95%B0%E6%8D%AE%E5%BA%93" >数据库</a>
                        <a target="_blank" title="数据结构" href="/default/index/tags?cid=247&cname=%E6%95%B0%E6%8D%AE%E7%BB%93%E6%9E%84" >数据结构</a>
                        <a target="_blank" title="大数据" href="/default/index/tags?cid=888&cname=%E5%A4%A7%E6%95%B0%E6%8D%AE" >大数据</a>
                        <a target="_blank" title="js" href="/default/index/tags?cid=159&cname=js" >js</a>
                        <a target="_blank" title="机器学习" href="/default/index/tags?cid=171&cname=%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0" >机器学习</a>
                        <a target="_blank" title="微服务" href="/default/index/tags?cid=832&cname=%E5%BE%AE%E6%9C%8D%E5%8A%A1" >微服务</a>
                        <a target="_blank" title="Android" href="/default/index/tags?cid=282&cname=Android" >Android</a>
                        <a target="_blank" title="Go" href="/default/index/tags?cid=839&cname=Go" >Go</a>
                        <a target="_blank" title="程序员" href="/default/index/tags?cid=327&cname=%E7%A8%8B%E5%BA%8F%E5%91%98" >程序员</a>
                        <a target="_blank" title="面试" href="/default/index/tags?cid=637&cname=%E9%9D%A2%E8%AF%95" >面试</a>
                        <a target="_blank" title="JVM" href="/default/index/tags?cid=727&cname=JVM" >JVM</a>
                        <a target="_blank" title="ASP.net core" href="/default/index/tags?cid=179&cname=ASP.net+core" >ASP.net core</a>
                        <a target="_blank" title="云原生" href="/default/index/tags?cid=22056&cname=%E4%BA%91%E5%8E%9F%E7%94%9F" >云原生</a>
                        <a target="_blank" title="人工智能" href="/default/index/tags?cid=270&cname=%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD" >人工智能</a>
                        <a target="_blank" title="后端" href="/default/index/tags?cid=1089&cname=%E5%90%8E%E7%AB%AF" >后端</a>
                        <a target="_blank" title="PHP" href="/default/index/tags?cid=281&cname=PHP" >PHP</a>
                        <a target="_blank" title="git" href="/default/index/tags?cid=226&cname=git" >git</a>
                        <a target="_blank" title="CSS" href="/default/index/tags?cid=817&cname=CSS" >CSS</a>
                        <a target="_blank" title="golang" href="/default/index/tags?cid=409&cname=golang" >golang</a>
                        <a target="_blank" title="k8s" href="/default/index/tags?cid=5067&cname=k8s" >k8s</a>
                        <a target="_blank" title="Nginx" href="/default/index/tags?cid=373&cname=Nginx" >Nginx</a>
                        <a target="_blank" title="Django" href="/default/index/tags?cid=634&cname=Django" >Django</a>
                        <a target="_blank" title="mybatis" href="/default/index/tags?cid=720&cname=mybatis" >mybatis</a>
                        <a target="_blank" title="深度学习" href="/default/index/tags?cid=345&cname=%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0" >深度学习</a>
                        <a target="_blank" title="多线程" href="/default/index/tags?cid=986&cname=%E5%A4%9A%E7%BA%BF%E7%A8%8B" >多线程</a>
                        <a target="_blank" title="React" href="/default/index/tags?cid=560&cname=React" >React</a>
                        <a target="_blank" title="架构" href="/default/index/tags?cid=2070&cname=%E6%9E%B6%E6%9E%84" >架构</a>
                        <a target="_blank" title="devops" href="/default/index/tags?cid=2662&cname=devops" >devops</a>
                        <a target="_blank" title="爬虫" href="/default/index/tags?cid=905&cname=%E7%88%AC%E8%99%AB" >爬虫</a>
                        <a target="_blank" title="云计算" href="/default/index/tags?cid=361&cname=%E4%BA%91%E8%AE%A1%E7%AE%97" >云计算</a>
                        <a target="_blank" title="Spring Boot" href="/default/index/tags?cid=201&cname=Spring+Boot" >Spring Boot</a>
                        <a target="_blank" title="LeetCode" href="/default/index/tags?cid=342&cname=LeetCode" >LeetCode</a>
                </div>
       
   </div>
   
        <div id="rightadbox" style="height: 300px;background-color: #ddd;text-align: center;" class="carditem litem">
            <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-5446233687289962" data-ad-slot="2607637140"  data-ad-format="auto"  data-full-width-responsive="true"></ins><script>(adsbygoogle = window.adsbygoogle || []).push({});</script>
        </div> 
</div>
<div class="clearfix"></div>
</main>
    
<div class="yllinks alink"></div>
 

<footer class="site-footer clearfix">
<section class="copyright">By &copy; 2026 <a href="/" title="www.likecs.com">likecs</a> 版权所有,<br/>本站所有数据收集于网络如有侵犯到您的权益请联系 进行下架处理1。 </section>
<section class="poweredby">  <a target="_blank" href="https://beian.miit.gov.cn/">粤ICP备22038628号</a>Powered By  WordPress </section>
<script charset="UTF-8" id="LA_COLLECT" src="//sdk.51.la/js-sdk-pro.min.js"></script>
<script>LA.init({id: "Je3PjbvUssp6BbvY",ck: "Je3PjbvUssp6BbvY"})</script>
<script>
var _hmt = _hmt || [];
(function() {
  var hm = document.createElement("script");
  hm.src = "https://hm.baidu.com/hm.js?2eb031e42d29b7c1a1f16948d2ae2a9f";
  var s = document.getElementsByTagName("script")[0]; 
  s.parentNode.insertBefore(hm, s);
})();
</script>
</footer>  
</div>
<script>
    $(function(){
                    $(".post-content").append('<p style="padding: 20px;color: #cacaca;">原文链接：https://www.cnblogs.com/wangxiaoqiangs/p/6700717.html</p>')  
            }) 
</script> 
</body>
</html>