【发布时间】:2016-05-09 15:48:40
【问题描述】:
我在 YARN 上运行 Hadoop 作业时遇到问题,尤其是在 Ambari 上。我是 Hadoop 新手,写过 MR 作业,但没有集群管理经验。
我正在尝试为一个小输入文件(如 1.4MB)运行 WordCount 示例,但大多数时候我会遇到如下异常:
Application application_1453983463294_0005 failed 2 times due to AM Container for appattempt_1453983463294_0005_000002 exited with exitCode: -104
For more detailed output, check application tracking page:http://hdp-master.nissatech.local:8088/cluster/app/application_1453983463294_0005Then, click on links to logs of each attempt.
Diagnostics: Container [pid=23429,containerID=container_1453983463294_0005_02_000001] is running beyond physical memory limits. Current usage: 264.6 MB of 256 MB physical memory used; 1.9 GB of 537.6 MB virtual memory used. Killing container.
看来我应该更改堆限制。我不明白这么小的工作怎么可能需要这么多的堆?
YARN 是使用 Ambari 默认设置安装的,所以我没有更改任何参数。这是一个有 4 台机器的小型集群,其中 3 台用作 DataNodes/NodeManagers(并且有目前未使用的 RegionServers)。每个工人有 4GB 的 RAM 和 4 个核心。
具体问题是什么,如何解决?
此外,如果您提供任何可以帮助我了解如何设置和配置小型集群(例如最多 10 台机器)的参考资料,我将不胜感激。我的意思是要使用多少 RAM 和 CPU。
【问题讨论】:
标签: hadoop hadoop-yarn ambari