【发布时间】:2013-11-05 20:36:00
【问题描述】:
我是 Hadoop/Hortonworks/Pig 的新手,所以请原谅我的问题。
我已经安装了 Hortonworks 沙盒。我正在尝试加载一个 twitter JSON 文件并对文件执行一些查询,但我目前卡在加载文件部分。
我知道我应该使用 Elephant-bird 来使用 JsonLoader() 加载 JSON 文件(不指定 JSON 模式),所以我已经从 git repo 下载了 Elephant-bird 并且我已经包含jar文件
Elephant-bird\repo\com\twitter\elephant-bird\2.2.3\elephant-bird-2.2.3.jar
在 Hortonworks 沙盒内。这是我的 Pig 脚本的屏幕截图:
REGISTER elephant-bird-2.2.3.jar;
Json1 = LOAD 'JSON/sample.tweets' JsonLoader();
DESCRIBE Json1;
STORE Json1 INTO 'tweeterOutput';
很遗憾,我无法从此脚本执行中获得任何结果。我试过STORE 和DUMP 命令。
可能我在这个流程中做了很多错误的事情,所以任何帮助都将不胜感激!
【问题讨论】:
标签: json hadoop apache-pig hortonworks-data-platform