【问题标题】:Example data for Hive tutorialHive 教程的示例数据
【发布时间】:2016-11-22 09:01:07
【问题描述】:

在线提供的原始 Hive 教程引用了一个名为“pv_2008-06-08.txt”的数据集:

https://cwiki.apache.org/confluence/display/Hive/Tutorial

当然,它在 Internet 上的数十个教程中都有引用。但是,我无法在任何地方找到原始数据。有人知道它在哪里吗?

【问题讨论】:

  • 很抱歉,但我不确定您的评论是否回答了我的问题。要么你明白我正在寻找一个通用的样本数据集(我不是:我正在寻找引用的网页浏览量),要么我可以在你给我的链接列表中找到它,但我看不到它。能不能说的详细一点?

标签: hive dataset


【解决方案1】:

阅读给定站点后,发现该站点中给出的示例已过时。请使用新链接获取更多示例。

https://cwiki.apache.org/confluence/display/Hive/Tutorial#Tutorial-UsageandExamples

注意:以下许多示例已过时。更多最新信息可以在语言手册中找到。

如果你仍然对那个数据集感兴趣,建议你邮寄到社区提供(请参考下面的链接)

http://hive.apache.org/mailing_lists.html

Hortonworks 数据集:

最近我遇到了这个 Hortonworks 数据集,可用于在 Hive 和 Pig 中创建数据库和查询。

https://app.box.com/v/hadoopcrashcoursedata

如果你想尝试使用这个数据集,这里是使用上述数据集创建表的链接

http://hortonworks.com/hadoop-tutorial/hello-world-an-introduction-to-hadoop-hcatalog-hive-and-pig/#section_4

【讨论】:

  • 感谢 Habi 的链接,但遗憾的是我请求的数据集不存在。
猜你喜欢
  • 2013-06-18
  • 2012-02-01
  • 2017-01-07
  • 1970-01-01
  • 1970-01-01
  • 2011-01-13
  • 1970-01-01
  • 2012-03-26
  • 2011-08-08
相关资源
最近更新 更多