【发布时间】:2014-10-07 03:44:25
【问题描述】:
我有一个巨大的(以 GB 为单位的)推特数据供以 JSON 格式进行分析。每条推文都表示为一个 json 对象。我需要对这些数据进行少量分析,例如
a:从这些提要中提取对话。 b: 查找统计数据
记录的示例格式 https://gist.github.com/hrp/900964
1.请建议提取所需信息的一般方法。 2.最好使用的语言(Java或任何其他) 3.java处理流程概述(如文件处理等) 4.任何与此问题相关的有用参考链接。
注意:数据由数百万个 JSON 对象组成。
【问题讨论】: