【发布时间】:2015-03-13 22:13:21
【问题描述】:
您好,我有可以在 10 台机器上运行的 python 脚本和挖掘数据。 大数据... 我想将短语数据发送到 hadoop 集群。 我想在 digitalocean 上安装 cloudera 和 hadoop。 Hadoop如何随时准备接收文件, 而不是 python 脚本将发送带有 json 数据的 post 请求的信息? 您能建议我发送数据的更好方法吗? 感谢您的帮助。
【问题讨论】:
-
将数据写入HDFS?
标签: python hadoop web-crawler data-mining