【发布时间】:2017-01-31 01:11:07
【问题描述】:
我在 CestOS6.7 上使用 Mongo 版本 2.6.12。它是非集群的,即仅安装在一台服务器上。
我的项目需要将最终输出存储在 MongoDB 中。这些文件是存储在 Linux 和 HDFS 上的 CSV。有人可以指导我如何将 CSV 文件从 Linux/HDFS 导入 mongo DB。
Mongoimport 不起作用,因为它默认将输入作为 JSON 文件。我在 mongo-shell 中尝试过,它失败了
mongoimport news-output-20170125.csv --type csv
2017-01-30T19:18:25.275-0600 SyntaxError:意外的标识符
【问题讨论】:
-
如果文件在 Linux 和 HDFS 上,为什么 HDFS 很重要?无论如何,
Unexpected identifier似乎是不言自明的。阅读文档...The csv parser accepts that data that complies with RFC 4180 -
谢谢。我的文件都在 Linux 和 Hdfs 上。我需要一种将文件从其中任何一个导入到 mongodb 的方法。上面的文件在 linux 上,当我执行 mongoimport 时会出错。
-
此外,该文件完全是 csv 格式,具有以下测试输入:Sally Whittaker,2018,McCarren House,312,3.75 Belinda Jameson,2017,Cushing House,148,3.52 Jeff Smith,2018,Prescott House,17-D,3.20 Sandy Allen,2019,Oliver House,108,3.48