【问题标题】:MongoDB concept direct access to files or access imported data (accessing RAW data)MongoDB 概念直接访问文件或访问导入的数据(访问 RAW 数据)
【发布时间】:2011-05-27 12:00:33
【问题描述】:

我想尝试使用 MongoDB 访问数百万行的 RAW 数据(多个不同的文件)

如果我使用 MySQL,我必须将这些 RAW 数据导入/转换为 MySQL 表,这非常耗时。

我的问题是,如果我使用 MongoDB,我是否必须将这些 RAW 数据导入/转换为 MongoDB 数据库集合? 如果我必须这样做,使用 MongoDB 有什么好处?省时?

是否可以直接使用 MongoDB 访问 RAW 数据?

我有一个朋友使用 MongoDB 来访问 apache 日志文件 (access_log)。但是不知道他是把access_log文件中的数据转成MongoDB还是直接访问accesss_log文件。

我仍然对 MongoDB 的概念感到困惑

谢谢

【问题讨论】:

    标签: mongodb data-mining raw-data database


    【解决方案1】:

    MongoDB 是数据库,所以它的设计目的是存储数据,而不是“原始文件”...

    要“直接”访问您的文件,是的,我想您需要将文件导入到 MongoDB(不过这很容易。)

    GridFS

    MongoDB 有一个称为GridFS“在 MongoDB 中存储大文件的规范”的文件系统。

    默认情况下,MongoDB 对文档(如何在 MongoDB 中存储数据)有 4mb 的限制,因此 GridFS 旨在存储更大的文件。

    例如,command line tools 只需一行即可导入文件:

    $ ./mongofiles put myfile.txt
    

    或者您可以使用支持 GridFS 的 many available drivers 之一。

    或者不要存储文件...

    如果您不想导入文件,当然可以将文件位置(文件名和路径)存储在任何数据库中。

    但是,听起来您的朋友并没有将 apache 日志 files 存储在 MongoDB 中,而是将日志(data)本身存储在 MongoDB 中......

    更多信息

    您可以在此处了解有关如何使用 GridFS 的更多信息:http://learnmongo.com/posts/getting-started-with-mongodb-gridfs/

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2012-12-03
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2013-11-06
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多