【问题标题】:MongoDB - search GridFS file contents by stringMongoDB - 按字符串搜索 GridFS 文件内容
【发布时间】:2013-07-31 10:37:41
【问题描述】:

我打算使用 GridFS 在 MongoDB 中上传用户的 word 文档。我必须实现以下功能。

当管理员在管理应用程序中键入一个字符串并点击搜索时,我必须列出所有内容包含搜索字符串的 word 文档。我必须搜索所有用户的文档。

有没有办法在 MongoDB 中实现这一点?如果没有,实现这一目标的最佳方法是什么?

【问题讨论】:

  • @AD7six 是的。我想搜索文件内容。如果内容匹配,我必须列出该文件名。
  • 能否提取文本并将其保存在引用 GridFS 文档的文本搜索索引属性中?
  • 我认为使用搜索工具(例如弹性搜索)比直接在 mongo 中查找要好得多。

标签: php mongodb search gridfs


【解决方案1】:

在 MongoDB 中,您可以做的最好的事情是将搜索短语与 GridFS 中的内容进行二进制匹配,但在 Word 文档中,您可能找不到该短语,因为它可能已被压缩。

我认为使用 Solr 等专用搜索解决方案会更好。 Solr 甚至允许您从 Word 文档中提取文本,并允许您以非常完整的搜索语言搜索任何类型的短语。看看 http://wiki.apache.org/solr/ExtractingRequestHandler 处理 Word 文档 f.e.

【讨论】:

    猜你喜欢
    • 2012-07-08
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-03-26
    • 1970-01-01
    • 1970-01-01
    • 2012-03-29
    • 2017-09-18
    相关资源
    最近更新 更多