【问题标题】:Best data structures for searching millions of filenames? [duplicate]搜索数百万个文件名的最佳数据结构? [复制]
【发布时间】:2011-07-28 03:36:31
【问题描述】:

可能重复:
Build an index for substring search?

我正在开发一个文件名搜索工具。我想在一个硬盘驱动器(或多个硬盘驱动器)中搜索数百万个文件名。

给定文件:application 3 - jack smithinson

搜索:

  1. 'application', '3', 'jack', 'smithinson'
  2. 'smith'
  3. 'inson'

应该都返回这个文件。

这种操作的最佳数据结构是什么?为什么?

  1. 二叉树。
  2. 试一试。
  3. SQLite 数据库,文件名
  4. 更多?

【问题讨论】:

  • 你打算如何维护数据结构?相对于实际的文件系统内容,该结构需要达到多大的最新程度?

标签: c# .net algorithm search data-structures


【解决方案1】:

将这些文件名存储在 Lucene 索引中。您可以在这里找到更多信息 http://incubator.apache.org/lucene.net/ Lucene 允许您为搜索创建高度优化的索引。雅虎多年来一直使用它作为他们的网络搜索引擎。 它提供了一种创建索引的抽象方法,而无需担心内部实现。就像在内存中创建一个xml文档然后序列化到磁盘一样简单

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2013-11-11
    • 1970-01-01
    • 1970-01-01
    • 2015-08-14
    • 1970-01-01
    • 2017-02-20
    • 2011-07-02
    • 2015-11-16
    相关资源
    最近更新 更多