【发布时间】:2011-02-25 12:04:59
【问题描述】:
我的问题是,我要开发一个网站,每个人都可以上传 doc 文件、txt 文件等。现在我需要一个组件来实际解析文件中的一些关键字并维护该文件的索引。并且该索引也应该基于结构化数据进行更新,例如文档可以主动查看等等。当另一个用户尝试根据前面提到的一些关键字和一些结构化数据来查看该文档列表时,用户应该快速找到该列表。它应该支持多语言。我们有一个算法,但我们需要一个开源 API 来读取文件,使用基于关键字的非结构化数据索引文件。任何人都可以在这方面提供帮助。
【问题讨论】:
标签: java parsing file search document