【发布时间】:2012-09-29 05:45:12
【问题描述】:
我想解析网站的 RSS 提要并想获取内容(例如文章)并想将它们放入数据库中。后来我还想根据搜索关键字对它们进行索引。谁能告诉如何进行?什么工具最适合用于此? 我搜索了 Apache lucene、solr 和 apache nutch。但是我仍然不清楚如何用java等编程语言来实现它。 任何人都可以提供有关实施的更多详细信息。
提前致谢。
【问题讨论】:
标签: java solr lucene xml-parsing nutch