【问题标题】:Parsing XML Feeds解析 XML 提要
【发布时间】:2012-09-29 05:45:12
【问题描述】:

我想解析网站的 RSS 提要并想获取内容(例如文章)并想将它们放入数据库中。后来我还想根据搜索关键字对它们进行索引。谁能告诉如何进行?什么工具最适合用于此? 我搜索了 Apache lucene、solr 和 apache nutch。但是我仍然不清楚如何用java等编程语言来实现它。 任何人都可以提供有关实施的更多详细信息。

提前致谢。

【问题讨论】:

    标签: java solr lucene xml-parsing nutch


    【解决方案1】:

    首先,我会阅读Java API for XML Processing

    接下来,我会熟悉一些网络 API...

    我也会熟悉xPathHow xPath Works,这对于查找您感兴趣的部分文档很有用。

    接下来,我会变成JDBC(TM) Database Access

    这应该只是涵盖了基础知识。

    一旦您对技术有了基本的了解,就需要考虑设计。我将 it 元素分离到它自己的项目中。

    将数据下载、解析、排序和插入数据库作为一个项目处理。

    在另一个地方处理搜索和检索。

    这将突出显示重叠区域并向您显示需要提供公共库的位置。

    【讨论】:

    • 感谢您的回复。我正在查看您提到的链接。
    猜你喜欢
    • 1970-01-01
    • 2012-02-13
    • 2012-10-19
    • 2012-02-18
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-06-23
    相关资源
    最近更新 更多