【问题标题】:Which rdfa parser for java that supports currently used rdfa attributes?哪个 rdfa 解析器支持当前使用的 rdfa 属性?
【发布时间】:2011-02-14 18:16:15
【问题描述】:

我正在用 Java 构建一个应用程序,使用 Jena 进行语义信息抓取。我正在寻找可以让我正确提取所有 RDFa 语句的 RDFa 解析器。具体来说,提取有关使用的名称空间的信息并假设页面中的 RDFa 标记是正确的会生成正确的三元组,即区分对象和数据属性的三元组。

我浏览了站点 http://rdfa.info/wiki/Consume 上所有用于 Java 的 RDFa 解析器。他们都在努力提取任何 RDFa 语句,如果它们没有崩溃,Jena RDFa 解析器会显示大量错误,然后死于可怕的死亡,数据几乎没有用处,因为它处理不正确并且通常会混淆。我是这方面的新手,所以请温柔:)

我也在考虑使用一个用不同语言编写的库,但是我真的不知道如何将它插入到 Java 代码中。有什么建议吗?

【问题讨论】:

    标签: java parsing rdfa


    【解决方案1】:

    使用java-rdfa。它支持 jena,并使用 validator.nu html 5 解析器,它像浏览器一样处理 html 解析(即它会修复损坏的标记)。

    【讨论】:

      【解决方案2】:

      大多数 RDFa 解析器都在处理无效的 HTML。 any23 library 包含一个可以处理无效 HTML 的 RDFa 解析器。它将任何 RDFa 解析为完整的 RDF,包括命名空间映射等,并且正在积极开发中。

      【讨论】:

      • 感谢您,我在我的应用程序中使用了 any23 库,这似乎是目前基于 java 的产品中的最佳选择。
      猜你喜欢
      • 1970-01-01
      • 2011-12-17
      • 2017-03-30
      • 2013-01-20
      • 2021-09-30
      • 2014-01-13
      • 2019-05-10
      • 2018-02-11
      • 2018-06-09
      相关资源
      最近更新 更多