【问题标题】:Can't read Protege ontology in Jena无法在耶拿读取 Protege 本体
【发布时间】:2016-11-10 07:07:03
【问题描述】:

我是本体论和 Java 的新手。我现在学习它并且有一些理论知识。 我在 Eclipse 和 Protege 编辑器 5.0.0 beta 23 中使用“apache-jena-3.1.0”。

首先,我在 Jena 中创建了一个简单的本体。类似的东西:

public static void main(String[] args) {
OntModel m = ModelFactory.createOntologyModel(OntModelSpec.OWL_MEM);
...
OntClass gen1 = m.createClass(st + "Generation_1");
OntClass gen2 = m.createClass(st + "Generation_2");
...
ObjectProperty hasParent = m.createObjectProperty(st + "hasParent");
...
m.write(System.out);

try {
m.write(new FileWriter("C:/java/family1_RDF.owl"), "RDF/XML");
m.write(new FileWriter ("C:/java/family2_N3.owl"), "N3");
} catch (IOException e) {
    e.printStackTrace();
}

效果很好。我可以在我的应用程序中读取保存的本体并在 Protege 编辑器中打开它。

然后我在 Protege 中创建了简单的本体。将其保存在 RDF/XML 语法中。 我试图通过代码在我的应用程序中打开它:

OntModel base = ModelFactory.createOntologyModel(OntModelSpec.OWL_DL_MEM_RDFS_INF);
    try {
        base.read(new FileReader ("C:/java/asutp_class.owl"), "OWL/XML");
        } catch (IOException e) {
        e.printStackTrace();
        }
    base.write(System.out);

没有用。 Eclipse 给我发了很多错误:

线程“main”中的异常 org.apache.jena.riot.RiotException: [line: 271, col: 120] {E210} 非 ascii 字符的编码错误。 在 org.apache.jena.riot.system.ErrorHandlerFactory$ErrorHandlerStd.error(ErrorHandlerFactory.java:128) 在 org.apache.jena.riot.lang.LangRDFXML$ErrorHandlerBridge.error(LangRDFXML.java:246) 在 org.apache.jena.rdfxml.xmlinput.impl.ARPSaxErrorHandler.error(ARPSaxErrorHandler.java:37) 在 org.apache.jena.rdfxml.xmlinput.impl.XMLHandler.warning(XMLHandler.java:196) 在 org.apache.jena.rdfxml.xmlinput.impl.XMLHandler.warning(XMLHandler.java:173) 在 org.apache.jena.rdfxml.xmlinput.impl.XMLHandler.warning(XMLHandler.java:168) 在 org.apache.jena.rdfxml.xmlinput.impl.ParserSupport.warning(ParserSupport.java:207) 在 org.apache.jena.rdfxml.xmlinput.impl.ParserSupport.checkEncoding(ParserSupport.java:192) 在 org.apache.jena.rdfxml.xmlinput.impl.URIReference.resolve(URIReference.java:167) 在 org.apache.jena.rdfxml.xmlinput.states.WantDescription.startElement(WantDescription.java:63) 在 org.apache.jena.rdfxml.xmlinput.impl.XMLHandler.startElement(XMLHandler.java:111) 在 org.apache.xerces.parsers.AbstractSAXParser.startElement(未知来源) 在 org.apache.xerces.impl.XMLNamespaceBinder.handleStartElement(未知来源) 在 org.apache.xerces.impl.XMLNamespaceBinder.startElement(未知来源) 在 org.apache.xerces.impl.XMLDocumentFragmentScannerImpl.scanStartElement(未知来源) 在 org.apache.xerces.impl.XMLDocumentFragmentScannerImpl$FragmentContentDispatcher.dispatch(未知来源) 在 org.apache.xerces.impl.XMLDocumentFragmentScannerImpl.scanDocument(未知来源) 在 org.apache.xerces.parsers.DTDConfiguration.parse(未知来源) 在 org.apache.xerces.parsers.DTDConfiguration.parse(未知来源) 在 org.apache.xerces.parsers.XMLParser.parse(未知来源) 在 org.apache.xerces.parsers.AbstractSAXParser.parse(未知来源) 在 org.apache.jena.rdfxml.xmlinput.impl.RDFXMLParser.parse(RDFXMLParser.java:150) 在 org.apache.jena.rdfxml.xmlinput.impl.RDFXMLParser.parse(RDFXMLParser.java:134) 在 org.apache.jena.rdfxml.xmlinput.ARP.load(ARP.java:99) 在 org.apache.jena.riot.lang.LangRDFXML.parse(LangRDFXML.java:140) 在 org.apache.jena.riot.RDFParserRegistry$ReaderRIOTLang.read(RDFParserRegistry.java:187) 在 org.apache.jena.riot.RDFDataMgr.process(RDFDataMgr.java:873) 在 org.apache.jena.riot.RDFDataMgr.read(RDFDataMgr.java:288) 在 org.apache.jena.riot.RDFDataMgr.read(RDFDataMgr.java:273) 在 org.apache.jena.riot.adapters.RDFReaderRIOT.read(RDFReaderRIOT.java:62) 在 org.apache.jena.rdf.model.impl.ModelCom.read(ModelCom.java:245) 在 org.apache.jena.ontology.impl.OntModelImpl.read(OntModelImpl.java:2117) 在 asutp_lassification.main(asutp_lassification.java:14)

问题是什么?如何在我的 Jena 应用程序中打开 Protege 的本体?

非常感谢!

【问题讨论】:

  • 我尝试了不同的“OntModelSpec”
  • 我怀疑 Jena 是否可以读取 OWL/XML 格式的内容。您需要将 Protege 中的本体以 RDF 序列化格式(如 Turtle 或 RDF/XML)保存。也就是说,跟踪 确实 看起来像是在尝试读取 XML。消息说:“使用非 ASCII 字符编码错误。”里面有非 ASCII 字符吗?
  • 正如我所写 - 我试图以 RDF/XML 格式保存 - 同样的问题。寻找那个字符,但没有找到。在这里分享:drive.google.com/open?id=0B8XNVi6pdRrgLWhHT3p2aEdEaDQ
  • 我提到 owl/xml 是基于您的这部分代码:base.read(new FileReader ("C:/java/asutp_class.owl"), "OWL/XML");。这可能不是问题,但是如果你在那里使用 rdf/xml 有什么不同吗?
  • 对不起,我的错误。我尝试了不同的变体。发了最后一张。 RDF/XML 没有什么不同。谢谢!

标签: jena protege


【解决方案1】:

第 271 行有一个带有“#АСУ1”片段的 URI,当我查看字节时,它确实不是 ASCII(在 UTF-8 编码中它们是 d0 90 d0 a1 d0 a3)。

RDF/XML 是一个旧标准,需要 URI(严格来说是“RDF URI References”,这意味着 IRI 需要编码)。 Turtle 更擅长直接处理 IRI。

【讨论】:

  • 非常感谢!问题在于这些符号。我考虑了它们并通过 Protoge 从本体中删除了个人,但只将它们移到了“事物”类下。现在可以了,而且效果很好。我会考虑 Turtle。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2023-04-03
  • 2012-09-05
  • 1970-01-01
相关资源
最近更新 更多