【发布时间】:2013-02-16 18:49:58
【问题描述】:
我有一个.ttl 格式的文件。它有 4 个属性/列,其中包含以下形式的四元组:
-
(id, student_name, student_address, student_phoneno)。 -
(id, faculty_name, faculty_address, faculty_phoneno)。
我知道如何使用 RDFLib 解析 .n3 表单三元组;
from rdflib import Graph
g = Graph()
g.parse("demo.nt", format="nt")
但我不确定如何解析这些四元组。
我的目的是解析和提取与特定 id 相关的所有信息。学生和教师的 id 可以相同。
如何使用 RDFLib 处理这些四元组并将其用于基于 id 的聚合?
来自.ttl 文件的示例 sn-p:
#@ <id1>
<Alice> <USA> <12345>
#@ <id1>
<Jane> <France> <78900>
【问题讨论】:
-
问题中引用的
ttl与标签引用的相同吗? -
@Abhijit 是的,你是对的。 Turtle-Terse RDF 三重语言
-
@KeiraShaw 为什么不只是正则表达式?
-
@SnakesandCoffee 谢谢,但我不明白如何使用正则表达式。 Id 的 id 格式为“#@
”。我是 python 新手。你能解释一下吗?感谢您的回复。
标签: python python-2.7 parsing turtle-rdf