【发布时间】:2018-07-09 11:47:15
【问题描述】:
使用从 website 下载的数据转储 Freebase Triples (freebase-rdf-latest.gz),打开和读取此文件的最佳过程是什么为了提取信息,假设有关公司和企业的相关信息? (在 Python 中)
据我所知,有一些包可以完成这个目标:在python中打开gz文件并读取一个rdf文件,我不知道如何完成这个......
我在python 3.6 中的失败尝试:
import gzip
with gzip.open('freebase-rdf-latest.gz','r') as uncompressed_file:
for line in uncompressed_file.read():
print(line)
使用 xml 结构之后,我可以通过解析获取信息,但无法读取文件。
【问题讨论】:
-
您是否查看过用于 Python 的 RDF 库,例如 github.com/RDFLib/rdflib ?
标签: python parsing freebase gzip