【发布时间】:2016-03-02 10:12:48
【问题描述】:
我已经从https://developers.google.com/freebase/data?hl=en 下载了 Freebase 转储,
我知道转储的格式是<subject> <predicate> <object>,但我对文件的关系感到困惑。现在,我有两个问题:
如果我想提取Freebase的电子产品子集,其中包括
/produced by,/product type等一些主要属性。例如:在子集中一条iPhone的记录包含iPhone的设计公司,世代等我尝试用cygwin解压,zgrep脚本怎么写?如果我获得了 *.gz 格式的这个子集,我如何在 windows 环境中使用 SPARQL 或其他高效的编码语言查询指定的主题?例如:查询iPhone关于设计公司的信息。我知道即使子集是一个很大的 RDF 文件,我可以实现它吗?
我真的需要有人告诉我是否可以做到,谢谢。
【问题讨论】: