【发布时间】:2013-09-20 02:26:06
【问题描述】:
如何使用 PHP 解析 88 GB 的 RDF 文件?
这个 RDF 充满了实体和关于每个实体的事实。
我正在尝试遍历每个实体并检查每个实体的某些事实。然后将这些事实写入我之前在脚本中创建的 XML 文档。
所以当我浏览 rdf 时,我为每个实体创建一个 <card></card> 元素并给它一个名为 <facts> 的子元素。我遍历了实体上的所有事实,然后将我需要的事实写在里面,并作为<facts></facts> 中的<fact></fact> 元素子项。
如何解析 rdf、提取数据并将其写入 XML?
【问题讨论】:
-
在处理大文件时使用expat based event driven parser 非常幸运。在那里将事件处理程序设置为输出到目标 xml 数据应该很简单。根据 rdf 的图表,在阅读文档时将其推送到数据库中然后在写入时选择返回的事实可能是有意义的。
-
@Orangepill 我宁愿不使用数据库。我知道你说这是微不足道的,但在这方面我觉得我是 5 岁。您能否发布一个答案,说明如何选择该答案。
-
从您的 rdf 文件中发布一个 sn-p。
-
@Orangepill 感谢您的帮助。这是前几行:i.imgur.com/k1nBSEn.png 我不知道这是否有帮助。数据可供下载,压缩后要小得多:developers.google.com/freebase/data 非常感谢您提前!
-
@Orangepill 如果我不耐烦,我很抱歉。如果您能告诉我您是否可以帮助我或不打算帮助我,我将不胜感激。我在问题中添加了赏金。
标签: php rdf freebase large-data