【发布时间】:2013-02-28 02:58:23
【问题描述】:
我需要解析 40GB 大小的 XML 文件,然后进行规范化,然后插入到 MySQL 数据库中。我不清楚需要在数据库中存储多少文件,也不知道 XML 结构。
我应该使用哪个解析器,你会怎么做?
【问题讨论】:
-
对于大文件,总是使用像 XMLReader 这样的拉解析器;只需尝试将 40GB 的文件加载到 SimpleXML 的内存中。
-
40 Gb?哇,我在 mac os x 机器上处理 700 Mb xml 文件时遇到了麻烦。
-
我建议您编写自己的 XML 解析器,具有最少的功能(只有您想要的功能)。这样您就拥有了最轻量级的 XML 解析器,当然还会定期进行优化
-
@Girish - 这是一个疯狂的建议。地球上一些最优秀的程序员已经编写了高度优化的 XML 解析器,普通的 SO 发帖人能够做得更好的机会非常小。
标签: php mysql xml xml-parsing large-files