【发布时间】:2015-02-09 01:31:04
【问题描述】:
作为一名体育迷,我希望获取由美国职业棒球大联盟网站生成的每日 XML 文件,并将它们导入 Access 或 MySQL 数据库。我遇到的问题是,他们生成的几乎每个 XML 文件都与上一个文件略有不同。例如,一个游戏文件可能有一个名为batter23 的字段位于event22 旁边,而另一个文件称为batter24 并位于pitcher25 旁边。我知道 XML 文件可能不一致,但我知道必须有一种方法可以始终如一地将数据输入数据库。有没有标准化这些 XML 文件?一些代码会解析列表中的每个文件,并将它们组织成特定的样式并为它们提供一致的字段名称?目前我首先将 XML 文件导入 Excel 工作表,在其中将文件类型更改为 CSV,但从那里字段名称和列位置仍然因文件而异。
我的目标是将所有文件放在一个结构中,以便我每天可以将它们快速导入数据库,而无需手动更改列位置或字段名称。我对任何和所有选择持开放态度,但我在大多数语言方面的经验充其量只是新手水平,所以请原谅我缺乏知识。
【问题讨论】:
-
您的 XML 样本对于给出一个好的答案是必要的。否则,这是一个基于意见的答案,这可能与 StackOverflow 无关。我建议将
perl和XML::Twig视为XML 解析的好选择。 (如果您可以提供 XML 示例和所需的输出,我可以为您举一个示例)。
标签: mysql xml database perl xml-parsing