【发布时间】:2011-04-28 13:44:31
【问题描述】:
首先:我使用的是众所周知的(我想是经过测试的)flickrapi。我正在测试 flickr 照片与我的项目的同步,一切正常,直到我找到一些特定的文件。然后 python 的 xml 解析器无法将 xml 解析为字符串(以及来自主题的错误)。调试在 xml 中给了我行和列,所以我将它导出到一个文件:
<exif tagspace="IFD0" tagspaceid="0" tag="Copyright" label="Copyright">
<raw>©Etienne-Follet.com</raw>
<clean>©Etienne-Follet.com</clean>
</exif>
错误位于<clean>©Etienne-Follet 列中的<clean错误>©...。任何人都可以在这条线上看到任何奇怪的东西吗?更重要的是,这个集合/作者的每一张照片都崩溃了。也许它与特殊字符有某种联系?这是无法解析的样本集的链接:
http://www.flickr.com/photos/rte-france/sets/72157623592737564/
【问题讨论】:
标签: python xml xml-parsing flickr