来自 FlickrApi 的 XML“格式不正确（无效令牌）”错误答案

【问题标题】：XML "not well-formed (invalid token)" error from FlickrApi来自 FlickrApi 的 XML“格式不正确（无效令牌）”错误
【发布时间】：2011-04-28 13:44:31
【问题描述】：

首先：我使用的是众所周知的（我想是经过测试的）flickrapi。我正在测试 flickr 照片与我的项目的同步，一切正常，直到我找到一些特定的文件。然后 python 的 xml 解析器无法将 xml 解析为字符串（以及来自主题的错误）。调试在 xml 中给了我行和列，所以我将它导出到一个文件：

    <exif tagspace="IFD0" tagspaceid="0" tag="Copyright" label="Copyright">
        <raw>Â©Etienne-Follet.com</raw>
        <clean>©Etienne-Follet.com</clean>
    </exif>

错误位于<clean>©Etienne-Follet 列中的<clean错误>©...。任何人都可以在这条线上看到任何奇怪的东西吗？更重要的是，这个集合/作者的每一张照片都崩溃了。也许它与特殊字符有某种联系？这是无法解析的样本集的链接：

http://www.flickr.com/photos/rte-france/sets/72157623592737564/

【问题讨论】：

标签： python xml xml-parsing flickr

【解决方案1】：

无法解决：http://bitbucket.org/sybren/flickrapi/issue/11/encoding-issues。看起来这是 flickr 的附带问题，他们不会很快解决。

【讨论】：

【解决方案2】：

我想你必须用 UTF-8 编码所有东西，所以请确保它是这样的。

【讨论】：