【发布时间】:2014-07-24 12:19:11
【问题描述】:
我正在尝试使用 feedparser 模块解析来自 RSS 提要的数据。
import feedparser
def main():
try:
rss = feedparser.parse('http://s.stooq.pl/rss/n.rss')
print(rss.entries[0].title)
except Exception as e:
print(str(e))
main()
这给了我以下输出:
'ascii' 编解码器无法对位置 55 中的字符 '\xf3' 进行编码:序数不在范围内 (128)
我尝试将编码更改为 UTF-8,但结果如下:
b'Zostaniemy obs\xc5\x82u\xc5\xbceni w ka\xc5\xbcdym urz\xc4\x99dzie skarbowym' 所以这似乎是字节文字。
我应该如何处理这个字符串才能正确显示它?
【问题讨论】:
标签: python encoding rss feedparser