【发布时间】:2010-10-10 14:54:55
【问题描述】:
这肯定是一件容易的事,但它真的让我很烦。
我有一个在网页中读取并使用Beautiful Soup 解析它的脚本。我从 soup 中提取所有链接,因为我的最终目标是打印出 link.contents。
我正在解析的所有文本都是 ASCII。我知道 Python 将字符串视为 unicode,我相信这非常方便,只是在我的小脚本中没有用。
每次我打印出一个包含“字符串”的变量时,我都会在屏幕上打印出[u'String']。有没有一种简单的方法可以将其恢复为 ascii 或者我应该编写一个正则表达式来剥离它?
【问题讨论】:
-
可能重复的措辞更清晰的问题(和答案):stackoverflow.com/q/2464959/1390788
-
这能回答你的问题吗? What's the u prefix in a Python string?