【发布时间】:2012-11-03 14:09:56
【问题描述】:
我想编写一个正则表达式来过滤掉通过 imaplib 和下面我的 Python 脚本中的电子邮件模块拉入的电子邮件中的所有垃圾。我认为正则表达式是最好的,但随时提出更好的解决方案。知道为什么电子邮件文本在下面的单词 be=tter 中有等号吗?原始电子邮件将其标记为 better。
Python sn-p:
emailMessage = email.message_from_string
print emailMessage.get_payload():
打印文本:
>=20
> >>>>
> >>>> Hope this makes it through you spam filter but couldn't think of a be=
tter subject.
> >>>>
【问题讨论】:
-
你真的不想“过滤掉”
=20。它是编码的一部分,称为“quoted-printable”。你想解码它。
标签: python regex encoding mime