【发布时间】:2020-08-07 20:31:50
【问题描述】:
所以我真的不希望这个问题是特定于语言的,但是我怀疑 Go(我的语言选择)在这里发挥了作用。
我试图在原始电子邮件的正文中找到一个字符串。为此,我得到了编码,大多数情况是quoted-printable。
好的,那很好,我正在编码我的搜索查询引用可打印,然后搜索它。这样可行。
然而。在一种特定情况下,我在 gmail 中看到的原始电子邮件看起来不错,但是当我从 gmail API 检索原始电子邮件时,尽管编码和一切都是相同的,但它会将 " 编码为 =22
研究告诉我那是因为字符集是utf-8。
我还没有完全弄清楚那是编码 utf-8 然后引用打印或其他方式,但这也不是问题......
如果我查看" 为=22 的电子邮件,我看到字符集为utf-8,而当我查看另一个未编码的电子邮件时,字符集为UTF-8(注意大小写)。我不敢相信这里的情况是导致这种情况发生的原因,但如果=22 实际上是=22 还是" 编码的utf-8,这似乎不是一个足够强大的方法。
我最初的想法是始终解码引用的可打印内容,然后在进行搜索之前对其进行重新编码,但我认为这不会是一种可靠的方法,并且认为其他人可能会有更好的建议?
结论,我正在尝试在原始电子邮件中查找字符串,但编码导致我无法让搜索字符串与正文的编码匹配
【问题讨论】:
标签: email encoding utf-8 mime quoted-printable