【问题标题】:Having trouble reading the text/html message part阅读 text/html 消息部分时遇到问题
【发布时间】:2014-08-19 08:00:24
【问题描述】:

我正在尝试使用 .Net 提取电子邮件的主题和正文。除了 text/html MessagePart 之外,似乎一切正常。我不确定编码等 - 有人能正常工作吗?尝试转换时对我来说会出错。

这是 text/html 正文数据的原始字符串

"PGRpdiBkaXI9Imx0ciI-dGV4dCBpbiBoZXJlPGJyPjwvZGl2Pg0K"

这会引发错误。

“输入不是有效的 Base-64 字符串,因为它包含非 base 64 字符、两个以上的填充字符或填充字符中的非法字符。”

代码如下:

    UsersResource.MessagesResource.GetRequest gr = gs.Users.Messages.Get(userEmail, TextBox1.Text);
    gr.Format = UsersResource.MessagesResource.GetRequest.FormatEnum.Full;                
    Message m = gr.Execute();

            foreach (MessagePart p in m.Payload.Parts)
            {
                if (p.MimeType == "text/html")
                {
                    try
                    {
                        byte[] data = Convert.FromBase64String(p.Body.Data);
                        string decodedString = Encoding.UTF8.GetString(data);
                        Response.Write(decodedString);
                    }
                    catch (Exception ex) { }
                }
            }

我的解码错误???

感谢您的帮助。

【问题讨论】:

  • 和我一样的问题 - 只是为了让你知道你并不孤单!
  • 很高兴听到 - 我尝试了多种方法,结果相同。尝试解析到我的 MIME 解析器时,整个原始消息也有同样的问题。

标签: gmail-api


【解决方案1】:

正文数据似乎是 base64url 编码的,而不是 base64 编码的。 不同之处在于在编码的 64 个字符的字母表中使用 - 和 _,而不是 + 和 /。 一种解决方案是在调用 FromBase64String 之前将所有 - 和 _ 字符分别替换为 + 和 /。

https://www.rfc-editor.org/rfc/rfc4648#section-5

【讨论】:

  • 你也想做这样的事情(来自不同的问题):encoded = b64.replace(/_/g, '/').replace(/-/g,'+'); atob( unescape( encodeURIComponent( encoded ) ) );
【解决方案2】:

这是我最终使用的代码:

                foreach (MessagePart p in m.Payload.Parts)
                {
                    if (p.MimeType == "text/html")
                    {
                         byte[] data = FromBase64ForUrlString(p.Body.Data);
                         string decodedString = Encoding.UTF8.GetString(data);
                         Response.Write(decodedString);                            
                    }
                }

....

    public static byte[] FromBase64ForUrlString(string base64ForUrlInput)
    {
        int padChars = (base64ForUrlInput.Length % 4) == 0 ? 0 : (4 - (base64ForUrlInput.Length % 4));
        StringBuilder result = new StringBuilder(base64ForUrlInput, base64ForUrlInput.Length + padChars);
        result.Append(String.Empty.PadRight(padChars, '='));
        result.Replace('-', '+');
        result.Replace('_', '/');
        return Convert.FromBase64String(result.ToString());
    }

好文章http://www.codeproject.com/Tips/76650/Base-base-url-base-url-and-z-base-encoding

【讨论】:

    【解决方案3】:

    在这个页面https://developers.google.com/gmail/api/v1/reference/users/messages/attachments/get

    你会发现有一个 .NET 示例,其中包含此代码用于解码:

    // Converting from RFC 4648 base64-encoding
    // see http://en.wikipedia.org/wiki/Base64#Implementations_and_history
    String attachData = attachPart.Data.Replace('-', '+');
    attachData = attachData.Replace('_', '/');
    byte[] data = Convert.FromBase64String(attachData);
    

    【讨论】:

      【解决方案4】:

      Microsoft.AspNetCore.WebUtilities 程序集中的 WebEncoders.Base64UrlDecode 方法现在可以解码:

      var bytes = WebEncoders.Base64UrlDecode(data);
      

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 1970-01-01
        • 2012-12-07
        • 1970-01-01
        • 1970-01-01
        • 2020-09-07
        • 2015-04-19
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多