【问题标题】:How to Decode "=?utf-8?B?...?=" to string in C#如何在 C# 中将“=?utf-8?B?...?=”解码为字符串
【发布时间】:2012-06-05 10:15:24
【问题描述】:

我使用 Visual Studio 2010、C# 来使用 IMAP 读取 Gmail 收件箱,它很有魅力,但我认为 Unicode 不完全受支持,因为我无法轻松获取波斯语(波斯语)字符串。

例如,我有我的字符串:سلام,但IMAP 给了我:"=?utf-8?B?2LPZhNin2YU=?="

如何将其转换为原始字符串?将 utf-8 转换为字符串的任何提示?

【问题讨论】:

  • 您对 UTF-8 并不真正感兴趣 - 您对可以处理引用的可打印的东西感兴趣...
  • @JonSkeet:它是 Base64 (B),不是引用可打印 (Q)。
  • 投票重新开放。 Base64 与 Quoted-Printable 相同。
  • @HenkHolterman:哪一个?最初包含在答案 (stackoverflow.com/questions/2226554) 中的副本是关于 QP 的(尽管那里的答案可能也适用于 B64,但这不是作为 dup 关闭的原因),并且在cmets (stackoverflow.com/questions/454833) 不关心解码字符串。

标签: c# string unicode utf-8


【解决方案1】:

我们来看看MIME编码的含义:

=?utf-8?B?...something...?=
    ^   ^
    |   +--- The bytes are Base64 encoded
    |
    +---- The string is UTF-8 encoded

因此,要对此进行解码,请将...something... 从您的字符串中取出(在您的情况下为2LPZhNin2YU=),然后

  1. 反转 Base64 编码

    var bytes = Convert.FromBase64String("2LPZhNin2YU=");
    
  2. 将字节解释为 UTF8 字符串

    var text = Encoding.UTF8.GetString(bytes);
    

text 现在应该包含所需的结果。


这种格式的描述可以在维基百科中找到:

【讨论】:

  • 谢谢,效果很好!所以你的意思是=?UTF-8?B?最后一个 ?= 是 utf-8 转义,应该被删除?
  • @Ali_dotNet:是的,它们是 MIME 转义,应该被删除。
【解决方案2】:

您拥有的是一个 MIME 编码的字符串。 .NET 不包含用于 MIME 解码的库,但您可以实现此 yourself 或使用 library

【讨论】:

    【解决方案3】:

    他来了

        public static string Decode(string s)
        {
            return String.Join("", Regex.Matches(s ?? "", @"(?:=\?)([^\?]+)(?:\?B\?)([^\?]*)(?:\?=)").Cast<Match>().Select(m =>
            {
                string charset = m.Groups[1].Value;
                string data = m.Groups[2].Value;
                byte[] b = Convert.FromBase64String(data);
                return Encoding.GetEncoding(charset).GetString(b);
            }));
        }
    

    【讨论】:

      【解决方案4】:

      以下方法将“=?utf-8?B?...”或“=?utf-8?Q?...”等字符串解码为普通字符串。编码(如“utf-8”)是自动选择的。不使用正则表达式。 C#

      public static string DecodeQuotedPrintables(string InputText)
          {
              var ResultChars = new List<char>();
              Encoding encoding;
              for (int i= 0; i < InputText.Length; i++)
              {
                  var CurrentChar = InputText[i];
                  switch (CurrentChar)
                  {
                      case '=':
                          if((i + 1) < InputText.Length && InputText[i+1] == '?')
                          {
                              // Encoding
                              i += 2;
                              int StIndex = InputText.IndexOf('?', i);
                              int SubStringLength = StIndex - i;
                              string encodingName = InputText.Substring(i, SubStringLength);
                              encoding = Encoding.GetEncoding(encodingName);
                              i += SubStringLength + 1;
      
                              //Subencoding
                              StIndex = InputText.IndexOf('?', i);
                              SubStringLength = StIndex - i;
                              string SubEncoding = InputText.Substring(i, SubStringLength);
                              i += SubStringLength + 1;
      
                              //Text message
                              StIndex = InputText.IndexOf("?=", i);
                              SubStringLength = StIndex - i;
                              string Message = InputText.Substring(i, SubStringLength);
                              i += SubStringLength + 1;
      
                              // encoding
                              switch (SubEncoding)
                              {
                                  case "B":
                                      var base64EncodedBytes = Convert.FromBase64String(Message);
                                      ResultChars.AddRange(encoding.GetString(base64EncodedBytes).ToCharArray());
      
                                      // skip space #1
                                      if ((i + 1) < InputText.Length && InputText[i + 1] == ' ')
                                      {
                                          i++;
                                      }
                                      break;
      
                                  case "Q":
                                      var CharByteList = new List<byte>();
                                      for (int j = 0; j < Message.Length; j++)
                                      {
                                          var QChar = Message[j];
                                          switch (QChar)
                                          {
                                              case '=':
                                                  j++;
                                                  string HexString = Message.Substring(j, 2);
                                                  byte CharByte = Convert.ToByte(HexString, 16);
                                                  CharByteList.Add(CharByte);
                                                  j += 1;
                                                  break;
      
                                              default:
                                                  // Decode charbytes #1
                                                  if (CharByteList.Count > 0)
                                                  {   
                                                      var CharString = encoding.GetString(CharByteList.ToArray());
                                                      ResultChars.AddRange(CharString.ToCharArray());
                                                      CharByteList.Clear();
                                                  }
      
                                                  ResultChars.Add(QChar);
                                                  break;
                                          }
                                      }
      
                                      // Decode charbytes #2
                                      if (CharByteList.Count > 0)
                                      {
                                          var CharString = encoding.GetString(CharByteList.ToArray());
                                          ResultChars.AddRange(CharString.ToCharArray());
                                          CharByteList.Clear();
                                      }
                                      
                                      // skip space #2
                                      if ((i + 1) < InputText.Length && InputText[i + 1] == ' ')
                                      {
                                          i++;
                                      }
                                      break;
      
                                  default:
                                      throw new NotSupportedException($"Decode quoted printables: unsupported subencodeing: '{SubEncoding}'");
                              }
                          }
                          else
                              ResultChars.Add(CurrentChar);
                          break;
      
                      default:
                          ResultChars.Add(CurrentChar);
                          break;
                  }
              }
      
              return new string(ResultChars.ToArray());
          }
      

      【讨论】:

        猜你喜欢
        • 2019-09-15
        • 1970-01-01
        • 2016-01-11
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2020-04-07
        • 2016-12-08
        • 2012-10-18
        相关资源
        最近更新 更多