【发布时间】:2015-04-30 14:15:26
【问题描述】:
如何转换我的输入值
是时候参加本周末的活动了。浏览并查看您周围正在发生的事件。玩得开心Ciao! LoudNProudLive 系列:“Hit Makers”特别版 LoudNProudLive 系列推出了一个“Hit Makers”特别版,其中包括头条新闻 Tolu(Project Fame)、Simi 和 Oyinkanade。日期:2015 年 4 月 30 日星期四时间:晚上 8 点地点:ELIAS(Ocean Bay Mall),[…]
转为 utf-8 格式的人类可读句子。我尝试了下面的代码,这就是我得到的。 -
周末活动时间到了。浏览并查看您周围正在发生的事件。玩得开心Ciao! LoudNProudLive 系列:“Hit Makers”特别版 LoudNProudLive 系列推出了一个“Hit Makers”特别版,其中有头条新闻 Tolu(Project Fame)、Simi 和 Oyinkanade。日期:2015 年 4 月 30 日星期四时间:晚上 8 点地点:ELIAS(Ocean Bay Mall),[…]
//convert html to utf-8
private static string cleanUpCodes(string value)
{
//convert from iso to utf-8
Encoding iso = Encoding.GetEncoding("windows-1252");
Encoding utf8 = Encoding.UTF8;
byte[] isoBytes = iso.GetBytes(value);
byte[] utf8Bytes = Encoding.Convert(utf8, iso, isoBytes);
string msg = utf8.GetString(utf8Bytes);
//convert to real html
msg = HttpUtility.HtmlDecode(msg);
return msg;
}
【问题讨论】:
-
如果源编码确实是windows-1252,那应该是对的。是什么让您认为源文档是 windows-1252 编码的呢?从外观上看,我猜它是 UTF-16LE,但最好只是找出它是什么。
标签: c# utf-8 iso-8859-1