【发布时间】:2015-04-29 13:38:50
【问题描述】:
我正在下载带有波兰字符的 HTML 文件,并将其解析为字符串:
public static string HexToString(string hex)
{
var sb = new StringBuilder();
for (int i = 0; i < hex.Length; i += 2)
{
string hexdec = hex.Substring(i, 2);
int number = int.Parse(hexdec, NumberStyles.HexNumber);
char charToAdd = (char)number;
sb.Append(charToAdd);
}
return sb.ToString();
}
所以当我找到 %21 时,我将 21 发送到 HexToString() 并作为回报!,这没关系,但 char ą 表示为 %C4%85 (Ä),我想得到 ą char
【问题讨论】:
-
这里有问题。 0xC4 不是 UTF8 中的有效字符,在波兰语代码页 (852) 中是
─。代码页 852 中ą的代码是 0xA5 -
你说得对,ą char 发送为 %C4%85,而不仅仅是 %C4