【发布时间】:2012-08-12 01:52:20
【问题描述】:
我正在尝试使用stringWithContentsOfURL:encoding:error: 使用NSUTF8StringEncoding 获取网页的内容。问题是网页的 utf-8 字节无效,因此该方法返回 nil。我将如何处理无效的 utf-8 字节?
我尝试过的事情。
- 尝试使用
NSString.h和CFStringEncodingExt.h中的每个编码 -
使用 NSISOLatin1StringEncoding,然后删除无效字节然后做
[NSString stringWithCString:[str cStringUsingEncoding:NSISOLatin1StringEncoding] encoding:NSUTF8StringEncoding]; stringWithContentsOfURL:usedEncoding:error:导致日文 Unicode 字符乱码。
我正在使用的网页http://vgmdb.net/album/32234
使用iconv 无效的字符似乎是十六进制的EF BF BD
`iconv -c -f UTF8 -t UTF8 32234.html`
【问题讨论】:
标签: cocoa url unicode encoding nsstring