【发布时间】:2014-12-19 22:15:06
【问题描述】:
我的 Curl 代码有效:
$ch = curl_init();
$header = array(
'Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
'Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7',
'Accept-Language: en-us;q=0.8,en;q=0.6'
);
$options = array(
CURLOPT_URL => $url,
CURLOPT_HEADER => 0,
CURLOPT_RETURNTRANSFER => 1,
CURLOPT_USERAGENT => 'Mozilla/5.0 (Windows; U; Windows NT 6.1; en; rv:1.9.2.13) Gecko/20101203 Firefox/3.6.13',
CURLOPT_HTTPHEADER => $header
);
curl_setopt_array($ch, $options);
$str = curl_exec($ch);
curl_close($ch);
但是只有从一页开始,我才能看到这样的迹象:
‹��������í}ëvâH²îïîµö;dk¦}™² ...
我用 mb_detect_encoding 检测到它是一个 utf8 字符串。我很困惑,为什么我不能像从其他网站一样阅读源代码?
我要卷曲的网站是http://stores.ebay.com/artlines-2012
谢谢。
【问题讨论】:
-
可能是压缩后的输出。
标签: php curl character-encoding decode