【发布时间】:2012-09-28 05:34:31
【问题描述】:
我正在尝试使用 file_get_contents 解析 http://www.desi-tashan.com/category/pakistan-tvs/aaj-tv/3-idiots/。
但它会返回非常不寻常的字符和符号。
好像我解析 http://www.desi-tashan.com/ 它工作得很好。有人能说出为什么会这样吗?
是否涉及任何编码解码?
页面好像是用wordpress做的..
【问题讨论】:
-
我在谷歌上找到了这个(oooff.com/php-scripts/basic-php-scraped-data-parsing/…),它可能会有所帮助
-
该页面没有提供太多关于编码或 wordpress 相关的解析...
-
符号可能是二进制图像
-
当我看不到 html 代码时如何抓取或解析链接?有什么技巧吗?