【发布时间】:2016-03-30 17:53:12
【问题描述】:
file_get_contents() 在www.akaar.org 上返回正确的文件内容,但在www.ptsda.org 上不返回。
主要区别在于akaar.org是php项目,ptsda.org是html。
基本上我正在用 php 构建一个网络爬虫。当我成功爬过至少 150 多个网站时,它并没有爬过那个特定的网站。
【问题讨论】:
-
所以我知道他们的服务器有安全性。但是我现在有了一个想法,有没有办法保存文件并将其传递给我的 php 爬虫? :P
标签: php web-crawler file-get-contents