【发布时间】:2016-12-07 21:13:11
【问题描述】:
我正在使用代理来抓取网站。我的代理服务器是带有 tinyproxy 的 Ubuntu 14.04。 使用 phantomjs,我使用相同的代理没有问题,但是使用常规 curl 我无法建立连接。我检查了 tinyproxy 日志,发现:
CONNECT Dec 07 23:47:43 [1139]: Connect (file descriptor 6): ec2-xx-xxx-xxx-xxx.eu-west-1.compute.amazonaws.com [xx.xxx.xx.xxx]
CONNECT Dec 07 23:47:43 [1139]: Request (file descriptor 6): CONNECT www.xxxxxxxx.com:443 HTTP/1.1
INFO Dec 07 23:47:43 [1139]: No upstream proxy for www.xxxxxxxx.com
ERROR Dec 07 23:49:50 [1139]: opensock: Could not establish a connection to www.xxxxxxxx.com
ERROR Dec 07 23:49:50 [1139]: Error reading readble client_fd 6
WARNING Dec 07 23:49:50 [1139]: Could not retrieve request entity
关于如何将 phantomjs 连接到同一网站的任何想法?
如何通过 https 连接使用 tinyproxy?
squid 是代理+https 的方式吗?
【问题讨论】: