【发布时间】:2013-02-04 08:56:20
【问题描述】:
我在公司网络上尝试用 Java 编写 JSoup 网络爬虫,但我似乎无法连接。
为了进行测试,当我运行以下代码时,它给了我一个 java.netConnectException: Connection denied。
Socket socket = null;
try {
socket = new Socket("google.com", 80)
System.out.println("it works!");
} finally {
if (socket != null) try { socket.close(); } catch(IOException e) {}
}
作为记录,我的 JSoup 代码如下所示:
Connection con = Jsoup.connect("http://en.wikipedia.org/wiki/Main_Page");
Document doc = con.get();
当我单独运行它时,它给了我一个 TimeOut 异常(即使在给它一个慷慨的超时之后)。我应该怎么做才能让它在我的网络中工作?
【问题讨论】:
-
你试过用谷歌搜索 JSoup 和代理吗?
-
让我们从头开始。您是否可以在计算机上直接访问 Internet 或使用公司网络代理?
-
不,端口 80 在公司环境中不会完全开放。在 Internet Explorer 中,转到工具 -> Internet 选项。左键单击连接选项卡。左键单击 LAN 设置按钮。在 LAN 设置对话框的底部,将是您需要放入 Java 代码的代理信息。
标签: java sockets web-scraping jsoup