【发布时间】:2020-01-03 22:19:53
【问题描述】:
我想用 Java(准确地说是 java 7)获取页面的内容。 当我使用浏览器进入该网站时,我得到的是关于 cookie、个性化广告等的模式/弹出窗口,当我使用例如:
URL url = new URL(v1.getUrl());
HttpURLConnection con = (HttpURLConnection) url.openConnection();
con.setRequestMethod("GET");
InputStream is = con.getInputStream();
我偶然发现在 Bash 中使用 cURL 我得到了该站点的“正确”输出。和
curl URL 我在没有这个模式的情况下得到响应。当我在 Java 代码中使用 curl 时,也会发生同样的事情:
ArticleExtractor.getInstance().getText(new InputStreamReader(new ProcessBuilder(("curl "+url).split(" ")).start().getInputStream())).
有没有办法不使用curl 并在Java 中获得相同的结果?
【问题讨论】:
标签: java curl get httprequest