【发布时间】:2012-06-26 21:42:11
【问题描述】:
我正在研究如何抓取信息。我对http客户端与jsoup的关系有点困惑。使用jsoup需要http客户端,还是jsoup可以代替http客户端?如果你还需要http客户端,它执行了哪些jsoup无法单独完成的功能?
【问题讨论】:
标签: jsoup apache-commons-httpclient
我正在研究如何抓取信息。我对http客户端与jsoup的关系有点困惑。使用jsoup需要http客户端,还是jsoup可以代替http客户端?如果你还需要http客户端,它执行了哪些jsoup无法单独完成的功能?
【问题讨论】:
标签: jsoup apache-commons-httpclient
使用jsoup需要http客户端吗
没有。 Jsoup 可以完全独立使用。它没有任何依赖项(当然Java SE除外)。
或者jsoup可以代替http客户端吗?
没有。它们是用途完全不同的工具。
如果你还需要http客户端,它执行了哪些jsoup无法单独完成的功能?
发送 HTTP 请求的更高级和更方便的方式。比如自动cookie(会话)管理、发送multipart/form-data请求(上传文件)等等。
如果您只需要发送一个 GET 请求并且与会话管理无关,那么 Jsoup 可以毫不费力地为您完成这项工作。但是如果登录和会话管理是强制性的,那么您需要在每个 Jsoup 请求期间手动复制 cookie。这可能会导致一些样板代码。使用 HttpClient 处理 HTTP 请求,然后通过 Jsoup 传递其响应就更容易了。
【讨论】: