【发布时间】:2016-04-26 09:02:11
【问题描述】:
我想查询以下站点并将所有结果保存到 csv 文件中:
http://services2.hdb.gov.sg/webapp/BB33RTIS/BB33SSearchWidget
我已经有一个程序(它是由以前的程序员编写的,我正在尝试理解代码,因为我是 jsoup 和网络爬虫的初学者),但现在网站已更新,查询不再有效.我想我需要更新网址。下面是我目前使用的 url 字符串:
private final static String URL = "http://services2.hdb.gov.sg/webapp/BB33RTIS/BB33SSearchWidget?"
+ "client=default"
+ "&proxystylesheet=default"
+ "&output=xml_no_dtd"
+ "&Process=continue"
+ "&FLAT_TYPE=%s"
+ "&NME_NEWTOWN=%s"
+ "&NME_STREET="
+ "&NUM_BLK_FROM="
+ "&NUM_BLK_TO="
+ "&AMT_RESALE_PRICE_FROM="
+ "&AMT_RESALE_PRICE_TO="
+ "&DTE_APPROVAL_FROM=%s"
+ "&DTE_APPROVAL_TO=%s";
我是这样连接的:
Document doc = Jsoup.connect(url).get();
我想更新它以使用新的 URL。我检查了页面源,但找不到它。谁能帮我找到我需要在这里传递的 URL。
【问题讨论】:
-
你知道当前的url是什么吗?您是在问如何实现文档的更新或如何更改此 url?
-
我已包含当前 URL。我在问如何更改网址。谢谢。
标签: java web-crawler jsoup