【发布时间】:2016-07-17 08:57:25
【问题描述】:
这是我第一次尝试抓取。我想使用一个带有搜索功能的网站。
当我进行搜索时,搜索详细信息未显示在网站 url 中。当我检查元素并查看“网络”选项卡时,请求 URL 保持不变 (method:post),但当我查看底部时,Form Data 部分,我点击查看源代码,并以 url 形式显示我的搜索详细信息。
我的问题是:
如果请求 url = http://somewebsite.com/search
表单数据源 = startDate=09.07.2016&endDate=10.07.2016
如何连接两者以提取数据以进行抓取?我是新手,所以如果我要解决这个问题,请告诉我。
谢谢!
【问题讨论】:
-
我相信您会发现主要搜索引擎已经积极地让您尝试做的事情比过去几年更具挑战性。但是,它们确实提供 API 来允许搜索。这些通常需要您订阅并支付一定级别的 API 访问权限。如果您确实选择坚持尝试抓取,请准备好很快接受验证码的挑战。
标签: php python web-scraping