【发布时间】:2019-10-03 10:06:34
【问题描述】:
我想获取网页的 html 内容。我不确定如何定义搜索字段, 我尝试了以下方法。
from fake_useragent import UserAgent
import requests
ua = UserAgent()
print(ua.chrome)
header = {'User-Agent': str(ua.chrome)}
print(header)
body = {'Search': '1.1.1.1'}
url = "https://randr.nist.gov/enzyme/Default.aspx"
htmlContent = requests.get(url, data=body)
print(htmlContent.text)
有人可以建议如何定义正确的搜索字段吗?
【问题讨论】:
-
搜索看起来是事件驱动的 java 脚本/ajax 样式更新到页面,所以你需要使用可以处理 JS 事件的东西,比如 selenium
标签: python web-scraping python-requests