【发布时间】:2020-01-25 09:59:42
【问题描述】:
我有一个关于网络爬虫的问题。 我想获得几个使用 Python 的评论页面。
这是我的网络爬虫代码。
URL = 'https://www.example.co.kr/users/sign_in'
user_agent = 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.117 Safari/537.36'
headers = {'Content-type': 'application/json', 'Accept': 'text/plain', 'User-Agent':user_agent}
login_data = {'user':{'email':'id', 'password':'password', 'remember_me':'true'}}
client = requests.session()
login_response = client.post(URL, json = login_data, headers = headers)
print(login_response.content.decode('utf-8'))
jre = 'https://www.example.co.kr/companies/reviews/ent?page=1'
index = client.get(jre)
html = index.content.decode('utf-8')
print(html)
此代码仅获取 page=1,但我想获取 page=1, page=2, page3 .... 使用格式方法。我怎样才能做到这一点?
【问题讨论】:
标签: python python-requests web-crawler