【发布时间】:2021-08-26 07:30:18
【问题描述】:
我需要从通过向下滚动加载数据的网站抓取数据。 网站向下滚动前返回5条数据,预计向下滚动后返回80条数据。 我正在使用 requests_html 模块并尝试过这个
from requests_html import HTML, HTMLSession
keyword = '유산균'
n = 1
url = f'https://search.shopping.naver.com/search/all?frm=NVSHATC&origQuery={keyword}&pagingIndex={n}&pagingSize=80&productSet=total&query={keyword}&sort=rel×tamp=&viewType=list'
session = HTMLSession()
ses = session.get(url)
html = HTML(html=ses.text)
item_list = html.find('div.basicList_title__3P9Q7')
print(len(item_list))
ses.html.render(scrolldown=100, sleep=.1)
'''
ses.html.render(script="window.scrollTo(0, 99999)", sleep= 10)
also tried not worked either
'''
print(len(item_list))
我预计结果是 5, 80,但两个打印都返回了相同的结果。 5 和 5。
我的代码有什么问题?
【问题讨论】:
-
网站是什么?我们无法重现该问题。
-
@RJAdriaansen 我编辑了代码!
-
你必须在向下滚动命令后再次调用
item_list = html.find('div.basicList_title__3P9Q7')
标签: python python-requests-html