【发布时间】:2019-06-19 16:27:55
【问题描述】:
我尝试按下的按钮如下所示:
<a data-hide="#mvc-paginate-acf46b3a1b68090c" data-append="true" data-container="#posts-container" class="hubmvc-ajax-get mvc-more btn btn-skel-generic" href="https://example.com/linear-box-load-more/?load_more=1&pg=2&limit=36&offset=14&additional_class=gems&ajax_hook=next_page&_wpnonce=8762751649&start_pg=1">View More</a>
在使用 BeautifulSoup 进行抓取之前,我尝试多次按下它。我尝试使用来自selenium 的webdriver,但显然根据这个答案不再支持它:Scrape page with "load more results" button
【问题讨论】:
-
网站是什么?您可能最好使用请求。硒只能作为最后的手段。
-
这些类名中是否有此按钮独有的?如果是这样,您可以使用
driver.find_element_by_class_name("mvc-more")(或任何唯一的类名) -
@antfuentes87 我相信使用基于其他答案的请求无法点击上述按钮中的 ajax
-
什么?这种说法没有任何意义?如果你能提供这个网站,我可以给你写一个我所说的例子。
-
@antfuentes87 我要抓取的网站是:newsnetwork.mayoclinic.org/secondary-archive,我要按的按钮是
view more
标签: python web-scraping