【发布时间】:2020-10-05 10:19:13
【问题描述】:
感谢您在这里查看我的问题,我正在尝试从旧的 Reddit 博客页面获取下一页链接 但不知何故 find 方法返回我 None 对象,代码:
def crawl(self):
curr_page_url = self.start_url
curr_page = requests.get(curr_page_url)
bs = BeautifulSoup(curr_page.text,'lxml')
# all_links = GetAllLinks(self.start_url)
nxtlink = bs.find('a',attrs={'rel':'nofollow next'})['href']
print(nxtlink)
并且 HTML 页面链接是此页面上的 Old Reddit page link 我正在尝试获取下一页的链接 在一个跨度标签中:
<span class="next-button">
<a href="https://old.reddit.com/r/learnprogramming/?count=25&after=t3_j54ae2" rel="nofollow
next">next ›
</a>
</span>
【问题讨论】:
标签: python web web-scraping beautifulsoup