【发布时间】:2019-10-04 08:14:00
【问题描述】:
我正在尝试使用python根据内部链接从维基百科页面中抓取子内容,问题是从页面中抓取所有内容,如何只抓取内部链接段落,提前谢谢
base_link='https://ar.wikipedia.org/wiki/%D8%A7%D9%84%D8%AA%D9%87%D8%A7%D8%A8_%D8%A7%D9%84%D9%82%D8%B5%D8%A8%D8%A7%D8%AA'
sub_link="#الأسباب"
total=base_link+sub_link
r=requests.get(total)
soup = bs(r.text, 'html.parser')
results=soup.find('p')
print(results)
【问题讨论】:
-
能否请您检查一下使用
base_link两次的总变量。sublink也应该是sub_link。
标签: python beautifulsoup wikipedia