【发布时间】:2018-09-29 03:20:25
【问题描述】:
我目前正在使用 Beautiful Soup 尝试在网站上查找链接文本,然后提取链接。我正在使用以下代码:
source = requests.get('http://www.website').text
page = BeautifulSoup(source, 'lxml')
for article in page.find_all('article'):
for a in article.find_all('a', string=['something']) and article.find_all('a', string=['something']):
link = a['href']
print(link)
问题是,Beautiful Soup 只有在我有准确的链接文本时才能找到链接,这并不总是可能的。有没有办法通过链接文本的一部分来搜索链接?
【问题讨论】:
-
举个例子?
-
嗨。如果您觉得无聊,请阅读以下免费战利品之旅:stackoverflow.com/tour
标签: python parsing beautifulsoup