【发布时间】:2019-08-08 07:29:27
【问题描述】:
我想使用 Beautiful Soup 和 requests 抓取网站的数据,到目前为止,我已经得到了我想要的数据,但现在我想过滤它:
from bs4 import BeautifulSoup
import requests
url = "website.com"
keyword = "22222"
r = requests.get(url)
data = r.text
soup = BeautifulSoup(data, 'lxml')
for article in soup.find_all('a'):
for a in article:
if article.has_attr('data-variant-code'):
print(article.get("data-variant-code"))
假设这会打印以下内容: 11111 22222 33333
我怎样才能过滤这个,让它只返回“22222”?
【问题讨论】:
-
您的问题有点模棱两可,因此两个完全不同的答案都是正确的。
标签: python beautifulsoup python-requests screen-scraping