【发布时间】:2022-01-12 20:47:12
【问题描述】:
我正在对一个名为:CVE Trends 的网页进行网页抓取
import bs4, requests,webbrowser
LINK = "https://cvetrends.com/"
PRE_LINK = "https://nvd.nist.gov/"
response = requests.get(LINK)
response.raise_for_status()
soup=bs4.BeautifulSoup(response.text,'html.parser')
div_tweets=soup.find('div',class_='tweet_text')
a_tweets=div_tweets.find_all('a')
link_tweets =[]
for a_tweet in a_tweets:
link_tweet= str(a_tweet.get('href'))
if PRE_LINK in link_tweet:
link_tweets.append(link_tweet)
from pprint import pprint
pprint(link_tweets)
这是我迄今为止编写的代码。我尝试了很多方法,但它总是给出同样的错误:
“NoneType”对象没有“find_all”属性
有人可以帮帮我吗?我真的需要这个。 提前感谢您的任何回答。
【问题讨论】:
-
显然
soup.find(...)返回无 -
感谢您的回答,我已尝试打印它并在输出中给出“无”。我也尝试过更改标签类,但错误总是一样。
-
看看
response.content好像这不是你假设的html。
标签: python web web-scraping nonetype