【发布时间】:2021-10-15 00:52:50
【问题描述】:
我有一个网站,我正在尝试使用请求和 BeautifulSoup 库从 HTML 中获取特定元素,但我很难找到匹配项。
代码是这样的:
from bs4 import BeautifulSoup
import requests
url = 'https://seekingalpha.com/symbol/AAPL/transcripts'
content = requests.get(url).content
soup = BeautifulSoup(content, "html.parser")
我试图从 Soup 对象中获取此特定标签 <div data-test-id="post-list"> 并尝试过:
soup.find_all('<div data-test-id="post-list">')
但是这会返回一个空列表[]。有人可以帮助我吗?
谢谢
【问题讨论】:
-
请参阅this question 希望对您有所帮助。
-
源码中没有
<div>s 带有data-test-id属性(可以在浏览器中查看-点击Ctrl+U)。您想获取什么信息? -
当使用
find_all函数时,你应该只使用元素类型。例如:soup.find_all('div')。当我尝试这个时,有一个 div 显示:<div class="noScriptTitle">Javascript is Disabled</div>。您需要一种方法来执行 Javascript 来构建 HTML。
标签: python web-scraping beautifulsoup python-requests