【发布时间】:2020-10-24 19:55:44
【问题描述】:
我遇到的问题是我想从此页面获取相关链接:http://support.apple.com/kb/TS1538
如果我在 Chrome 或 Safari 中检查元素,我可以看到 <div id="outer_related_articles"> 和列出的所有文章。如果我尝试使用 BeautifulSoup 抓取它,它将抓取页面和所有除了相关文章。
这是我目前所拥有的:
import urllib2
from bs4 import BeautifulSoup
url = "http://support.apple.com/kb/TS1538"
response = urllib2.urlopen(url)
soup = BeautifulSoup(response.read())
print soup
【问题讨论】:
-
BeautifulSoup 只是一个解析器。我认为
urlopen更有可能是您的问题。您是否在尝试解析之前检查过是否确实包含了适当的元素?
标签: python html dynamic beautifulsoup