【发布时间】:2014-10-16 23:05:48
【问题描述】:
一个 ul 中有 3 个 li 元素。美丽的汤没有显示 li 元素中的文本。 3 li 元素包含一个机构的位置、电话号码和传真号码。
<ul>
<li class="spacer">
<span>
Location:
</span>
<br></br>
1500 S. 1st Avenue
<br></br>
Yuma, AZ 85364
</li>
<li class="spacer">
<span>
Phone Number:
</span>
<br></br>
928-373-4700
</li>
<li class="spacer">
<span>
Fax Number:
</span>
<br></br>
928-343-8864
</li>
我的脚本是:
import urllib2
from bs4 import BeautifulSoup
url = "http://www.policelocator.com/az/yuma-police-department/"
text = urllib2.urlopen(url).read()
soup = BeautifulSoup(text)
data = soup.findAll('li',attrs={'class':'spacer'})
print data[0]
输出是:
<li class="spacer"><span>Location:</span> </li>
我可以访问特定的 li 元素,但没有位置数据。由于某种原因,它被省略了。
任何帮助将不胜感激。
【问题讨论】:
标签: python beautifulsoup