【发布时间】:2016-07-04 14:35:07
【问题描述】:
我的问题是在解析网站然后用 BS 加载数据树时。如何查找<em> 标签的内容?我试过了
for first in soup.find_all("li", class_="li-in"):
print first.select("em.fl.in-date").string
#or
print first.select("em.fl.in-date").contents
但它不起作用。请帮忙。
我正在 tutti.ch 上搜索汽车
这是我的全部代码:
#Crawl tutti.ch
import urllib
thisurl = "http://www.tutti.ch/stgallen/fahrzeuge/autos"
handle = urllib.urlopen(thisurl)
html_gunk = handle.read()
from bs4 import BeautifulSoup
soup = BeautifulSoup(html_gunk, 'html.parser')
for first in soup.find_all("li", class_="li-in"):
if first.a.string and "Audi" and "BMW" in first.a.string:
print "Geschafft: %s" % first.a.contents
print first.select("em.fl.in-date").string
else:
print first.a.contents
当它找到宝马或奥迪时,它应该检查汽车何时插入。时间位于这样的 em-Tag 中:
<em class="fl in-date">
Heute
<br></br>
13:59
</em>
【问题讨论】:
标签: python beautifulsoup