【发布时间】:2015-10-11 13:42:54
【问题描述】:
我正在尝试从该网站上抓取目录信息。 'http://www.virginiaequestrian.com/main.cfm?action=greenpages&sub=view&ID=10478'
但我不知道如何选择不同的文本行,因为它们唯一的标签是换行元素(
)。有没有办法可以通过文本而不是标签进行搜索?
r=requests.get('http://www.virginiaequestrian.com/main.cfm?action=greenpages&sub=view&ID=10478')
soup=BeautifulSoup(r.content,'lxml')
tbl=soup.findAll('table')[2]
print tbl.br
【问题讨论】:
-
好吧,
print tbl.br专门用于打印包含在表格中的<br>标记,所以我不太明白您的预期。 -
您期望
print tbl.br的输出是什么? -
伙计们,我真的很陌生,所以请归咎于无知而不是愚蠢。我希望我能得到每个单元的文本值。例如地址的第一部分。
标签: python web-scraping beautifulsoup python-requests