【发布时间】:2018-10-11 23:44:29
【问题描述】:
使用 BeautifulSoup,我正在尝试打印特定标签内的文本,问题是我要打印的文本位于 <tr> 标签内的标签内,而网页有 30 个 <tr> 标签。
我需要打印的文本位于 <tr> 标签第 19 次出现内的第二个 <td> 标签中。
它看起来像这样:
<tr>...</tr>
<tr>...</tr>
<tr>
<td class="QL">Text1</td>
<td class="QL">Text2</td>
<td class="QL">Text3</td>
</tr>
<tr>...</tr>
<tr>...</tr>
我想打印 Text2。
这是我的尝试:
from urllib.request import urlopen
from bs4 import BeautifulSoup
quote_page = 'http://google.com'
page = urlopen(quote_page)
soup = BeautifulSoup(page, 'html.parser')
for link in soup.find("td", {"class": "QL"}):
print(link)
事实上,它正在打印<td class="QL"> 标签的第一次出现。如何让它在该标签的第 19 次出现内打印文本,而不打印 Text1 和 Text3?
【问题讨论】:
-
你需要
soup.findAll
标签: python beautifulsoup