【发布时间】:2019-01-06 05:37:03
【问题描述】:
HTML:
<div class="col-7">
<dl class="row box">
<h2>GENERAL</h2>
<dt class="col-6">transmission:</dt>
<dd class="col-6">sequential automatic</dd>
<dt class="col-6 grey">number of seats:</dt>
<dd class="col-6">5</dd>
<dt class="col-6">first year of production:</dt>
<dd class="col-6">2017</dd>
<dt class="col-6 grey">last year of production:</dt>
<dd class="col-6">available</dd>
</dl>
<dl class="row box">
<h2>DRIVE</h2>
<dt class="col-6">fuel:</dt>
<dd class="col-6">petrol</dd>
<dt class="col-6 grey">total maximum power:</dt>
<dd class="col-6">147 kW (200 hp)</dd>
<dt class="col-6">total maximum torque:</dt>
<dd class="col-6">330 Nm</dd>
</dl>
<dl class="row box">
<h2>TRANSMISSION</h2>
<dt class="col-6">1st gear:</dt>
<dd class="col-6">5,00:1</dd>
<dt class="col-6 grey">2nd gear:</dt>
<dd class="col-6">3,20:1</dd>
</dl>
</div>
我的代码:
for item2 in soup2.find_all(attrs={'class':'col-7'}):
jj=item2.text
jj 可以从我抓取的网站中提取所有值,但我只需要其中的几个值。例如,我只需要从 GENERAL 中提取座位数和去年生产的值,从 TRANSMISSION 中提取 1 档的值。
结果应该是:
5, available, 5,00:1
【问题讨论】:
-
您是否尝试过实际解决手头的问题?您的代码似乎并不特别相关。
-
@MadPhysicist 有关系,我已经做了其他部分,这是我需要解决的最后一部分。谢谢。
标签: python web-scraping beautifulsoup