【发布时间】:2021-07-26 19:23:13
【问题描述】:
我正在尝试从具有以下 html 的网站上抓取一些信息:
<div role="tabpanel">
<ul class="css-1ijyj3z e1iszlzh2" data-testid="lblPDPInfoProduk">
<li class="css-354z6m">
<span>
Kondisi<!-- -->:
</span>
<span class="main">Baru</span>
</li>
<li class="css-354z6m">
<span>
Berat<!-- -->:
</span>
<span class="main">500 Gram</span>
</li>
<li class="css-354z6m">
<span>
Kategori<!-- -->:
</span>
<a href="https://www.tokopedia.com/p/handphone-tablet/handphone/android-os" rel="noopener noreferrer" target="_blank"><b>Android OS</b></a>
</li>
<li class="css-354z6m">
<span>
Etalase<!-- -->:
</span>
<a href="https://www.tokopedia.com/ofan-store8/etalase/xiaomi" rel="noopener noreferrer" target="_blank"><b>Xiaomi</b></a>
</li>
</ul>
<div class="css-1dwge1q">
<span class="css-11oczh8 e1iszlzh0">
<span class="css-17zm3l e1iszlzh1">
<div data-testid="lblPDPDescriptionProduk">Produk segel<br/>Kualitas terjamin keasliannya <br/>bergaransi TAM<br/>Produk kami kirim dlm keadaan ssgel...<br/><br/>Note : <br/>UNTUK PARA PEMBELI MOHON DI BACA SEBELUM MEMBELI..... <br/><br/>untuk garansi Kami akan aktivasi sesuai dengan invoice pembelian di TOKOPEDIA oleh Promotor Xiaomi kami dengan cara sebagai berikut : <br/><br/>imei handphone di sold out menggunakan sistem aplikasi yg ada di setiap handphone para promotor xiaomi... dan kami pastikan produk tdk lah di unboxing tp msh tetap dlm keadaan segel. mohon maaf kami tdk akan melayani komplain apabila aktivasi garansi sudah sesuai dengan invoice pembelian di tokopedia. untuk para pembeli dgn melakukan pembelian maka kami anggap sudah setuju dgn peraturan toko <br/><br/>JADILAH PEMBELI YG BIJAKSANA<br/></div>
</span>
</span>
<button class="css-5lrz2e" data-testid="btnPDPSeeMore" type="button">Lihat Selengkapnya</button>
</div>
</div>
我正在尝试抓取产品名称的描述并将它们存储在列表中,因此输出将是:
Kondisi: Baru
Berat: 500 Gram
Kategori: Android OS
Etalase: Xiaomi
我试过了:
description = []
quotes = soup.find_all('div', {'role': 'tabpanel'})
for item in quotes:
desc = item.find('span').text
description.append(desc)
但只有输出:
['Kondisi: ']
如何将其更改为正确的代码?谢谢!
【问题讨论】:
标签: python html web-scraping beautifulsoup html-parsing