【发布时间】:2019-03-11 18:14:33
【问题描述】:
抱歉,如果这个问题对其他人来说很相似,我无法使任何其他解决方案发挥作用。我正在使用beautifulsoup 抓取一个网站,并试图从一个已评论的表字段中获取信息:
<td>
<span class="release" data-release="1518739200"></span>
<!--<p class="statistics">
<span class="views" clicks="1564058">1.56M Clicks</span>
<span class="interaction" likes="0"></span>
</p>-->
</td>
如何获得部分“视图”和“交互”?
【问题讨论】:
-
试试
soup.select('span[class="views"])(和interaction分别) -
@DušanMaďar 我试过这些,但我得到了
AttributeError: 'Comment' object has no attribute 'decompose'和comments.extract()它可以工作但没有提供任何结果 -
@MCO
soup.select('span[class="views"]')为我提供了以下空结果[],但不确定您的意思是“分别与交互”是什么意思? -
@Claudine 尝试使用
extract:stackoverflow.com/a/33139332/4183498 -
@DušanMaďar 看到我试错了,但很遗憾,摘录没有提供任何结果
标签: python web-scraping beautifulsoup comments