【问题标题】:Obtain the contents of a div tag that doesn't have a class attribute using python使用python获取没有类属性的div标签的内容
【发布时间】:2015-11-07 18:04:22
【问题描述】:

我尝试获取<div> 标记内的文本,但无法获取。我正在尝试获取此文本:

MsiExec.exe /X{42435041-332D-5350-00A7-A758B70C0F00}

此标签未包含在任何 div 类中。

<div style="margin-top: 10px;"><span class="colorlt">Uninstaller:</span> MsiExec.exe /X{42435041-332D-5350-00A7-A758B70C0F00}</div> 

有人可以告诉我如何使用 python 完成吗? 我正在使用 BeautifulSoup 来报废页面。

【问题讨论】:

  • 如何识别&lt;div&gt;?您是否正在寻找没有任何 CSS 类的 &lt;div&gt;s?然后你想提取其中的文本?你试过什么?

标签: python beautifulsoup


【解决方案1】:

这是抓取页面的全部内容吗?如果是这样,试试这个:

from bs4 import BeautifulSoup
soup = BeautifulSoup('<div style="margin-top: 10px;"><span class="colorlt">Uninstaller:</span> MsiExec.exe /X{42435041-332D-5350-00A7-A758B70C0F00}</div>', 'html.parser')
print soup.div.text

卸载程序:MsiExec.exe /X{42435041-332D-5350-00A7-A758B70C0F00}

如果您抓取的页面包含其他 div,这可能不起作用。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2020-11-27
    • 1970-01-01
    • 2013-09-04
    • 1970-01-01
    • 1970-01-01
    • 2018-06-30
    • 1970-01-01
    • 2016-07-23
    相关资源
    最近更新 更多