【问题标题】:How to get with xpath using BS4 and LXML如何使用 BS4 和 LXML 获取 xpath
【发布时间】:2021-12-24 05:38:19
【问题描述】:

我尝试从网站获取txt,我正在使用BS4解析网站

<ul class="sub-data-list">
<li>Monday : 11:00 - 18:00</li>
</ul>

这是来自网站的来源(来自检查元素)

这是我尝试获取数据的代码

from bs4 import BeautifulSoup
from lxml import etree
from lxml import html
import requests

URL = "https://example.com"


webpage = requests.get(URL)
soup = BeautifulSoup(webpage.content, "html.parser")
dom = etree.HTML(str(soup))



print("საათი: :", dom.xpath('//*[@class="data-list"]')[0].text)

我也试试[0].text , [1].text之类的,还有其他方法吗?

【问题讨论】:

  • 实际网址是什么?
  • 请提供 URL/HTML 代码以帮助您解决问题。

标签: python python-3.x parsing beautifulsoup lxml


【解决方案1】:

如果您尝试获取 &lt;li&gt; 元素的内容,请尝试以下操作:

from bs4 import BeautifulSoup

html = """<ul class="sub-data-list">
<li>Monday : 11:00 - 18:00</li>
</ul>"""

soup = BeautifulSoup(html, "html.parser")
ul = soup.find('ul', class_='sub-data-list')
print(ul.li.text)

【讨论】:

    猜你喜欢
    • 2014-12-05
    • 2012-09-29
    • 2016-10-24
    • 1970-01-01
    • 2018-03-20
    • 1970-01-01
    • 1970-01-01
    • 2018-09-13
    • 1970-01-01
    相关资源
    最近更新 更多