【发布时间】:2021-12-24 05:38:19
【问题描述】:
我尝试从网站获取txt,我正在使用BS4解析网站
<ul class="sub-data-list">
<li>Monday : 11:00 - 18:00</li>
</ul>
这是来自网站的来源(来自检查元素)
这是我尝试获取数据的代码
from bs4 import BeautifulSoup
from lxml import etree
from lxml import html
import requests
URL = "https://example.com"
webpage = requests.get(URL)
soup = BeautifulSoup(webpage.content, "html.parser")
dom = etree.HTML(str(soup))
print("საათი: :", dom.xpath('//*[@class="data-list"]')[0].text)
我也试试[0].text , [1].text之类的,还有其他方法吗?
【问题讨论】:
-
实际网址是什么?
-
请提供 URL/HTML 代码以帮助您解决问题。
标签: python python-3.x parsing beautifulsoup lxml