【发布时间】:2020-11-14 23:30:53
【问题描述】:
我有一个 HTML 文件。我正在尝试打开它并将内容读取为
with open("M_ALARM_102.HTML", "r") as f:
contents = f.read()
print(contents)
当我打印上述命令中的内容时,它会完美打印。但是当我将内容传递给 BeautifulSoup 并打印汤时,它会更改 HTML 代码
soup = BeautifulSoup(contents, html.parser)
print(soup)
这是 BeautifulSoup 的输出
ÿþ<html>
<head>
<meta charset="UTF-8">
<title>ARRÊT SERVOS</title>
<style type="text/css">
我不明白它为什么这样做。我需要从中提取 3 个标签,但它一直给出 None 作为输出。
有人可以帮帮我吗?
【问题讨论】:
标签: python html beautifulsoup