【问题标题】:How to output soup to .html using Beautiful Soup?如何使用 Beautiful Soup 将汤输出到 .html?
【发布时间】:2018-05-07 17:15:45
【问题描述】:

我正在解析一个网络链接,我想将整个网页保存到格式为 .html 的本地文件中。我想直接将汤输出到本地的html 文件以将副本上传到 S3-AWS 吗?

from bs4 import BeautifulSoup
import requests
url_name = "https://<weblink>/"
soup = BeautifulSoup(url_name,"html.parser")

现在,我只是想知道,像.txt 我们可以将汤输出到.html as well。建议表示赞赏。

【问题讨论】:

  • 你是在说像this这样的事情吗?

标签: python json beautifulsoup


【解决方案1】:

您导入了请求,但从未实际使用过它。您需要获取实际站点

r=requests.get(url_name)

然后你可以将它传递给 BS

soup=BeautifulSoup(r.text,'html.parser')

【讨论】:

  • @yan r.txt 是响应内容,如果这就是您的意思。无论如何,一个 html 文件基本上是一个文本文件,所以你所要做的就是将你的文件保存为 .html
猜你喜欢
  • 2011-04-10
  • 1970-01-01
  • 2019-03-06
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2019-09-13
  • 2011-09-27
  • 1970-01-01
相关资源
最近更新 更多