【发布时间】:2021-11-03 02:11:10
【问题描述】:
我想下载世界上最有趣的笑话的维基百科页面https://en.wikipedia.org/wiki/World%27s_funniest_joke
然后,我想用单词apple 替换所有出现的单词joke(是的,确实更有趣)。
关键是我希望能够单击输出html 文件(用苹果而不是笑话)并能够在我的浏览器中看到与原始网页相同的图像、css 和输出.
-
我尝试使用 chrome 下载
mhtml文件并使用f.read()修改文件,但文件看起来像二进制数据。 -
通过
(BeautifulSoup(requests.get(myurl), 'html.parser'))使用requests和beautifulsoup只会给我原始的html而没有格式化。
我能做什么?我不介意一些手动步骤(例如,先在某处下载文件)。
谢谢!
【问题讨论】:
-
我认为你需要一两门现代网页设计的基础课程。
-
谢谢,这是一个有用的评论。你有可能的解决方案吗?
标签: python selenium beautifulsoup python-requests