【发布时间】:2020-02-23 14:47:52
【问题描述】:
我目前正在执行一个实时查找我们学校空教室的项目。为此,我需要提取我们学校页面 (https://ssnovohradska.edupage.org/substitution/?) 上发布的替换内容,因为可能会有任何其他更改。
但是当我尝试提取 html 源代码并用 bs4 解析它时,它找不到包含替换文本的 divs(class: "section print-nobreak")。当我查看页面源代码(Ctrl+U)时,我发现只有一个 javascript 可以直接将其全部打印出来。
有什么方法可以在 javascript 输出已经渲染后提取 html 吗?
感谢您的帮助!
【问题讨论】:
-
P.S.当你进入页面时,你需要在顶部导航中切换到明天的日期(“Po 24.2.”)。
标签: javascript html beautifulsoup text-extraction