【问题标题】:How to execute onload function javascript from a python file?如何从python文件执行onload函数javascript?
【发布时间】:2024-05-29 17:50:02
【问题描述】:

我想从html页面获取数据,但是页面有onload函数,当我使用requests.Session()的get方法时没有执行。

with Session() as s:
  s.get('https://o2.amdm.pro/amdm/S/S/S/insure/Portfolio#/entityHandle=01%7CPD%7C00000000000001384776%7C0001%7C0001', stream=True)
  

我的问题是,如何像在浏览器中一样执行这些功能以获取丢失的数据以填充主 div ?或者至少,在浏览器中加载页面并完全加载该页面的 html?

【问题讨论】:

    标签: javascript python html python-requests


    【解决方案1】:

    我的问题是,如何像在浏览器中一样执行这些功能以获取丢失的数据以填充主 div?

    你需要一个支持 JavaScript 的工具,如果你想要一个类似于 python-requests 的工具,我建议试试 Requests-HTML

    在浏览器中加载页面并完全加载该页面的 html

    为此你需要网络自动化工具,这里我建议尝试Selenium

    【讨论】:

    • requests-html 似乎可以完成这项工作,但有些东西我不明白,我想保留 cookie 会话,但它说:Traceback(最近一次通话最后一次):文件“C:\ Users\nicol\Desktop\Nouveau dossier\test.py",第 71 行,在 resp.html.render(timeout=20, send_cookies_session=True) TypeError: render() got an unexpected keyword argument 'send_cookies_session'跨度>