【发布时间】:2020-11-26 04:45:45
【问题描述】:
我的目标是使用 Selenium(或类似模块)在 Chrome 上抓取网站。但是,该项目的一个重要方面是避免使用由测试软件控制的浏览器,即使用以下方式打开的浏览器:
driver = webdriver.Chrome('...')
driver.get('https://www.google.com/')
我确实了解 Selenium 使此类目标非常容易实现,但某些限制(例如必须登录网站、避免将个人详细信息放入代码、避免使用输入手动输入个人详细信息)不鼓励这样做。
我的第一步是使用操作系统在现有 Chrome 实例中打开一个新标签页,这是我手动打开的,效果很好。
os.system(f'start chrome.exe {link}')
这就是我卡住的地方。我浏览了操作系统目录,但不确定要查找什么。我是这种编码的新手,所以我不确定如何继续,哪些模块在这里会有所帮助,或者我应该在哪里寻求进一步的帮助。
TL;博士:
如何使用 Python 和 Selenium(或其他)与手动打开的 Chrome 浏览器进行交互(抓取信息、导航页面元素等)?
【问题讨论】:
-
如何通过
selenium打开 Chrome,暂停脚本,手动输入信息并恢复脚本? -
@MaximilianPeters 这就是我之前的做法,但我正在尝试以浏览器可以访问 Chrome 用户数据的方式进行操作,我认为最简单的方法是只与现有实例交互。
标签: python selenium web-scraping operating-system