【发布时间】:2021-08-04 07:16:42
【问题描述】:
我正在尝试从 Linkedin Sales Navigator 中抓取一些公司及其潜在客户的详细信息。为了登录,我创建了一个名为 config.txt 的文本文件,其中包含用户名和密码。问题是,它登录成功,只是显示另一个登录页面。
因此,例如:如果我通过 https://www.linkedin.com/checkpoint/rm/sign-in-another-account 登录,它会成功登录,但随后会立即给我另一个登录页面,例如:https://www.linkedin.com/sales/login
如果我对第二个 url 重复该过程,那么理想情况下它应该给我 salesnavigator 的主页,但它又给了我相同的页面,即。 https://www.linkedin.com/sales/login
这是我的代码:
def linkedin_scraper():
print("Started Successfully.")
browser = webdriver.Chrome(ChromeDriverManager().install())
browser.get('https://www.linkedin.com/checkpoint/rm/sign-in-another-account')
file = open('config.txt')
lines = file.readlines()
username = lines[0]
password = lines[1]
time.sleep(1)
usernameID = browser.find_element_by_id('username')
usernameID.send_keys(username)
time.sleep(1)
passwordID = browser.find_element_by_id('password')
passwordID.send_keys(password)
time.sleep(1)
browser.get('https://www.linkedin.com/sales/search/company?geoIncluded=102713980&industryIncluded=106%2C45&jobOpportunities=JO1')
time.sleep(1)
#maximizing window
browser.maximize_window()
# rest of code
它到底在哪里失败了?我不知道为什么会这样。请告诉我。 提前致谢。
【问题讨论】:
-
我认为您需要在输入用户名和密码后按登录按钮 :)
-
以前,我什至不按登录按钮就可以登录,但现在如果我包含登录按钮,那么我会得到一个包含某种谜题的检查点页面。 @本
-
LinkedIn 可能使用验证码来阻止机器人,不幸的是,这正是您所拥有的。您可以手动解决难题,也可以使用微软提供的 API:docs.microsoft.com/en-us/linkedin 来获取您的数据,而不是抓取网页。
标签: python selenium selenium-webdriver web-scraping selenium-chromedriver