【发布时间】:2020-10-29 08:13:10
【问题描述】:
我无法从网站上抓取数据 我有一个 URL 链接 https://autodesk.wd1.myworkdayjobs.com/Ext/0/refreshFacet/318c8bb6f553100021d223d9780d30be 当我打开此链接时,有很多工作列表显示当我滚动页面时它会自动加载更多工作列表当我检查页面时只有 JavaScript 显示,我需要提取以下数据工作位置、工作描述、工作 URL ,全职或兼职,json格式的最低资格我不知道如何在下面我的代码中做到这一点
from bs4 import BeautifulSoup
import pandas as pd
from selenium import webdriver
from datetime import datetime
startTime = datetime.now()
import time
print('startTime',startTime)
driver = webdriver.Chrome('C:\\Users\\arif khan\\Downloads\\chromedriver.exe')
driver.get('https://autodesk.wd1.myworkdayjobs.com/Ext/0/refreshFacet/318c8bb6f553100021d223d9780d30be')
【问题讨论】:
-
你的代码真的什么都不做,只是打开了网站
-
我不明白接下来我能做什么请做点什么
-
从我看到的你将不得不访问选项?在
title=之类的标签中 -
但是当我检查页面时我找不到元素
-
我可以,但无论如何我看到你必须访问元素的选项,如
title=如果你不能用 selenium 访问它们,可能是它们前面有一个元素隐藏了下面的元素,我认为有人对此有疑问
标签: python json selenium web-scraping selenium-chromedriver