【发布时间】:2019-10-15 15:19:55
【问题描述】:
我正在从 URL 列表中提取董事会成员。对于 URL_lst 中的每个 url,单击第一个 xpath(查看更多以展开列表),然后从第二个 xpath(BoardMembers 的信息)中提取值。 以下是我要提取信息的三个公司:https://www.bloomberg.com/quote/FB:US、https://www.bloomberg.com/quote/AAPL:US、https://www.bloomberg.com/quote/MSFT:US
我的代码如下所示,但不起作用。输出列表未聚合。我知道循环有问题,但不知道如何修复它。谁能告诉我如何更正代码?谢谢!
URL_lst = ['https://www.bloomberg.com/quote/FB:US','https://www.bloomberg.com/quote/AAPL:US','https://www.bloomberg.com/quote/MSFT:US']
Outputs = []
driver = webdriver.Chrome(r'xxx\chromedriver.exe')
for url in URL_lst:
driver.get(url)
for c in driver.find_elements_by_xpath("//*[@id='root']/div/div/section[3]/div[10]/div[2]/div/span[1]"):
c.click()
for e in (c.find_elements_by_xpath('//*[@id="root"]/div/div/section[3]/div[10]/div[1]/div[2]/div/div[2]')[0].text.split('\n'):
Outputs.append(e)
print(Outputs)
【问题讨论】:
-
您是否在代码中看到错误消息?哪一行特别给你一个错误?发布页面 HTML 以查看您的 XPath 所基于的内容也会很有帮助。
标签: python selenium loops web-scraping