【发布时间】:2016-08-03 00:27:06
【问题描述】:
我想从雅虎财经 (http://finance.yahoo.com/quote/AAPL/financials?p=AAPL) 获得一个数字,资产负债表,总股东权益。如果我检查元素,我会得到:
<span data-reactid=".1doxyl2xoso.1.$0.0.0.3.1.$main-0-Quote-Proxy.$main-0-Quote.0.2.0.2:1:$BALANCE_SHEET.0.0.$TOTAL_STOCKHOLDER_EQUITY.1:$0.0.0">119,355,000</span>
我想得到,报废号码:119,355,000。
如果我理解正确,网页是用 Java Script 编码的,我需要使用 Selenium 来获得所需的数字。无论我做什么,我的尝试(我是一个完整的初学者)都不起作用,贝娄是许多尝试中的三个。我尝试使用'data-reactid'和其他一些东西,但我的想法已经用完了:-)
elem = Browser.find_element_by_partial_link_text('TOTAL_STOCKHOLDER_EQUITY')
elem = browser.find_element_by_id('TOTAL_STOCKHOLDER_EQUITY')
elem = browser.find_elem_by_id('TOTAL_STOCKHOLDER_EQUITY')
【问题讨论】:
-
您知道,有一个
yahoo-financepython 包。您不需要编写自己的刮板 -
cricket_007,我也会调查一下,谢谢你提到它,但作为一个完全的菜鸟,我可能会再挣扎一周或更长时间。在这里,我现在“非常”接近最终得到结果。我只需要那一行代码:-)
标签: python python-3.x selenium-webdriver web-scraping yahoo-finance