【发布时间】:2017-03-22 07:17:45
【问题描述】:
我对我最近的 r 背心刮伤有疑问。
我想抓取这个页面(以及其他一些股票): http://www.finviz.com/quote.ashx?t=AA&ty=c&p=d&b=1
我需要一份市值清单,即第二行的第一个方框。 此列表应包含大约 50-100 只股票。
我为此使用 rvest。
library(rvest)
html = read_html("http://www.finviz.com/quote.ashx?t=A")
cast = html_nodes(html, "table-dark-row")
问题是,我无法绕过 html_nodes。 关于如何找到 html_nodes 的正确节点的任何想法?
我正在使用 firebug/firefinder 查看网页。
【问题讨论】: