【发布时间】:2021-03-06 10:43:36
【问题描述】:
我在找到正确的标签以从网页中抓取我想要的文本时遇到了一些麻烦。下面是 HTML 示例。我想刮掉文字“墨尔本风暴已经完成了 4 次尝试布里斯班野马队已经完成了 2 次尝试”
我一直在使用的 R 代码如下,但我似乎无法得到我想要的文本。
url <- 'https://www.nrl.com/draw/nrl-premiership/2019/round-1/storm-v-broncos/'
RawTable <- read_html(url)
RawTable <- html_nodes(RawTable,'.u-visually-hidden')
RawTable <- html_text(RawTable)
RawTable <- data.frame(RawTable)
HTML 代码:
`<div class="Match-centre-summary o-shadowed-box u-spacing-mb-small">
<span class="u-visually-hidden">Melbourne Storm has achieved 4 Tries Brisbane Broncos has achieved 2
Tries </span>`
【问题讨论】:
标签: html css r web-scraping rvest