【发布时间】:2020-04-08 02:19:27
【问题描述】:
我正在尝试收集所有详细信息(旅客类型、座位类型、路线、飞行日期、座位舒适度、客舱工作人员服务、食品和饮料、机上娱乐、地面服务、Wifi 和连接、物有所值) 包括星级
来自航空公司质量网页
https://www.airlinequality.com/airline-reviews/emirates/
没有按预期工作
my_url<- c("https://www.airlinequality.com/airline-reviews/emirates/")
review <- function(url){
review<- read_html(url) %>%
html_nodes(".review-value") %>%
html_text%>%
as_tibble()
}
output <- map_dfr(my_url, review )
只能刮星级,我需要所有详细信息(例如客舱工作人员服务 - 等级 2 ,食品和饮料 = 等级 5)
star <- function(url){
stars_sq <- read_html(url) %>%
html_nodes(".star") %>%
html_attr("class") %>%
as.factor() %>%
as_tibble()
}
output_star<- map_dfr(my_url, star )
结果的输出应该是表格形式:
column :旅行者类型、座位类型、路线、飞行日期、座位舒适度 .... 以及星级
行:每条评论
【问题讨论】:
标签: r web-scraping tidyverse rvest purrr