【发布时间】:2019-02-05 19:33:47
【问题描述】:
我想
library(rvest); library(XML); library(dplyr);library(tidyr); library(purrr); library(rjson)
url <- "http://suggestqueries.google.com/complete/search?client=chrome&q=Nike"
nike_autocomplete <- read_html(url)
输出应该是这样的:
[1] "Nike" "nike air" "nike air max" "nike schuhe" "nike air force" "nike air max 97"
[7] "nike tn" "nike id" "nike air max 270" "nike vapormax" "nike pullover" "nike schweiz"
[13] "nike 97" "nike off white" "nike air max plus" "nike winterschuhe" "nike schuhe damen" "nike huarache"
[19] "nike shoes" "nike logo" "nike air max 90"
因此,最后没有空的东西
【问题讨论】:
-
您想要的结果看起来不像数据框。是一行两列吗?列名是什么?
-
只有一列,重要的是删除第一个空列开头的值。
-
一秒修改
-
你确定你的输入是正确的吗?当我运行您的
list <-代码时,我得到一个列表,其中包含一个包含 1 行和 10 列的单个数据框......并且您删除了不符合您的标准的值,例如,为什么"tlw":false不在输出中?它不是特殊的、数字的、特殊的或空的。 -
这是来自 JSON 文件吗?您最好改进导入过程,而不是尝试清理导入不良的数据。