【发布时间】:2015-05-19 00:19:06
【问题描述】:
当使用 dplyr 时,tbl_df 函数会打印一条语句,说明数据框是“本地”:
> mtcars %>%
+ group_by(gear)
Source: local data frame [32 x 11]
Groups: gear
mpg cyl ...
1 21.0 6 ...
我认为本地数据框意味着内存中,而非本地数据框是 SQL 之类的数据库。不过,我认为我的假设是错误的。在大约 25:25 的 tutorial video 中,Kevin Markham 说 data.frame 对象不是本地数据帧,我相信它们是。
我查看了tbl_df 文档并在dplyr introduction vignette 中使用了搜索功能,但找不到本地数据框的描述。
问题: 什么是本地数据框?
【问题讨论】:
-
只是将其与 MySQL 数据库之类的远程数据源区分开来。
-
如果链接的视频是准确的,
data_frame对象是本地数据帧,但data.frame对象不是。现在我也很困惑。 -
我不认为@Tyler 最初的假设是错误的,并且有一些语义在起作用。也许,与 docs 和 Kevin Markham 的陈述一致,可以说“本地数据框”是由 tbl_df 从 data.frame 创建的数据包装,在包装之前它本身不是“本地数据框”?
-
@smci 可以打开它,但我不打算实现它,因为我认为当前的行为对大多数人来说更有用