【发布时间】:2019-09-20 02:38:12
【问题描述】:
使用this自述文件中列出的方法,可以直接查询单个表,就像这样
library(bigrquery)
library(dplyr)
natality <- tbl(con, "natality")
natality %>%
select(year, month, day, weight_pounds) %>%
head(10) %>%
collect()
这使我们可以针对natality 编写常规的dplyr 代码,而bigrquery 会将dplyr 代码转换为BigQuery 查询。
但假设 natality 表是 2 个(或更多)单独的表,分别命名为 natality1、natality2,并且它们可以rbind'd 在一起。
如何使用 BigQuery 执行此操作?也就是说,我怎样才能查询这些单独的表,就好像它们都在一起作为一个表一样?
我尝试了什么
我认为bind_rows 可能有效,但它没有。
library(bigrquery)
library(dplyr)
natality1 <- tbl(con, "natality1")
natality2 <- tbl(con, "natality2")
natality1 %>% bind_rows(., natality2) %>%
select(year, month, day, weight_pounds) %>%
head(10) %>%
collect()
注意事项
- 对docs 的扫描没有发现任何明显的东西(但可能有一些东西)。
- BigQuery supports wildcard for selecting/moving files。我不确定这种支持是否扩展到 BigQuery 和 bigrquery
【问题讨论】:
标签: r dplyr google-bigquery dbplyr