【发布时间】:2016-12-19 12:06:30
【问题描述】:
我有一个包含大约 200 万个元素的列表。该列表由字符串向量组成。大约有 50 个不同的字符串,因此可以考虑因素。字符串的向量是不同的长度,在 1 到 50 之间变化(即字符串的总数)。
我想将列表转换为逻辑或二进制矩阵/data.frame。目前我的方法涉及 lapply 并且速度非常慢,我想知道是否有矢量化方法。
require(dplyr); require(tidyr)
#create test data set
set.seed(123)
list1 <- list()
ListLength <-10
elementlength <- sample(1:5, ListLength, replace = TRUE )
for(i in 1:length(elementlength) ){
list1[[i]] <- sample(letters[1:15], elementlength[i])
}
#Create data frame from list using lapply
lapply(list1, function(n){
data.frame(type = n, value = TRUE) %>%
spread(., key = type, value )
}) %>% bind_rows()
我不知道有没有办法通过预先分配数据框然后以某种方式填充它。
Type <- unique(unlist(list1, use.names = FALSE))
#Create empty dataframe
TypeMat <- data.frame(matrix(NA,
ncol = length(Type),
nrow = ListLength)) %>%
setNames(Type)
【问题讨论】: