【发布时间】:2018-04-21 14:32:32
【问题描述】:
我有一个包含 16000 行和 2800 个分类列的庞大数据集。我想制作一个矩阵,其中行=变量名和列=标签。我已经尝试过使用表格的应用功能,但我得到的是列表格式的结果。
data= sapply(mydata, table)
output
var1
1 2 3 4 5
1855 8520 1117 1700 2568
var2
-1 - 2 - 3 0 1 2
5642 2634 5218 321 745 605
【问题讨论】:
-
所有分类变量的级别数是否相同?
-
您能否编辑您的帖子以包含您的部分数据(使用例如
dput)。 -
也许这是不可能的,如果列的级别数不同,结果将是一个包含不同长度成员的列表。
-
这是
sapply(mydata, function(x) table(levels(x)[x]))吗? -
嗨 Rui 感谢您的回复...我总共有 187 个独特的级别...并且所有分类变量都没有相同的变量。我得到列表格式的结果,但我想要 2800*187 的矩阵格式的结果。
标签: r