【发布时间】:2015-12-17 15:50:01
【问题描述】:
我有一个包含 20,000 行和 300 列的数组。每个元素都是一个整数。我想计算这个矩阵中每个整数的出现次数。
我尝试了以下方法:
>frequency_Table=read.csv('huge_file.csv',header=FALSE,check.names=FALSE)
>table(frequency_Table)
我收到错误消息“尝试使用 >= 2^31 个元素制作表格”,阅读后这很有意义。
我想要这样的东西:
1 2000
2 2023
3 5683
基本上,所有数字的频率表。任何建议将不胜感激!
【问题讨论】:
-
为什么这个问题被标记为 Python?
-
您实际上是在执行
table(column1,column2,column3,column4,column5,etc,etc),如果您先在较小的桌子上尝试此操作,您很快就会发现这一点。这就是在 Stackoverflow 上发布之前尝试创建一个最小示例的价值 - 您经常在尝试整理问题的过程中找到答案。 -
我实际上是无意中包含了python,对此感到抱歉。但是 Python 的答案也可以。
标签: r