【发布时间】:2014-11-10 13:09:47
【问题描述】:
我需要将保存在磁盘中的一个非常大的分区数据库分解为多个部分,保存这些部分,对每个部分进行排序,然后将它们重新连接以生成一个排序后的数据库。松散地说,我想将合并排序应用于一个非常大的分区。这样做的方法应该是什么?我无法加载整个表格,因为它太大而无法使用。
例如, 表大小为 15 GB, 内存为 50 GB, 列(数据类型)为data(p), id(i), value_a(C), value_b(j), value_c(f),
我想按 id 对表格进行排序。但是我无法加载表格,因为它对内存来说太大了。
【问题讨论】:
-
这里没有足够的信息来帮助您。架构、大小、可用 RAM,一个简单的例子 - 所有这些都有助于获得答案;)
-
感谢您的回复;可用 RAM 为 50gigs。表大小为 15gigs。假设我们有 5 列,日期、id、值 a、值 b 和值 c。我想对 id 应用排序。
-
这是日期显示还是列显示?
-
这是一场约会
标签: kdb