【发布时间】:2013-04-17 01:20:10
【问题描述】:
我有一个庞大的数据集。我们谈论的是 100 个 121x145x121 单元格的 3D 矩阵。任何单元格的值都在 0 和 1 之间,我需要一种根据它们的相关性对这些单元格进行聚类的方法。问题是数据集对于我知道的任何算法来说都太大了;即使只使用其中的一半(任何矩阵都是大脑的 MRI 扫描),我们也有大约 4000 亿对。有什么想法吗?
【问题讨论】:
-
仅供参考,我正在使用 MATLAB 编程。
-
你在说什么相关性?你能定义数据上下文中的“相关性”是什么意思吗?
-
我不得不问:细胞如何“关联”?它只是一个匹配的数字还是更复杂的数字?
-
太糟糕了,您使用的是 MATLAB。我知道 MATLAB 专门研究矩阵数学,但您可能会从专门为您的问题量身定制的编译应用程序中获得更好的性能
-
@VivinPaliath 任何关联都可以;但是为了简单起见,我们可以假设线性相关。你可以这样思考这个问题:我有 100 个 3D 矩阵,所以任何单元格(例如,70-50-70)都可以被认为是一个值数组(100 个矩阵中具有该位置的所有单元格的值)。所以我需要一种计算所有这些“数组”之间相关性的方法,以便我知道单元格 60-70-60 与单元格 61-70-60 高度相关。这应该可以澄清我的问题(对于 Frecklefoot 也是如此)。
标签: algorithm matlab matrix large-data