【发布时间】:2015-12-10 07:17:32
【问题描述】:
我正在尝试对具有 25 列的数据集进行聚类 - 1 列具有 id 和 24 列,告诉具有此 id 的应用程序在一天中的每个小时内被点击了多少次。当我尝试从包 dbscan 运行 dbscan 时,R 会话因致命错误而中止。
我尝试对相同的数据使用 dbscan,它是按天而不是按小时分组的,而且效果很好。 dbscan 可以处理的维度是否有限制?
【问题讨论】:
-
dbscan包似乎还很年轻。如果您的数据集不是很大,您可以尝试fpc包。在我的实验中,与 ELKI 相比,两者都非常慢(但dbscan包已经更新了)。你有多少个实例? -
R 会话中止可能是
dbscan包的 C 代码中的错误。请联系作者以获得调试帮助(但请确保先更新到最新版本)。 -
谢谢!我大约有 47 行和 24 列。这会被视为
fpc包的大型数据集吗?对不起我的简单问题 - 我在这个 R 世界中很新:) @Anony-Mousse -
@Anony-Mousse,我尝试使用
fpc包,它可以工作:) 再次感谢!
标签: r fatal-error dbscan