【问题标题】:R session aborted when running dbscan运行 dbscan 时 R 会话中止
【发布时间】:2015-12-10 07:17:32
【问题描述】:

我正在尝试对具有 25 列的数据集进行聚类 - 1 列具有 id 和 24 列,告诉具有此 id 的应用程序在一天中的每个小时内被点击了多少次。当我尝试从包 dbscan 运行 dbscan 时,R 会话因致命错误而中止。

我尝试对相同的数据使用 dbscan,它是按天而不是按小时分组的,而且效果很好。 dbscan 可以处理的维度是否有限制?

【问题讨论】:

  • dbscan 包似乎还很年轻。如果您的数据集不是很大,您可以尝试fpc 包。在我的实验中,与 ELKI 相比,两者都非常慢(但 dbscan 包已经更新了)。你有多少个实例?
  • R 会话中止可能是 dbscan 包的 C 代码中的错误。请联系作者以获得调试帮助(但请确保先更新到最新版本)。
  • 谢谢!我大约有 47 行和 24 列。这会被视为fpc 包的大型数据集吗?对不起我的简单问题 - 我在这个 R 世界中很新:) @Anony-Mousse
  • @Anony-Mousse,我尝试使用 fpc 包,它可以工作:) 再次感谢!

标签: r fatal-error dbscan


【解决方案1】:

这确实是一个早期的错误,已在当前版本中解决。这是一些1000点100维的随机数据。

> library(dbscan)
> dat <- matrix(runif(100*1000), ncol=100)
> system.time(db <- dbscan(dat, eps = 3.2))
   user  system elapsed 
  0.272   0.000   0.264 
> db
  DBSCAN clustering for 1000 objects.
  Parameters: eps = 3.2, minPts = 5
  The clustering contains 2 cluster(s).
  Available fields: cluster, eps, minPts

【讨论】:

    猜你喜欢
    • 2015-09-11
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2014-07-01
    • 1970-01-01
    相关资源
    最近更新 更多