【发布时间】:2014-09-05 15:15:52
【问题描述】:
我有自己的基于以下论文http://pdf.aminer.org/000/221/588/fuzzy_k_means_clustering_with_crisp_regions.pdf 的期望最大化 (EM) 算法实现我想将性能与另一个实现进行比较。对于测试,我使用 K 个质心和 1 Gb 的 txt 数据,我只是测量在 1 次迭代中计算新质心所需的时间。我尝试在 R 中使用 EM 实现,但我做不到,因为结果被绘制在图表中并且被大量的 txt 数据卡住了。我正在关注以下示例:http://en.wikibooks.org/wiki/Data_Mining_Algorithms_In_R/Clustering/Expectation_Maximization_%28EM%29
有人知道 EM 的实现来衡量性能或如何使用 R 来实现吗?
【问题讨论】:
-
你是什么意思,比较?就所用时间而言?参数几乎肯定会有所不同,因为 EM 对初始化很敏感(只找到局部最优)。检查的标准方法是根据模型进行模拟并尝试恢复其参数。
-
你好,本。是的,我想要衡量的是时间表现。
标签: r performance machine-learning data-mining expectation-maximization