【问题标题】:How to implement bootstrap (resampling) in Java efficiently如何有效地在 Java 中实现引导(重采样)
【发布时间】:2014-06-12 16:56:25
【问题描述】:

我有一个包含 50,000,000 行的数据文件,需要使用 Java 引导每一行。 现在我正在使用 Math.random() 生成随机数,然后以蛮力的方式进行引导。然而,这将带我永远。所以我想知道是否有任何Java库帮助有效地做到这一点,或者我应该在Java中调用其他语言?无论如何,我的目标是优化整个过程。谢谢!

【问题讨论】:

  • 什么是“引导每一行”?

标签: java bigdata resampling statistics-bootstrap


【解决方案1】:

如果整个数据集适合内存(假设文件的各个行不太长,这在具有 8 GB RAM 的典型高端笔记本电脑上可能是可行的)那么您可能可以使用Resample 来自 Weka 的 java 类。 Resample 类有 supervisedunsupervised 版本。你可以下载Wekahere

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2018-08-01
    • 2020-03-19
    • 2013-09-23
    • 1970-01-01
    • 2014-08-03
    相关资源
    最近更新 更多