【发布时间】:2013-01-27 08:26:22
【问题描述】:
我正在使用自定义随机森林函数,该函数需要一组基因组数据(大约 56k 列)中的起点和终点。
我想将列号拆分为子组,并允许单独处理每个子组以加快处理速度。我用以下代码尝试了这个(不成功):
library(foreach)
library(doMC)
foreach(startMrk=(markers$start), endMrk=(markers$end)) %dopar%
rfFunction(genoA,genoB,0.8,ntree=100,startMrk=startMrk,endMrk=endMrk)
其中 startMrk 是数值变量数组:1 4 8 12 16,endMrk 是另一个数组:3 7 11 15 19
对于这个例子,我希望一个核心以 1:3 运行样本,另一个以 4:7 运行,等等。我对 R 中的并行处理概念不熟悉,所以我非常愿意研究任何可用的文件。有人对我在并行处理或上述代码中缺少的东西有什么建议吗?
【问题讨论】:
标签: r foreach parallel-processing random-forest