【发布时间】:2016-01-28 12:03:11
【问题描述】:
我正在尝试了解此位置的 scala 代码。 (我是java背景)。
我完全迷失在下面的部分
val pairs1 = sc.parallelize(0 until numMappers, numMappers).flatMap { p =>
val ranGen = new Random
var arr1 = new Array[(Int, Array[Byte])](numKVPairs)
for (i <- 0 until numKVPairs) {
val byteArr = new Array[Byte](valSize)
ranGen.nextBytes(byteArr)
arr1(i) = (ranGen.nextInt(Int.MaxValue), byteArr)
}
arr1
}.cache()
我知道并行化和平面地图的作用。我不知道 arr1 是如何被初始化的。它是 int 类型还是其他类型的字节数组?另外,它在 for 循环逻辑中做了什么。
【问题讨论】:
标签: java arrays scala apache-spark