注意setMaster("local")和setMaster("local[*])的分区数是不一样的。*会匹配所有的cpu核数。

 

import org.apache.spark.rdd.RDD
import org.apache.spark.{SparkConf, SparkContext}

object Seq_Partition_04 {
  def main(args: Array[String]): Unit = {
    val sparkConf: SparkConf = new SparkConf().setMaster("local").setAppName("Operator")
    val sc: SparkContext = new SparkContext(sparkConf)

    val rdd: RDD[Int] = sc.makeRDD(List(1, 2, 3, 4))
    rdd.saveAsTextFile("seq_output_04")
    sc.stop()
  }
}

 

import org.apache.spark.rdd.RDD
import org.apache.spark.{SparkConf, SparkContext}

object Seq_Partition_05 {
  def main(args: Array[String]): Unit = {
    val sparkConf: SparkConf = new SparkConf().setMaster("local[*]").setAppName("Operator")
    val sc: SparkContext = new SparkContext(sparkConf)

    val rdd: RDD[Int] = sc.makeRDD(List(1, 2, 3, 4))
    rdd.saveAsTextFile("seq_partition_05")
    sc.stop()
  }
}

 

如果spark.default.parallelism没有设置,就会使用cpu的核数。

 

Spark makeRDD方法本地Task的默认分区数

 

相关文章:

  • 2022-12-23
  • 2021-11-22
  • 2021-07-28
  • 2021-12-25
  • 2021-12-02
  • 2021-12-11
  • 2022-03-01
猜你喜欢
  • 2021-12-08
  • 2022-12-23
  • 2021-08-09
  • 2021-04-30
  • 2022-12-23
  • 2022-12-23
相关资源
相似解决方案