desi-boke

SparkPi的编程计算

Pi的计算方式有很多,本文主要是通过Spark在概论统计的方法对Pi进行求解:

算法说明:

  在边长为R的正方形中,其面积为R^2,而其内接圆的面积为pi * R^2 /4 ,圆的面积与正方形的面积比为 Pi / 4 .

存在一个点,随机的往这个正方形中掉落,而且这个点掉落到正方形的每个位置的概率是相同的,当无数多个点掉落在这个正方形时,那么这个点在圆的个数x与在正方形上的个数y应该为圆的面积与正方形的面积之比Pi /4。

     

 

 

scala编程算法:

 

  

import org.apache.spark.sql.SparkSession

import scala.math.random

object SparkPi {
  def main(args: Array[String]): Unit = {
//step1:创建spark线程 val spark
= SparkSession.builder.appName("Spark Pi").getOrCreate() //step2: 设置参数
val slices
= if(args.length>0) args(0).toInt else 2 //通过输入的值判断分片的个数,主要是设定线程数 val n = math.min(100000L * slices, Int.MaxValue).toInt //设定投递的次数,也就是设定点的个数。当点的个数越大,求出的pi值越精确
//step3: 逻辑判断 ,并统计落在圆这个面积中的次数 val count: Int
= spark.sparkContext.parallelize(1 until n, slices).map { i => val x = random * 2 - 1 val y = random * 2 - 1 if (x * x + y * y <= 1) 1 else 0 //定义随机点,判断点是否落在圆内,若不在,则为0,否则则取1 }.reduce(_ + _)
//通过公式pi = 4.0 * (圆中的次数)/ 总的次数 println(s
"Pi is roughly ${4.0 * count/(n-1)}") spark.stop() }

 

分类:

技术点:

相关文章: