代码量

计算平均数

使用hadoop的方式

SparkSQL愿景

spark方式-RDD

SparkSQL愿景

spark方式-DataFrame

SparkSQL愿景

spark方式-SQL

SparkSQL愿景
综上,很明显使用spark方式的DataFrame或者SQL都可以使代码可读性更好,代码更精简。

读写数据

从json读数据:df = sqlContext.read.format("json").option("samplingRatio", "0.1").load("/home/user1/data.json")
将文件写入json:df.write.format("parquet").mode("append").partitionBy("year").saveAsTable("fasterData")

相关文章:

  • 2021-07-10
  • 2021-09-11
  • 2022-12-23
  • 2022-12-23
  • 2021-05-26
  • 2021-12-04
  • 2021-11-09
  • 2021-05-28
猜你喜欢
  • 2021-10-24
  • 2022-12-23
  • 2021-06-05
  • 2021-06-22
  • 2021-05-01
  • 2021-07-12
  • 2022-01-22
相关资源
相似解决方案