【发布时间】:2018-06-17 07:32:43
【问题描述】:
sparkSession = SparkSession.builder.appName("example").getOrCreate()
df = sparkSession.read.json('hdfs://localhost/abc/zscore/')
我能够从 hdfs 读取数据,并且我想仅计算数字列的 zscore
【问题讨论】:
标签: apache-spark pyspark apache-spark-sql hdfs