【发布时间】:2020-01-07 06:23:47
【问题描述】:
我有一个 pyspark 数据框。它是一个电影数据集。一列是由| 划分的类型。每部电影都有多种类型。
genres = spark.sql("SELECT DISTINCT genres FROM movies ORDER BY genres ASC")
genres.show(5)
【问题讨论】:
标签: apache-spark pyspark apache-spark-sql pyspark-dataframes