【发布时间】:2016-01-05 14:37:12
【问题描述】:
假设我们有一个 Spark DataFrame
df.getClass
Class[_ <: org.apache.spark.sql.DataFrame] = class org.apache.spark.sql.DataFrame
使用以下架构
df.printSchema
root
|-- rawFV: string (nullable = true)
|-- tk: array (nullable = true)
| |-- element: string (containsNull = true)
鉴于tk列的每一行都是一个字符串数组,如何编写一个Scala函数来返回每行元素的数量?
【问题讨论】:
标签: scala apache-spark dataframe apache-spark-sql