【发布时间】:2016-02-10 21:25:46
【问题描述】:
我正在尝试将参数列表传递给函数。
scala> val a = Array("col1", "col2")
a: Array[String] = Array(col1, col2)
我正在尝试使用 :_* 表示法,但它不起作用:我终生无法弄清楚原因!
val edges = all_edges.select(a:_*)
<console>:27: error: overloaded method value select with alternatives:
(col: String,cols: String*)org.apache.spark.sql.DataFrame <and>
(cols: org.apache.spark.sql.Column*)org.apache.spark.sql.DataFrame
cannot be applied to (String)
但是,这确实有效:
val edges = all_edges.select("col1", "col2")
不确定是否相关,但 all_edges 是一个 spark 数据框,我试图通过在列表中指定列来仅保留列。
scala> all_edges
res4: org.apache.spark.sql.DataFrame
有什么想法吗?我一直在尝试从例如中找出语法。 Passing elements of a List as parameters to a function with variable arguments 但似乎并没有走远
编辑:刚刚找到 How to "negative select" columns in spark's dataframe - 但我很困惑为什么语法 twocol.select(selectedCols.head, selectedCols.tail: _*) 是必要的?
【问题讨论】:
标签: scala apache-spark spark-dataframe