【发布时间】:2018-10-27 01:41:18
【问题描述】:
我是 Scala 的初学者。
我有一个包含 2 列的数据框:
第一个是日期,第二个是单词数组。
created_at:string
words:array
element:string
我希望只保留以“#”开头的单词
我更喜欢在爆炸数组之前制作过滤器,因为大多数单词不以'#'开头
我没有找到修改数组列并应用过滤器(_.startsWith("#")) 之类的方法。
有可能吗?以及如何?
谢谢
皮埃尔
【问题讨论】:
标签: arrays scala apache-spark dataframe