【发布时间】:2019-10-03 05:14:03
【问题描述】:
我在一列中有一些字符串值,我想用其他列中的值替换该列中的子字符串,并将所有加号替换为空格(如下所示)。
我有这些 List[String] 映射,它们是动态传递的,mapFrom 和 mapTo 应该在索引中关联。
描述值:mapFrom: ["Child Name", "Child Age", "Child State"]
列名:mapTo: ["name", "age", "state"]
输入示例:
name, age, state, description
tiffany, 10, virginia, Child Name + Child Age + Child State
andrew, 11, california, Child State + Child Name + Child Age
tyler, 12, ohio, Child Age + Child State + Child Name
预期结果:
name, age, state, description
tiffany, 10, virginia, tiffany 10 virginia
andrew, 11, california, california andrew 11
tyler, 12, ohio, 12 ohio tyler
如何使用 Spark Scala 实现这一目标?
【问题讨论】:
标签: scala apache-spark dataframe apache-spark-sql