【发布时间】:2020-12-13 07:45:10
【问题描述】:
我有一个包含许多字段的现有案例类
案例类输出{
用户ID:字符串,
时间戳:字符串,
...
}
我正在使用它为这样的火花作业生成标题。
--------------------
用户名 |时间戳|
--------------------
1 2324444444
2 2334445556
现在我想在其中添加更多列,这些列将来自
map(attributeName, attributeValue) 作为attributeNames。所以我的问题
是如何将地图添加到案例类,然后如何使用地图键作为
列值来生成动态列。在此之后我的最终输出
应该像 -------------------------------------------------- -- 用户名 |时间戳|属性名1 |属性名称2 -------------------------------------------------- -- 1 2324444444| | 2 2334445554| |
map(attributeName, attributeValue) 作为attributeNames。所以我的问题
是如何将地图添加到案例类,然后如何使用地图键作为
列值来生成动态列。在此之后我的最终输出
应该像 -------------------------------------------------- -- 用户名 |时间戳|属性名1 |属性名称2 -------------------------------------------------- -- 1 2324444444| | 2 2334445554| |
【问题讨论】:
-
实际上,我想知道是否可以使用案例类。如果是,那么如何
标签: scala apache-spark schema case-class