【发布时间】:2017-09-15 23:37:06
【问题描述】:
我想在 Spark 数据集中将整列的大小写更改为小写
Desired Input
+------+--------------------+
|ItemID| Category name|
+------+--------------------+
| ABC|BRUSH & BROOM HAN...|
| XYZ|WHEEL BRUSH PARTS...|
+------+--------------------+
Desired Output
+------+--------------------+
|ItemID| Category name|
+------+--------------------+
| ABC|brush & broom han...|
| XYZ|wheel brush parts...|
+------+--------------------+
我尝试使用 collectAsList() 和 toString(),对于非常大的数据集,这是一个缓慢而复杂的过程。
我还发现了一个“低”的方法,但不知道如何让它在 dasaset 中工作 请建议我一个简单或有效的方法来完成上述操作。提前致谢
【问题讨论】:
标签: java apache-spark apache-spark-sql apache-spark-dataset