【发布时间】:2018-09-03 03:33:38
【问题描述】:
如何将 Spark 数据框中的列从字符串转换为数组?我需要这个,因为fpgroth 算法需要一个数组来创建模型。
df = spark.read.csv('kheiro/Stage/Model/itemsets.csv')
df.show()
数据:
列的类型:
这是错误:
【问题讨论】:
-
我的意思是数据帧的拆分内置函数。如果您需要更多帮助,请以文本格式而不是图像格式发布文本输入数据和您尝试过的代码
-
请不要将您的代码发布为屏幕截图。人们可能想要复制和粘贴它(搜索引擎也很难找到您的帖子)
标签: python arrays apache-spark dataframe pyspark