【发布时间】:2022-11-24 04:24:14
【问题描述】:
我正在创建一个基于以下功能的 UDF:
def return_output(column):
return {'features':{'site':'a.com', 'test':column, 'test_vocab':['a','b','c']}
但我不确定如何定义返回类型
列的一个例子是 {"sentence":[0,1,2],"another_one":[0,1,2]}
所以最终的输出看起来像下面这样:
{'features':{'home_page':'a.com', 'test':{"sentence":[0,1,2],"another_one":[0,1,2]}
, 'test_vocab':['a','b','c']}
我应该如何定义此输出的返回类型?
【问题讨论】:
标签: pyspark user-defined-functions return-type