【发布时间】:2022-08-03 07:26:36
【问题描述】:
我的输入是 pyspark 中的数据框列,它只有一列 DETAIL_REC。
detail_df.show()
DETAIL_REC
================================
ABC12345678ABC98765543ABC98762345
detail_df.printSchema()
root
|-- DETAIL_REC: string(nullable =true)
对于每 11 个字符/字符串,它必须位于数据帧的下一行,以便下游进程使用它。
预期输出应该是数据框中的多行
DETAIL_REC (No spaces lines after each record)
==============
ABC12345678
ABC98765543
ABC98762345
标签: pyspark