【问题标题】:Hiw to insert column values of a dataframe in loop如何在循环中插入数据框的列值
【发布时间】:2018-07-31 12:45:39
【问题描述】:
我有我的一段代码,通过我的工作我得到了最近一个月的记录。现在我需要一个逻辑,我可以在数据框中插入手动开始日期和结束日期,并从该数据框中我可以要求我的工作获取基于该数据框中提供的开始和结束日期的记录..现在,如果我有 4 行,我的工作应该执行 4 次以获取每个时间间隔的记录。[您可以在提到的链接中获取我当前的代码流和逻辑][1] @ 987654321@
【问题讨论】:
标签:
apache-spark
apache-spark-sql
【解决方案1】:
我们可以通过首先对每列值使用 map 函数来实现这一点
recorddf = record.map(col=> col(0),col(1),col(2))
recorddf.collect.foreach(row=> {
row_1.tostring=a;
row_2.tostring=b;
row_3.tostring=c;
} )
现在我们可以传递这些字符串来执行我们主类的函数