【发布时间】:2017-09-29 01:31:50
【问题描述】:
我有一个包含以下数据的 DataFrame:
num_cta | n_lines
110000000000| 2
110100000000| 3
110200000000| 1
有了这些信息,我需要根据 n_lines 列的值创建一个具有不同行数的新 DF。
例如,对于我的 DF 的第一行 (110000000000),n_lines 列的值为 2。结果必须类似于以下内容:
num_cta
110000000000
110000000000
对于我展示的所有 Dataframe 示例,获得的结果必须是这样的:
num_cta
110000000000
110000000000
110100000000
110100000000
110100000000
110200000000
有没有办法做到这一点?并将一行乘以 n 次,具体取决于列值的值?
问候。
【问题讨论】:
标签: scala apache-spark apache-spark-sql