【发布时间】:2018-10-21 10:11:24
【问题描述】:
我遇到了一个问题,这是一个 for 循环程序。如下所示:
list = [1,2,3,4]
for index in list:
new_df_name = "user_" + index
new_df_name = origin_df1.join(origin_df2,'id','left')
但“new_df_name”只是一个变量和字符串类型。
如何实现这些?
【问题讨论】:
-
如果你想将
index附加到user_,试试这个:new_df_name = "user_" + str(index) -
但是数据框连接不能返回字符串类型名称。 new_df_name_df = "user_" + region new_df_name_df = user_profile_region.join(shopee_backend_user_df, 'userid', 'left') 无法运行。
-
您可以使用一个将数据帧附加到的列表,然后将其减少为一个。或者您可以在循环中迭代地创建 result_df。
标签: python apache-spark dataframe pyspark spark-dataframe