【发布时间】:2017-11-06 03:02:54
【问题描述】:
我在 Python 中有两个数据框,如下所示
df1
CUSTOMER_KEY LAST_NAME FIRST_NAME
30 f2b6769129 97bb97bebc
46 ca0464878d e276539bc2
51 62f2905a7a 8dfabd6d61
57 21032ca3bc 1f7e5e0c6e
62 f7e7fdd8ce eb6cf4af99
64 f536998bbb 7fc39eacd1
80 6069198f63 d873a71620
99 0ba61a6f66 a6cf7af3eb
102 e8b579b776 c8048fd459
df2
CUSTOMER_KEY LAST_NAME FIRST_NAME
30 Arthur Anderson
46 Teresa Johns
51 Louise Hurwitz
57 Timothy Addy
62 Jeffery Wilson
64 Andres Tuller
80 Daniel Green
99 Frank Nader
102 Faith Young
我想在Customer_key 上加入这两个数据框(我可以在 Merge 中完成),然后在数据框中的几列上连接以在结果数据框中形成一个新字符串。从下面的数据框中,我正在寻找的结果如下
result_df
CUSTOMER_KEY LAST_NAME FIRST_NAME
30 Artf2b676 And97bb97
46 Terca0464 Johe27653
基本上,df2 中的 substring(last_name,1,4) 和 df1 中的 substring(last_name,1,6) 并将它们连接到新列中。其他列类似。
请问我怎样才能做到这一点。
感谢和问候
巴拉
【问题讨论】: