【发布时间】:2020-02-26 19:34:10
【问题描述】:
ok 我正在尝试合并来自不同 Excel 文件的列。例如,一个文件有地址 1、地址 2、城市、州、邮编,另一个有位置地址、城市、州、邮编。 我附加了 excel 文件,您可以从下面的代码中看到,我合并了第一组列没有问题。问题是结合第二组列欢迎任何提示。下图是我正在寻找的结果
import os
import pandas as pd
import numpy as np
path = os.getcwd()
files = os.listdir(path)
files_xls = [f for f in files if f[-4:] == 'xlsx']
df = pd.DataFrame()
for f in files_xls:
qw = pd.read_excel(f)
df = df.append(qw)
df = df.replace(np.nan,' ', regex=True)
cf = df.iloc[:, df.columns.str.contains('address1|address2|city|state|zip|Location Address|City|State|ZIP', case=False)]
vf= df['address1'].map(str) + '-' + df['address2'].map(str) + '-' + df['city'].map(str) + '-' + df['state'].map(str) + '-' + df['zip'].map(str),
df['Location Address'].map(str) + '-' + df['City'].map(str) + '-' + df['State'].map(str) + '-' + df['ZIP'].map(str)
export_csv = vf.to_csv('dataframe.csv', index=None, header=True)
【问题讨论】:
-
你能提供输入和预期输出吗?
-
this blog 可能会有所帮助
-
我添加了输出的图片。输入只是一个 Excel 文件,地址位于不同的列中。
标签: python pandas dataframe data-science