【发布时间】:2014-01-24 02:29:15
【问题描述】:
如何快速创建包含“文件”列中包含的三个块的新列?
收到这样乱七八糟的数据
d = { 'File' : pd.Series(['firstname lastname 05/31/1996 9999999999 ', 'FN SometimesMiddileInitial. LN 05/31/1996 9999999999 ']),
'Status' : pd.Series([0., 0.]),
'Error' : pd.Series([2., 2.])}
df=pd.DataFrame(d)
更新 实际上,我从一个非常混乱的 excel 文件开始,我的数据在字符串字符之间有 '\xa0 \xa0'。 所以我的第一次尝试看起来像
from pandas import DataFrame, ExcelFile
import pandas as pd
location = r'c:/users/meinzerc/Desktop/table.xlsx'
xls = ExcelFile(location)
table = xls.parse('Sheet1')
splitdf = df['File'].str.split('\s*)
我的尝试根本不起作用。为什么?
【问题讨论】: