【发布时间】:2018-07-19 19:43:48
【问题描述】:
我在 Azure 上上传了我的 csv 文件,但由于某种原因,它变成了这样
nominal;data;curs;cdx Column 1
0 1;21.06.2000;28 2300;������ ���
1 1;22.06.2000;28 2200;������ ���
2 1;23.06.2000;28 1900;������ ���
3 1;24.06.2000;28 1700;������ ���
4 1;27.06.2000;28 1300;������ ���
5 1;28.06.2000;28 1100;������ ���
基本上不是四列nominal、data、curs、cdx 我有两列,其中一列包含所有值,最后一列(它是空的或其他什么,因为最后一列有编码问题) - 不知道是什么。
我已经删除了Column 1这样的专栏
import pandas as pd
def azureml_main(dataframe1 = None, dataframe2 = None):
dataframe1.drop(['Column 1'], axis = 1, inplace = True)
print('Input pandas.DataFrame #1:\r\n\r\n{0}'.format(dataframe1))
return dataframe1,
现在如何将第一列拆分为多个?获得 4 个单独的列
我正在使用熊猫 0.18
【问题讨论】:
-
问题是我通过 python 加载数据集但使用 azure 本身
-
试试
dataframe1['Column 1'].str.split(expand=True) -
@xyzjayne 什么也没做
dataframe1['nominal;data;curs;cdx'].str.split(expand=True) -
呃,拆分(';',expand=True)
-
dataframe1['nominal;data;curs;cdx'].str.split(';',expand=True)仍然没有。但我想我必须首先对标题做一些事情,因为它们也必须被拆分,因为它返回nominal;data;curs;cdx [Information] 0 1;21.06.2000;28
标签: python pandas azure-machine-learning-studio