【问题标题】:split dataframe column header and values into multiple columns将数据框列标题和值拆分为多列
【发布时间】:2018-07-19 19:43:48
【问题描述】:

我在 Azure 上上传了我的 csv 文件,但由于某种原因,它变成了这样

 nominal;data;curs;cdx         Column 1
0          1;21.06.2000;28  2300;������ ���
1          1;22.06.2000;28  2200;������ ���
2          1;23.06.2000;28  1900;������ ���
3          1;24.06.2000;28  1700;������ ���
4          1;27.06.2000;28  1300;������ ���
5          1;28.06.2000;28  1100;������ ���

基本上不是四列nominaldatacurscdx 我有两列,其中一列包含所有值,最后一列(它是空的或其他什么,因为最后一列有编码问题) - 不知道是什么。

我已经删除了Column 1这样的专栏

import pandas as pd

def azureml_main(dataframe1 = None, dataframe2 = None):
    dataframe1.drop(['Column 1'], axis = 1, inplace = True)
    print('Input pandas.DataFrame #1:\r\n\r\n{0}'.format(dataframe1))
    return dataframe1,

现在如何将第一列拆分为多个?获得 4 个单独的列

我正在使用熊猫 0.18

【问题讨论】:

  • 问题是我通过 python 加载数据集但使用 azure 本身
  • 试试dataframe1['Column 1'].str.split(expand=True)
  • @xyzjayne 什么也没做dataframe1['nominal;data;curs;cdx'].str.split(expand=True)
  • 呃,拆分(';',expand=True)
  • dataframe1['nominal;data;curs;cdx'].str.split(';',expand=True) 仍然没有。但我想我必须首先对标题做一些事情,因为它们也必须被拆分,因为它返回 nominal;data;curs;cdx [Information] 0 1;21.06.2000;28

标签: python pandas azure-machine-learning-studio


【解决方案1】:

您需要使用以下方式拆分列:

dataframe1['nominal;data;curs;cdx'].str.split(';',expand=True)

然后更改标题:

dataframe1.columns = 'nominal;data;curs;cdx'.split(';')

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2017-03-29
    • 2013-08-04
    • 1970-01-01
    • 2023-03-03
    相关资源
    最近更新 更多