【问题标题】:How to split on commas and then remove the commas in a python pandas dataframe如何在逗号上拆分然后删除python pandas数据框中的逗号
【发布时间】:2021-03-30 15:27:00
【问题描述】:

我想以逗号分隔,然后删除逗号。我从一个从 csv 文件中读取的包含 2 列的数据框开始。

[name] [feature1, feature2, feature3] - 特征都在一个单元格中,每一行可能有不同数量的特征。

我使用此代码从主 df 制作了一个子 df(为此拉出我想要的 2 列):

df_features =df.loc[:,['name','features']]

然后在 features 列上拆分以使用以下代码将它们分隔:

df_features_split = df_features.features.str.split(expand=True,)

它将功能分成我想要的自己的列,但在文本之后留下逗号。我想摆脱它。我试过了:

df_features_split=df_features_split.replace(',', '')

但它不会删除逗号,我认为它可能需要更具体,但我不太确定。任何帮助将不胜感激。

这是我的 df 拆分之前的示例。对不起,我希望格式没问题。 df 有 2 行。

1   The Beehive Loop Trail  beach,  dogs-no,    forest, lake,   views,  wild-flowers,   wildlife
2   Cadillac North Ridge Trail  dogs-leash, forest, kids,   partially-paved,    views,  wild-flowers,   wildlife

谢谢!

【问题讨论】:

  • 您可以添加一个预先拆分的数据框样本吗?

标签: python pandas


【解决方案1】:

你真的很接近答案。你错过的是pandas.Series.str.split()pat 参数。

df_features_split = df.features.str.split(pat=',', expand=True)

【讨论】:

    猜你喜欢
    • 2014-02-11
    • 1970-01-01
    • 2020-07-01
    • 1970-01-01
    • 2022-12-31
    • 2018-09-12
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多