【问题标题】:Combining mixed data types in pandas column在 pandas 列中组合混合数据类型
【发布时间】:2018-05-12 13:40:07
【问题描述】:

我在名为“Year”的数据框中有一列。当我调用时;

filtered_df['Year'].unique()

我的结果是:

数组([2013, 2012, 2014, 2015, 2016, 2017, 2011, 2010, 2009, 2008, '2011', '2010', '2015', '2009', 'N 117 ST / GREENWOOD AV N'], dtype=object)

我想将'2011','2010', '2015', and '2009' 实例的结果与其非字符串对应项的结果结合起来。我认为可以使用正则表达式来做到这一点,但迄今为止我尝试过的唯一事情都返回了错误,这让我相信我的方法本身就有缺陷,所以我没有将它们包括在这里。

对于这个问题的计算有效解决方案有什么想法吗?

【问题讨论】:

  • 您的预期输出是什么?从您的问题中不清楚。
  • 如果您决定尝试正则表达式,我强烈建议您搜索“在线正则表达式测试器”,例如pythex.org。我发现它们对于在编码之前编写和测试正则表达式非常宝贵。

标签: python pandas dataframe


【解决方案1】:

通常我们通过以下方式将其转换为数值(所有不可转换的值都会转换为NaN's):

filtered_df['Year'] = pd.to_numeric(filtered_df['Year'], errors='coerce')

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2021-01-07
    • 2020-02-06
    • 1970-01-01
    • 2021-01-19
    • 2018-05-19
    • 2014-04-28
    • 2020-08-04
    • 2014-10-21
    相关资源
    最近更新 更多