【问题标题】:Adding columns to dataframe that show boolean based on column data type in python根据python中的列数据类型将列添加到显示布尔值的数据框中
【发布时间】:2020-04-04 00:16:15
【问题描述】:

我正在尝试根据确定正在迭代的当前列是字母数字、字母还是数字,将列添加到布尔值的数据框中。不幸的是,对于每个布尔测试,每一列都给出了 False。目标是对于给定的列,如何添加另一列来显示给定列中的行是否为字母数字?我不想遍历列中的每一行,因为这非常耗时。我需要这样做,因为在某些情况下我不知道给定列中将包含什么数据类型。

def add_numeric_alpha_alphanum_tests(dataframe, dataframe_column_names):
    for column_name in dataframe_column_names:
        column_name_is_alphanumeric = column_name + "_is_alphanumeric"
        data_to_test = str(dataframe[column_name].values)
        dataframe[column_name_is_alphanumeric] = np.where(data_to_test.isalnum(), True, False)
        column_name_is_alpha = column_name + "_is_alpha"
        dataframe[column_name_is_alpha] = np.where(data_to_test.isalpha(), True, False)
        column_name_is_digit = column_name + "_is_digit"
        dataframe[column_name_is_digit] = np.where(data_to_test.isdigit(), True, False)
    return dataframe

【问题讨论】:

    标签: python pandas dataframe alphanumeric non-alphanumeric


    【解决方案1】:

    您可以在 Pandas 中使用apply 功能,从而享受效率,例如:

    dataframe['column1_is_alphanumeric'] = dataframe['column1'].apply(lambda x: True if str(x).isalnum() else False)
    dataframe['column1_is_alpha'] = dataframe['column1'].apply(lambda x: True if str(x).isalpha() else False)
    dataframe['column1_is_digit'] = dataframe['column1'].apply(lambda x: True if str(x).isdigit() else False)
    

    【讨论】:

    • 这些分配的右侧如何知道正在测试数据框的哪一列?似乎 x 是数据框中的一行,但我没有看到列名称。
    • @ToddBaker 我的错,更新了代码。您现在可以看到它在右侧指定了我们正在测试的列:)
    猜你喜欢
    • 2020-05-20
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多