【问题标题】:How to apply a list comprehension in Panda Dataframe?如何在 Pandas Dataframe 中应用列表理解?
【发布时间】:2020-09-18 22:44:03
【问题描述】:

list 的值中,我尝试识别总和超过 10 的任何连续值对

a = [1,9,3,4,5]

...所以我写了一个for 循环...

values = []
for i in range(len(a)-2):
    if sum(a[i:i+2]) >10:
        values += [a[i:i+2]]

...我将其重写为列表理解...

values = [a[i:i+2] for i in range(len(a)-2) if sum(a[i:i+2]) >10]

两者产生相同的输出:

values = [[1,9], [9,3]]

我的问题是如何最好地在 DataFrame 中应用上述列表理解。

这是示例 5 行 DataFrame

import pandas as pd
df = pd.DataFrame({'A': [1,1,1,1,0], 
                   'B': [9,8,3,2,2],
                   'C': [3,3,3,10,3],
                   'E': [4,4,4,4,4],
                   'F': [5,5,5,5,5]})
df['X'] = df.values.tolist()

在哪里: - a 在 df['X'] 中,这是 A - F 列的值列表

df['X'] = [[1,9,3,4,5],[1,8,3,4,5],[1,3,3,4,5],[1,2,10,4,5],[0,2,3,4,5]]
  • 并且,列表理解的结果将存储在新列df['X1]

期望的输出是:

df['X1'] = [[[1,9], [9,3]],[[8,3]],[[NaN]],[[2,10],[10,4]],[[NaN]]]

谢谢。

【问题讨论】:

  • 请为输入设置一个小样本数据框,为所需输出设置一个。
  • 如果您在设置示例数据帧时遇到问题,可以查看this reference post
  • 谢谢。添加了示例数据框
  • 该示例数据框有点太大而无法使用。您能否将其限制为具有确定性(非随机生成)值的六行,好吗?另外,请发布您想要的该示例的结果。谢谢。
  • 顺便说一句,我需要在这里看到所需的结果,因为不清楚您希望新列如何适应原始数据框。因为您的代码可以生成比原始列短的列表。

标签: pandas list list-comprehension


【解决方案1】:

您可以使用 pandas 应用函数,并将您的列表推导式放入其中。

df = pd.DataFrame({'A': [1,1,1,1,0], 
                   'B': [9,8,3,2,2],
                   'C': [3,3,3,10,3],
                   'E': [4,4,4,4,4],
                   'F': [5,5,5,5,5]})

df['x'] = df.apply(lambda a: [a[i:i+2] for i in range(len(a)-2) if sum(a[i:i+2]) >= 10], axis=1)

#Note the axis parameters tells if you want to apply this function by rows or by columns, axis = 1 applies the function to each row.

这将给出 df['X1'] 中所述的输出

【讨论】:

    猜你喜欢
    • 2020-12-08
    • 2021-02-13
    • 2019-11-05
    • 1970-01-01
    • 2019-08-31
    • 1970-01-01
    • 1970-01-01
    • 2017-12-03
    • 2018-04-07
    相关资源
    最近更新 更多