【发布时间】:2016-10-16 05:43:37
【问题描述】:
我对python很陌生。搜索以前的问题我找不到这个问题的答案。
对于一个项目,我必须分析大量 .txt 文件并始终对其执行相同的计算。使用 pandas 创建数据框,效果很好。
我想要一个对其他列执行计算的额外列,例如 c = a + b。 对于简单的计算,这很好用:
In [41]: import pandas as pd
In [42]: import numpy as np
In [43]: df = pd.DataFrame(np.random.randn(10,2),columns=list('ab'))
In [44]: df
Out[45]:
a b
0 0.163138 -1.261099
1 0.094772 -0.553349
2 -1.677519 -0.966680
3 1.732083 -1.118715
4 0.172240 -0.404648
5 0.270712 0.089841
6 0.589787 1.569790
7 0.822016 0.857993
8 -0.269941 0.586059
9 -0.152639 0.240438
In [46]: df["c"] = df["a"] + df["b"]
In [47]: df
Out[48]:
a b c
0 0.163138 -1.261099 -1.097961
1 0.094772 -0.553349 -0.458577
2 -1.677519 -0.966680 -2.644198
3 1.732083 -1.118715 0.613368
4 0.172240 -0.404648 -0.232407
5 0.270712 0.089841 0.360554
6 0.589787 1.569790 2.159576
7 0.822016 0.857993 1.680010
8 -0.269941 0.586059 0.316118
9 -0.152639 0.240438 0.087800
使用更“复杂”的计算时遇到的问题:
# C1 and C2 are some constants needed for the calculations
In [49]: C1 = 1.5
In [50]: C2 = 2.5
In [51]: df["c"] = df["a"] + [(C1 * df["a"]) + (C2 * df["b"] ** 2)]
Exception: Data must be 1-dimensional
这个问题有解决方法吗?还是我处理的完全错误?
【问题讨论】:
标签: excel python-3.x pandas calculated-columns