【发布时间】:2017-12-09 05:17:12
【问题描述】:
例如,我有一个 Symbol 和 Quantity 列。
AAA 1000000
AAA 1000000
AAA 1000000
BBB 5000000
CCC 1000000
CCC 1000000
基本上看起来像
AAA 3000000
BBB 5500000
CCC 2000000
在Rayhane的建议下尝试:
import pandas as pd
a = pd.read_csv("file.csv")
df = pd.DataFrame(a)
df['Quantity'] = df.groupby(['Symbol']).transform('sum')
df.drop_duplicates(inplace=True)
奇怪的是,代码看起来可以正常工作,但行数保持不变。 (5000 行,我预计它会下降到 2000 行)。有人可以验证我的代码吗?
【问题讨论】:
-
能否说得更具体些?
-
你愿意使用 pandas 库吗?
-
是的,我想知道 pandas 包中是否有一个简单的命令
-
另外,对于格式错误,我深表歉意。第一次发帖!现在应该更好看。
-
您是否还需要帮助从您的 excel 文件读取数据帧,或者是否已处理好?