【发布时间】:2021-12-02 11:07:53
【问题描述】:
我真的不知道如何表达这个,所以我希望它可以理解。 我有一个包含数千行和几列的大型 csv 文件,基本上是这样的:
| Class | DBE | Abundance | H/C | N/C | O/C |
|---|---|---|---|---|---|
| Class 1 | 1 | 10000 | 0.9 | 0.08 | 0.8 |
| Class 1 | 2 | 50000 | 0.8 | 0.08 | 0.6 |
| Class 2 | 1 | 20000 | 0.9 | 0.06 | 0.5 |
| Class 2 | 1 | 30000 | 0.8 | 0.08 | 0.8 |
| ... | ... | ... | ... | ... | ... |
...
我想获得每个相同类别的总丰度(因此总结第 1 类、第 2 类等的所有丰度)和每个相同 DBE。我还想要一组 (H/C, N/C) 和一组 (H/C, O/C) 的总丰度。我是手动开始的,但它很长,所以我希望使用 python,因为我对它了解一点,而且它似乎有用于计算的库。实现这一目标的最佳方法是什么? numpy 中的这个直方图函数看起来很有趣,但需要知道“bins”。编写一些东西来滚动表格似乎有点过头了。
提前致谢
【问题讨论】:
-
您检查过
pandas库及其groupby函数吗? -
totals = df.groupby(["Class"]).sum()
标签: python data-science