【发布时间】:2019-08-24 05:38:37
【问题描述】:
我正在尝试规范化数据框中的行值。需要规范化的值在其列标题中包含文本“计数”。还有其他列的标题中没有“计数”一词,我希望它们保持不变。我有一个归一化值,它位于名为“归一化值”的列中。
因此,在逐行迭代中,每行的归一化值需要乘以属于标题包含单词“count”的列的每个值。这个数据框有一个我想保留的多索引,并且有很多列和行,所以我需要在不指定确切位置或名称的情况下执行此操作。
我尝试了乘法、广播、迭代、用户定义函数的变体,但无济于事。
这是我的示例数据框:
Sample Timepoint CountA CountB PercentA PercentB CountC Normalization Value
1 1 10 20 40 30 50 .1
2 1 20 10 25 35 100 .2
2 2 50 20 20 22 40 .5
这是我希望数据框在标准化计数后的样子:
Sample Timepoint CountA CountB PercentA PercentB CountC Normalization Value
1 1 1 2 40 30 5 .1
2 1 4 2 25 35 20 .2
2 2 25 10 20 22 20 .5
【问题讨论】:
-
似乎与此非常相似:stackoverflow.com/questions/55382352/…。使用过滤器、Index.str.contains 或列表理解对列进行子集化,然后沿axis=0 相乘
-
此解决方案似乎有效,谢谢。
标签: python pandas function dataframe iteration