【发布时间】:2018-01-02 19:44:45
【问题描述】:
我在面对数据框时遇到了问题。可以说,我有一个数据框,其中一列包含值(范围为 0 到 100000)。一个例子:
TCGA.CG.4462
ENSG00000000003 4.7574661
ENSG00000000005 0.0000000
ENSG00000000419 24.1066335
ENSG00000000457 2.7631012
ENSG00000000460 0.8928772
我想通过以下 5 个类别添加一个新列,其中包含列数据的概率:
- non_expressed [0]
- low_expressed ]0,1]
- normal_expressed ]1,10]
- high_expressed [10,100]
- very_high_expressed > 100
因此,例如,我想在新列中添加的值是:
- non_expressed:0.2
- low_expressed 0.2
- normal_expressed:0.4
- high_expressed:0.2
- very_high_expressed:0.0
所以我的数据框变成了这样:
TCGA.CG.4462 Prob
ENSG00000000003 4.7574661 0.4
ENSG00000000005 0.0000000 0.2
ENSG00000000419 24.1066335 0.2
ENSG00000000457 2.7631012 0.4
ENSG00000000460 0.8928772 0.2
我已经尝试了很多不同的方法,但是到目前为止都没有奏效。我认为 if 条件将是解决我的问题的最佳方法,但是,if 条件会给出错误,因为条件的长度> 1。 谁能告诉我解决这个问题的最佳方法是什么?
【问题讨论】: