【问题标题】:extract matching rows from a matrix and average them and produce a new matrix从矩阵中提取匹配的行并对它们进行平均并生成一个新矩阵
【发布时间】:2019-05-21 11:46:59
【问题描述】:

我有两个包含唯一行的矩阵。另外,我还有另一个没有唯一行的矩阵。我必须从第二个矩阵中选择与第一个矩阵相关的唯一行,如果两行具有相同的名称,则必须将值计算为两行的平均值。

第一个矩阵: Click To download the first Matrix

FIRST MATRIX

第二个矩阵: Click to download the second matrix

SECOND MATRIX

【问题讨论】:

  • 不清楚你要达到什么目的?
  • 您能以dput 格式发布示例数据吗?请使用dput(MAT) 的输出编辑问题。或者,如果 dput(head(MAT, 20)) 的输出太大。 (MAT 是每个矩阵的名称。)
  • 能发邮件吗
  • @RummanAnsari:我们鼓励问题作者在问题中提供必要的细节,以便问题可以公开解决。这意味着这种帮助也可能使未来的读者受益。因此,我们要求minimal reproducible example。如果确实无法解决问题——这种情况非常罕见——那么这个问题可能不适合 Stack Overflow。
  • 我们知道您有超过 5 个基因的矩阵,但减少它的目的是帮助您更快。所以将你的矩阵减少到最大值。每个矩阵 5 个基因,这在示例中对您来说是最重要的。还回答其他海报问题。不回答看起来有点粗鲁,我觉得你不是这样的人。

标签: python r matrix bioinformatics


【解决方案1】:

由于 OP 不提供使用的完整脚本代码,我只能提供与矩阵(数据库、列表等)迭代步骤相关的一般答案:

...snippet... # all import and other processing scriptcode here...

x = matrix1
y = matrix2

count1    = 0  # matrix 1
count2    = 0  # matrix 2
count_dbl = 0  # summary of encountered doubles within both matrixes

for item1 in x:
    count1 +=1
    for item2 in y:
            count2 += 1
        if item1 == item2:
            ..do whatever you need to do here...
            count_dbl+=1

        else:
            ... do something else here...
            pass

 print ('validation check on items in matrix 1: %s - 2: %s. Doubles: %s' % (count1, count2, count_dbl)

提示:item1 或 2 可以是处理 readline 信息的方法,例如xml或excel文件等

享受;p

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2018-05-03
    • 2018-03-16
    • 1970-01-01
    • 2016-07-04
    • 1970-01-01
    • 2016-09-04
    相关资源
    最近更新 更多