从矩阵中提取匹配的行并对它们进行平均并生成一个新矩阵答案

【问题标题】：extract matching rows from a matrix and average them and produce a new matrix从矩阵中提取匹配的行并对它们进行平均并生成一个新矩阵
【发布时间】：2019-05-21 11:46:59
【问题描述】：

我有两个包含唯一行的矩阵。另外，我还有另一个没有唯一行的矩阵。我必须从第二个矩阵中选择与第一个矩阵相关的唯一行，如果两行具有相同的名称，则必须将值计算为两行的平均值。

第一个矩阵： Click To download the first Matrix

FIRST MATRIX

第二个矩阵： Click to download the second matrix

SECOND MATRIX

【问题讨论】：

不清楚你要达到什么目的？
您能以dput 格式发布示例数据吗？请使用dput(MAT) 的输出编辑问题。或者，如果 dput(head(MAT, 20)) 的输出太大。（MAT 是每个矩阵的名称。）
能发邮件吗
@RummanAnsari：我们鼓励问题作者在问题中提供必要的细节，以便问题可以公开解决。这意味着这种帮助也可能使未来的读者受益。因此，我们要求minimal reproducible example。如果确实无法解决问题——这种情况非常罕见——那么这个问题可能不适合 Stack Overflow。
我们知道您有超过 5 个基因的矩阵，但减少它的目的是帮助您更快。所以将你的矩阵减少到最大值。每个矩阵 5 个基因，这在示例中对您来说是最重要的。还回答其他海报问题。不回答看起来有点粗鲁，我觉得你不是这样的人。

标签： python r matrix bioinformatics

【解决方案1】：

由于 OP 不提供使用的完整脚本代码，我只能提供与矩阵（数据库、列表等）迭代步骤相关的一般答案：

...snippet... # all import and other processing scriptcode here...

x = matrix1
y = matrix2

count1    = 0  # matrix 1
count2    = 0  # matrix 2
count_dbl = 0  # summary of encountered doubles within both matrixes

for item1 in x:
    count1 +=1
    for item2 in y:
            count2 += 1
        if item1 == item2:
            ..do whatever you need to do here...
            count_dbl+=1

        else:
            ... do something else here...
            pass

 print ('validation check on items in matrix 1: %s - 2: %s. Doubles: %s' % (count1, count2, count_dbl)

提示：item1 或 2 可以是处理 readline 信息的方法，例如xml或excel文件等

享受；p

【讨论】：