【问题标题】:understanding numpy np.tensordot理解 numpy np.tensordot
【发布时间】:2021-04-20 10:03:50
【问题描述】:
arr1 = np.arange(8).reshape(4, 2)
arr2 = np.arange(4, 12).reshape(2, 4)
ans=np.tensordot(arr1,arr2,axes=([1],[0]))
ans2=np.tensordot(arr1,arr2,axes=([0],[1]))
ans3 = np.tensordot(arr1,arr2, axes=([1,0],[0,1]))

我试图了解这个 tensordot 函数是如何工作的。我知道它会返回张量点积。

但轴部分对我来说有点难以理解。我所观察到的

对于 ans 来说,就像数组 arr1 中的列数和 arr2 中的行数构成了最终矩阵。

对于 ans2,它是 arr2 中的列数和 arr1 中的行数的另一种方式

我不明白轴=([1,0],[0,1])。让我知道我对 ans 和 ans2 的理解是否正确

【问题讨论】:

    标签: python python-3.x numpy multidimensional-array tensordot


    【解决方案1】:

    你忘了显示数组:

    In [87]: arr1
    Out[87]: 
    array([[0, 1],
           [2, 3],
           [4, 5],
           [6, 7]])
    In [88]: arr2
    Out[88]: 
    array([[ 4,  5,  6,  7],
           [ 8,  9, 10, 11]])
    In [89]: ans
    Out[89]: 
    array([[  8,   9,  10,  11],
           [ 32,  37,  42,  47],
           [ 56,  65,  74,  83],
           [ 80,  93, 106, 119]])
    In [90]: ans2
    Out[90]: 
    array([[ 76, 124],
           [ 98, 162]])
    In [91]: ans3
    Out[91]: array(238)
    

    ans 只是普通的点,矩阵乘积:

    In [92]: np.dot(arr1,arr2)
    Out[92]: 
    array([[  8,   9,  10,  11],
           [ 32,  37,  42,  47],
           [ 56,  65,  74,  83],
           [ 80,  93, 106, 119]])
    

    dot sum-of-products 在arr1([1],[0]) 轴1 和arr2 的轴0 上执行(常规跨列,沿行向下)。使用 2d 'sum across ...' 短语可能会令人困惑。处理 1 或 3d 数组时更清楚。这里将匹配大小的 2 个维度相加,留下 (4,4)。

    ans2 反转它们,对 4 求和,产生 (2,2):

    In [94]: np.dot(arr2,arr1)
    Out[94]: 
    array([[ 76,  98],
           [124, 162]])
    

    tensordot 刚刚转置了 2 个数组并执行了常规的dot

    In [95]: np.dot(arr1.T,arr2.T)
    Out[95]: 
    array([[ 76, 124],
           [ 98, 162]])
    

    ans3 使用转置和整形 (ravel),在两个轴上求和:

    In [98]: np.dot(arr1.ravel(),arr2.T.ravel())
    Out[98]: 238
    

    一般来说,tensordot 混合使用转置和重塑来将问题简化为二维np.dot 问题。然后它可能会重塑和转置结果。

    我发现einsum 的尺寸控制更清晰:

    In [99]: np.einsum('ij,jk->ik',arr1,arr2)
    Out[99]: 
    array([[  8,   9,  10,  11],
           [ 32,  37,  42,  47],
           [ 56,  65,  74,  83],
           [ 80,  93, 106, 119]])
    In [100]: np.einsum('ji,kj->ik',arr1,arr2)
    Out[100]: 
    array([[ 76, 124],
           [ 98, 162]])
    In [101]: np.einsum('ij,ji',arr1,arr2)
    Out[101]: 238
    

    随着einsummatmul/@ 的发展,tensordot 的必要性越来越少。它更难理解,并且没有任何速度或灵活性优势。不要担心理解它。

    ans3 是其他 2 个答案的轨迹(对角线之和):

    In [103]: np.trace(ans)
    Out[103]: 238
    In [104]: np.trace(ans2)
    Out[104]: 238
    

    【讨论】:

      【解决方案2】:

      据我从 tensordot 文档中了解到的,您提供的是 ans、ans2 和 ans3 中的轴列表(ans 和 ans2 只有一个元素在列表中)。然后,此列表指定要对哪些轴求和。您对 ans 和 ans2 的假设是正确的,其中在 ans 中,您的第一个元素是 arr1 的 0 轴(arr1 中的行)和 arr2 中的 1 轴(arr2 中的列)。我不完全确定对 ans3 有什么期望,但我可能会尝试自己运行一些示例并查看一下。我希望这能让你更好地理解

      链接:https://numpy.org/doc/stable/reference/generated/numpy.tensordot.html

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 1970-01-01
        • 2015-08-13
        • 2020-04-03
        • 2014-09-26
        • 2020-09-09
        • 2023-03-28
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多