为什么对稀疏矩阵求和会留下一个空维度？答案

【问题标题】：Why does summing a sparse matrix leave an empty dimension?为什么对稀疏矩阵求和会留下一个空维度？
【发布时间】：2018-05-16 02:55:25
【问题描述】：

当对numpy.ndarray求和时，它会降低数组的维数，除非我们设置keepdims=True。然而，对于 Scipy 的稀疏矩阵来说，这似乎并非如此：

import scipy.sparse

matrix = scipy.sparse.coo_matrix([[0, 1], [2, 1]])
print(matrix.shape)                 # (2, 2) as expected.
print(matrix.sum().shape)           # () as expected.
print(matrix.sum(axis=0).shape)     # (1, 2) but expected (2,).
print(matrix.sum(axis=0)[0].shape)  # (1, 2) but expected (2,).

如示例中的最后一行所示，我什至无法选择结果向量。此外，尝试将总和的结果转换为密集的 Numpy 数组失败：

matrix.toarray()              # This works.
matrix.sum(axis=0).toarray()  # AttributeError: 'matrix' has no 'toarray'.

如何计算稀疏矩阵沿一维的总和并获得密集数组的结果？

【问题讨论】：

我认为这是因为它是一个“矩阵”而不是一个数组。因此你必须有两个维度。
@PaulH 为什么我可以将原始矩阵转换为 Numpy 数组，而不是从总和返回的对象？
稀疏矩阵 vs numpy.matrix?
你是对的，总和返回一个 Numpy 矩阵，所以 np.asarray(matrix.sum(axis=0))[0] 有效。这应该被视为 Scipy 中的错误吗？如果它无论如何都返回一个 Numpy 对象，那么支持正确排名的 numpy.ndarray 类型会更适合。
与np.matrix、which also produces a matrix from sum一致。

标签： python scipy sparse-matrix

【解决方案1】：

一个稀疏矩阵，虽然是一个不同的类（类取决于格式），但它试图表现得像np.matrix（反过来又表现得像一个老式的 MATLAB 矩阵）。它的形状始终是 2d，索引、求和和相关操作返回 2d。

In [172]: M = sparse.csr_matrix([[0,1],[2,1]])
In [173]: M
Out[173]: 
<2x2 sparse matrix of type '<class 'numpy.int32'>'
    with 3 stored elements in Compressed Sparse Row format>

总和产生一个标量或 0d 数组：

In [174]: M.sum()
Out[174]: 4
In [175]: _.shape
Out[175]: ()
In [176]: type(__)
Out[176]: numpy.int32

轴和产生一个二维列或行向量密集矩阵：

In [177]: M.sum(axis=0)
Out[177]: matrix([[2, 2]], dtype=int32)
In [178]: _.shape
Out[178]: (1, 2)
In [179]: M.sum(axis=1)
Out[179]: 
matrix([[1],
        [3]])
In [180]: _.shape
Out[180]: (2, 1)

这与从密集矩阵得到的行为相同，例如M.todense()。 keepdims=True 为数组提供了类似的东西（来自 MATLAB 的人抱怨 sum 减少了维度）。

密集矩阵有一个方便的.A1 属性，可以将其转换为一维数组：

In [181]: M.sum(axis=1).A1
Out[181]: array([1, 3])
In [182]: M.sum(axis=0).A1
Out[182]: array([2, 2], dtype=int32)

.A 适用于稀疏矩阵和稠密矩阵，但只有稀疏矩阵有toarray 方法（和todense）。就像我说的，sparse 模仿了密集矩阵，但不是子类。

稀疏轴求和实际上是做矩阵乘法；密集矩阵 * 稀疏矩阵产生密集矩阵：

In [186]: M*np.matrix([[1],[1]])
Out[186]: 
matrix([[1],
        [3]], dtype=int32)
In [187]: np.matrix([[1,1]])*M
Out[187]: matrix([[2, 2]], dtype=int32)

关于数组总和没有留下这个“空”（单数是一个术语，1 不是 0）维度的投诉：

Why does the shape remains same when I sum a square numpy array along either directions?

【讨论】：