【发布时间】:2018-03-20 15:39:50
【问题描述】:
我一直在研究是否应该在 NodeJS 或 Python 中执行一些数据工作。我创建了几个测试,这些测试似乎表明 NodeJS 使用的 Vectorious 模块可以以比 Python 的 Numpy 模块更快的速度执行矩阵运算。
以下是我编写的两个测试,用于测试模块之间的元素乘法。我想知道:
- 我是否正确设计了这些测试?我了解此类测试可能涉及大量复杂问题。
- 如果这些测试设计正确,那么如何在数据空间中强调 Numpy 的使用?
- 无论结果如何,为什么其中一个优于另一个?
我知道第二个和第三个问题可能会导致非常固执的答案,我更关注第一个问题,因为这会推动未来的发展。
NodeJS 逐元素乘法测试:
const v = require('vectorious'),
Matrix = v.Matrix;
const size = 25000;
console.log("NodeJS: Creating matrices...")
let matrixA = Matrix.random(size, size);
console.log("NodeJS: Matrix A created.")
let matrixB = Matrix.random(size, size);
console.log("NodeJS: Matrix B created.")
console.log("NodeJS: Starting... (matrixA(0,0):" + matrixA.get(0, 0) + ")(matrixA(24999,24999):" + matrixA.get(24999, 24999) + ")")
t = process.hrtime()
matrixA.product(matrixB)
t2 = process.hrtime(t);
console.log("%s %d seconds and %d nanoseconds", "NodeJS: Duration", t2[0], t2[1]);
console.log(matrixA.get(0, 0) + " | " + matrixB.get(0, 0))
console.log(matrixA.get(24999, 24999) + " | " + matrixB.get(24999, 24999))
Python 逐元素乘法测试:
import numpy as np
import time
size = 25000
print("Python: Creating matrices...")
matrix = np.random.uniform(0, 10, (size,size))
print("Python: Created matrix A.")
matrixB = np.random.uniform(0, 10, (size,size))
print("Python: Created matrix B.")
print("Starting matrix multiplication...")
start = time.perf_counter()
matrixC = np.multiply(matrix, matrixB)
end = time.perf_counter()
elapsed = end - start
print("elapsed time = {:.12f} seconds".format(elapsed))
print("-", matrix[0])
print("-", matrixC[0])
【问题讨论】:
-
我对 NodeJS 不熟悉。
matrixA.product(matrixB)是否将结果放回matrixA?在这种情况下,我想它会更快,因为操作是就地执行的,而np.multiply需要为matrixC分配内存。您可以通过预先分配matrixC并将其与out=matrixC一起传递给函数来使比较更公平。 (或者在 NodeJS 中使用非就地版本的乘法,哪个更适合您的需求。) -
我更新了 Numpy 测试以使用以下两行: 在性能计数器之外:
matrixC = np.random.uniform(0, 10, (size,size))|性能计数器内部:np.multiply(matrixA, matrixB, out=matrixC)这些更改导致所需时间增加了约 20 秒。
标签: python node.js performance numpy matrix