【发布时间】:2016-09-13 07:24:36
【问题描述】:
我正在尝试计算测试集中每个点到训练集中每个点的距离:
这就是我的循环现在的样子:
for x in testingSet
for y in trainingSet
print numpy.linalg.norm(x-y)
其中 testingSet 和 trainingSet 是 numpy 数组,其中两组的每一行都保存一个示例的特征数据。
但是,由于我的数据集较大(测试集为 3000,训练集约为 10,000),它的运行速度非常慢,需要 10 多分钟。这与我的方法有关还是我错误地使用了 numPY?
【问题讨论】:
标签: python numpy machine-learning