【发布时间】:2023-03-23 03:25:01
【问题描述】:
我已经实现了以下神经网络来解决 Python 中的 XOR 问题。我的神经网络由 3 个神经元的输入层、2 个神经元的 1 个隐藏层和 1 个神经元的输出层组成。我使用 Sigmoid 函数作为隐藏层和输出层的激活函数:
import numpy as np
x = np.array([[0,0,1], [0,1,1],[1,0,1],[1,1,1]])
y = np.array([[0,1,1,0]]).T
np.random.seed(1)
weights1 = np.random.random((3,2)) - 1
weights2 = np.random.random((2,1)) - 1
def nonlin(x,deriv=False):
if(deriv==True):
return x*(1-x)
return 1/(1+np.exp(-x))
for iter in xrange(10000):
z2 = np.dot(x,weights1)
a2 = nonlin(z2)
z3 = np.dot(a2,weights2)
a3 = nonlin(z3)
error = y- a3
delta3 = error * nonlin(z3,deriv=True)
l1error = delta3.dot(weights2.T)
delta2 = l1error *nonlin(z2, deriv=True)
weights2 += np.dot(a2.T, delta3)
weights1 += np.dot(x.T,delta2)
print(a3)
反向传播似乎是正确的,但我不断收到此错误,所有值都变为“nan”,输出:
RuntimeWarning: overflow encountered in exp
return 1/(1+np.exp(-x))
RuntimeWarning: overflow encountered in multiply
return x*(1-x)
[[ nan]
[ nan]
[ nan]
[ nan]]
你能帮我解决这个问题吗?谢谢。
【问题讨论】:
-
调试以找出引入 NaN 的位置。一旦在数学方程式中使用了 NaN,其他所有涉及的内容都会变成 NaN,并且会污染您的结果。查找导致 NaN 出现在 Python 数学中的原因,并找到导致它出现的点。
-
哦,再读一遍,它会告诉你它已经发生的确切位置。你的求幂溢出了。你的指数可能太大了。发生溢出时检查
x的值。这可能是出于某种原因。 -
你不需要那么多神经元来解决异或。它可以用 2 个输入、隐藏层 2 个神经元和输出层 1 个神经元来解决
-
@SumNeuron 正如你所说,我在隐藏中使用了 2 个神经元,在输出中使用了一个神经元
-
@vardaan 你还有一个“3 个神经元的输入层”
标签: python-2.7 neural-network xor