预测粒子角度变化的 Keras 神经网络无法正确预测答案

【问题标题】：Keras neural network to predict change in angle of a particle is not predicting correctly预测粒子角度变化的 Keras 神经网络无法正确预测
【发布时间】：2020-08-06 18:37:35
【问题描述】：

我已经建立了一个 keras 回归模型来预测单个粒子在提供有关该粒子的数据时的角度变化。为了获取数据，我创建了一个程序来模拟 n 个粒子之间的布朗运动。除了随机的角度噪声外，根据粒子之间的距离，它们会引起彼此角度的变化。

我的代码如何工作并不重要，但本质上它会输出一个数组，其中包含所有粒子相对于单个粒子的 x、y 坐标、所有粒子的 theta 值以及所有粒子与单个粒子。在每个时间步都可以找到所有这些参数。我用来训练网络的每个“图像”都是某个时间点的所有这些参数。所以总的来说，输入变量是x,y,angle,distance，输出变量是目标粒子的theta变化

对于我的神经网络，我首先将所有数据标准化为介于 -1 和 1 之间，然后对其进行整形以输入 NN：

import numpy as np
import matplotlib.pyplot as plt
from keras.models import Sequential
from keras.layers import Dense
from keras.layers import Dropout

## NORMALIZE IMAGES ##########################################################

# all images and labels imported, so obviously wont run without data. This is
# designed for running data with m iterations, n particles, 4 parameters
# (size of test data array is [m,n,4]). 

L = 5
# length of 'box' that houses particles
n = 10
# number of particles

train_images[:,:,0:2] = train_images[:,:,0:2]/L
# normalise [x,y] from -L:L to -1:1.
train_images[:,:,2:3] = train_images[:,:,2:3]/(2*np.pi)
# normalise theta value from -2pi:2pi to -1:1
train_images[:,:,3:4] = (train_images[:,:,3:4]/(L*np.sqrt(2))*2)-1
# normalise distance value from 0:sqrt(2)L to -1:1

test_images[:,:,0:2] = test_images[:,:,0:2]/L
test_images[:,:,2:3] = test_images[:,:,2:3]/(2*np.pi)
test_images[:,:,3:4] = (test_images[:,:,3:4]/(L*np.sqrt(2))*2)-1

## FLATTEN IMAGES ############################################################

train_images = train_images.reshape((-1, 4*(n-1))) 
# reshape so each input is a single dimension
# 4*(n-1) due to 4 parameters, adn n-1 particles (since one is redundant info)
test_images = test_images.reshape((-1, 4*(n-1)))

## BUILDING THE MODEL ########################################################

model = Sequential([
  Dense(64, activation='tanh', input_shape=(4*(n-1),)),
  Dense(16, activation='tanh'),
  Dropout(0.25),
  Dense(1, activation='tanh'),
])

## COMPILING THE MODEL #######################################################

model.compile(
  optimizer='adam',
  loss='mean_squared_error',
  #metrics=['mean_squared_error'],
)

## TRAINING THE MODEL ########################################################

history = model.fit(
  train_images, # training data
  train_labels, # training targets
  epochs=10,
  batch_size=32,
  #validation_data=(test_images, test_labels),
  shuffle=True,
  validation_split=0.2,
)

我为不同的层使用了多种激活类型（relu、sigmoid、tanh...），但似乎都没有给我正确的结果。我的数据的真实值（粒子角度的变化）是从大约 0.02 到 -0.02 的值，但我得到的值要小得多，而且往往主要是一个符号（正/负）。

我目前正在使用损失函数“平均绝对误差”，因为我希望最小化真实值和预测值之间的差异。我注意到这样做时，仅在一个时期之后，损失就已经非常小了：

Epoch 1/10
12495/12495 [==============================] - 13s 1ms/step - loss: 0.0010 - val_loss: 3.3794e-05
Epoch 2/10
12495/12495 [==============================] - 13s 1ms/step - loss: 3.4491e-05 - val_loss: 3.3769e-05
Epoch 3/10
12495/12495 [==============================] - 13s 1ms/step - loss: 3.4391e-05 - val_loss: 3.3883e-05
Epoch 4/10
12495/12495 [==============================] - 13s 1ms/step - loss: 3.4251e-05 - val_loss: 3.4755e-05
Epoch 5/10
12495/12495 [==============================] - 13s 1ms/step - loss: 3.4183e-05 - val_loss: 3.4273e-05
Epoch 6/10
12495/12495 [==============================] - 13s 1ms/step - loss: 3.4175e-05 - val_loss: 3.3770e-05
Epoch 7/10
12495/12495 [==============================] - 13s 1ms/step - loss: 3.4160e-05 - val_loss: 3.3646e-05
Epoch 8/10
12495/12495 [==============================] - 13s 1ms/step - loss: 3.4131e-05 - val_loss: 3.3629e-05
Epoch 9/10
12495/12495 [==============================] - 14s 1ms/step - loss: 3.4145e-05 - val_loss: 3.3581e-05
Epoch 10/10
12495/12495 [==============================] - 13s 1ms/step - loss: 3.4148e-05 - val_loss: 3.4647e-05

这是我从中得到的结果示例：

Prediction:  4.8542774e-05
Actual:  0.006994473448353978

为了得到这些结果，我做了什么明显的错误吗？抱歉，如果我没有提供足够的信息。

【问题讨论】：

标签： python keras neural-network

【解决方案1】：

这是一个回归问题，最后一层没有激活。将第一层中的单元 frim 32 减少到 16 个，因为这将防止过度拟合

【讨论】：

嗨@SarthakBansal，感谢您的回复！我已经尝试过了，但我的结果没有改善，预测仍然比真实答案低几个数量级。您还有其他建议吗？
尝试稍后在最后一层添加一个 lambda 以将结果乘以 100。model.add(Lambda(lambda x: x *100))