【发布时间】:2017-11-25 14:38:50
【问题描述】:
我一直在尝试评估语言模型,我需要跟踪困惑度指标。
我尝试的是:因为困惑度是 2^-J,其中 J 是交叉熵:
def perplexity(y_true, y_pred):
oneoverlog2 = 1.442695
return K.pow(2.0,K.mean(-K.log(y_pred)*oneoverlog2))
但奇怪的是,在几批训练期间,这会变成无穷大。
实现或任何其他实现困惑的方式有问题吗?
【问题讨论】:
标签: machine-learning tensorflow nlp deep-learning keras