【发布时间】:2017-05-08 10:32:15
【问题描述】:
我想在 TensowFlow 上实现一个通用模块,该模块接收 TensorFlow 模型列表(此处表示为专家)并从该列表中构建专家组合,如下图所示 http://www.aclweb.org/anthology/C16-1133
所以这个模型得到一个输入x,它被输入到不同的专家以及门控网络。最终输出对应于ensemble output,它是不同专家的输出之和乘以来自门控网络的相应门控函数gm。所有专家网络都是同时训练的。
此模块适合批量训练很重要。我一直在寻找已经实现的东西并找到了这个https://github.com/AmazaspShumik/Mixture-Models,虽然它不在 TensorFlow 上。
所以现在我正在寻找有关构建此模块的最佳方法的指针和建议,即有关一些已经实现的 TF 层或特别适合此应用程序的包装器。
【问题讨论】:
标签: python tensorflow neural-network deep-learning