【发布时间】:2017-11-02 03:33:10
【问题描述】:
我有两个词嵌入。一个经过预训练的手套和一个我在医疗相关文件方面接受过培训的手套。预训练的向量包含更多的词,但我的词向量对医学术语有更好的表示。我是要融合这两组嵌入。
Glove (200d) 有 400 万个术语,其中大约 10% 也在我自己的嵌入(也是 200d)中找到。我想知道创建一个将向量从 Glove 空间映射到我自己的嵌入空间的神经网络是否会有所帮助,而不是像连接两者这样简单的东西(这会导致很多 0)。特别:
from keras.models import Sequential
from keras.layers import Dense, Activation
model = Sequential()
model.add(Dense(units=100, input_dim=200))
model.add(Activation('sigmoid'))
model.add(Dense(units=50))
model.add(Activation('sigmoid'))
model.add(Dense(units=100))
model.add(Activation('sigmoid'))
model.add(Dense(units=200))
model.add(Activation('linear'))
model.compile(optimizer='rmsprop',
loss='mse')
model.fit(x_train, y_train, epochs=10, batch_size=32)
结果很差,不知道是因为方法不正确还是模型没有调好。
【问题讨论】: