【发布时间】:2020-09-03 16:24:30
【问题描述】:
我的目标是创建文本生成器,它将根据我提供给它的学习集生成非英语文本。
我目前正处于弄清楚模型实际应该是什么样子的阶段。我正在尝试在我的网络中实现 fasttext 预训练模型作为嵌入层。但正因为如此,我有一些问题。
1) 如何正确准备fasttext模型?我应该只下载我需要的语言的向量并将它们包含在项目中,还是必须先使用skipgram 或cbow 或以其他方式构建它?
2) 我想如何将 Keras Embedding() 与 fasttext 模型交换?
现在我有这样的东西:
model = Sequential()
model.add(Embedding(vocabulary_size, seq_len, input_length=seq_len, output_dim=OUTPUT_DIM))
model.add(LSTM(50, return_sequences=True))
我希望使用 fasttext 向量而不是 model.add(Embedding())。
希望我解释清楚。
【问题讨论】:
标签: python machine-learning keras nlp fasttext