【发布时间】:2018-05-09 12:40:01
【问题描述】:
我正在做一个词嵌入项目。为此,我正在使用 Amazon SageMaker。 Amazon SageMaker 中的 BlazingText 算法产生的结果比其他选项快。但我没有看到任何获得预测模型或权重的工具。输出仅包含我无法从中生成模型的向量文件。 有什么方法可以让我得到带有矢量文件的模型吗?我需要这个来预测新单词。提前致谢。
【问题讨论】:
-
“预测新词”是什么意思?词嵌入是在你的“词汇表”中创建词嵌入,而不是新词。您可以使用词干提取或散列来处理词汇表外的单词,但不能使用嵌入模型。
-
我正在构建一个基于 skip-gram 的嵌入模型。通常skip-gram模型输出给定单词的上下文。我这样做是为了研究和评估,我想获得上下文输出。我正在尝试解决多义词。所以只有词嵌入结果是不够的。我的要求是基本的skip-gram模型,我可以在其中获取上下文作为单词的输出。
-
如何使用 Amazon BlazingText 训练二元组和三元组?
标签: amazon-web-services nlp word2vec gensim amazon-sagemaker