【发布时间】:2022-07-01 18:41:32
【问题描述】:
我有一个单词列表(例如,“apple”、“banana”、“mango”),并且想使用 ALBERT (https://huggingface.co/albert-base-v2) 来识别与我的每个单词最密切相关的 10 个单词列表。简单来说:“Hey ALBERT,听到苹果/香蕉/芒果时,你想到的第一个词是什么?”
我的第一个想法是使用“apple is related to [MASK]”之类的提示。但一些*预测非常奇怪或不恰当的词,例如“evalle”。
我的第二个想法是使用 k-最近邻方法。但是,我不知道如何在 Hugginface 转换器中实现它。是否可以在没有微调的情况下做到这一点?你有别的想法吗?
【问题讨论】:
-
您是否有一个可能的关联列表,可以从中选择最相关的关联?否则,我觉得这很快就会成为一个棘手的问题,或者至少会导致推理性能非常差。
-
一开始就不是这样的。但是,您认为列出 5,000 个最常用的英语单词的列表是否可行?
-
也许这有助于说明我想要实现的目标:aclanthology.org/2020.conll-1.30.pdf
标签: nlp huggingface-transformers nearest-neighbor