【发布时间】:2020-08-23 10:44:35
【问题描述】:
我正在阅读 this paper 和 3.2.1 小节,第一段最后三行,
将命名实体候选映射到 标准属性名称,我们采用 k-means 算法对识别的命名进行聚类 通过基于词频-逆计算实体之间的余弦相似度 文档频率 (TFIDF)。”
谁能解释一下这是什么意思?如果可能的话,给出一个实现场景的例子。
【问题讨论】:
-
正在寻找关于什么是 Kmeans 和什么是 TFIDF 的解释?或者您想了解什么是名称实体候选和标准属性名称?
-
@Roim 我对 Kmeans 和 TFIDF 很熟悉,但不确定他如何对已识别的命名实体进行聚类。因此,NER 模型已经能够获得技能、教育等,那么论文为什么要提出这个额外的步骤。为什么是目的。
标签: machine-learning deep-learning nlp named-entity-recognition