【问题标题】:Semantic Similarity Result interpretation语义相似度结果解释
【发布时间】:2013-02-23 04:15:18
【问题描述】:

我在这里使用工具执行语义相似性,

我得到以下结果,但无法正确解释它们:

apple#n#1,banana#n#1    0.04809463683080774
apple#n#1,banana#n#2    0.13293629283742603
apple#n#2,banana#n#1    0.0
apple#n#2,banana#n#2    0.0

代码如下:

URL url = new URL ( "file" , null , "dictionary/3.0/dict" );
        IDictionary dict = new Dictionary ( url ) ;
        dict.open () ;

        // look up first sense of the word " dog "
        IIndexWord idxWord = dict . getIndexWord ( "dog" , POS.NOUN ) ;
        IWordID wordID = idxWord . getWordIDs () . get (0) ; // 1 st meaning
        List <IWordID> wordIDs = idxWord.getWordIDs();


        JWS ws= new JWS ("dictionary", "3.0");


        TreeMap <String,Double> scores1 = ws.getJiangAndConrath().jcn("apple", "banana", "n");
        for (String s:scores1.keySet())
            System.out.println(s+"\t"+scores1.get(s));

【问题讨论】:

    标签: semantics wordnet


    【解决方案1】:

    来自NLTK Documentation:

    Jiang Conrath 相似度返回一个分数,表示两个相似度 词义是基于最少信息内容 (IC) Common Subsumer(最具体的祖先节点)和两者的 输入同义词。该关系由等式 1 / (IC(s1) + IC(s2) - 2 * IC(lcs))。

    结果为 0 表示这两个概念根本不相关。 接近 1 的结果意味着非常密切的关系。

    【讨论】:

      【解决方案2】:

      你能把用 JAVA 编写的代码源交给我,因为我确实对 Url 变量有一些问题,因此负责执行 LeacockAndChodorow 算法吗?

      【讨论】:

        猜你喜欢
        • 2015-10-10
        • 2018-10-01
        • 2020-04-29
        • 1970-01-01
        • 2011-02-08
        • 2013-05-29
        • 1970-01-01
        • 2011-01-03
        • 2017-07-24
        相关资源
        最近更新 更多