【问题标题】:What is the use (Advantages) of co-occerance Graph (TCG)?共现图(TCG)的用途(优势)是什么?
【发布时间】:2016-04-16 20:29:26
【问题描述】:

我是这个领域的新手,并且非常热衷于发展我的知识。但是我在阅读一篇研究论文时遇到了一些疑问,其中指出:

All the nouns are extracted from the given biomedical text document and a term co-occurrence graph (TCG) is built from these terms. The term co-occurrence graph represents the knowledge of the system.The TCG is treated as the background knowledge of the systems and is used for query expansion of the input query.

The TCG is queried for the semantic context of closure (SCC) of the given input query term.

闭包(SCC)的语义上下文是什么?

与现有的searching engines 相比,使用这些co-occurrence graphs 有什么优势。搜索引擎是否也使用这些图表?

即使有人为这些主题推荐一些资源,我也会很高兴。

【问题讨论】:

    标签: machine-learning artificial-intelligence data-mining text-mining information-retrieval


    【解决方案1】:

    共现只是在给定文本语料库的情况下记录单词如何相互关联的一种方式。如果“痛苦”和“破坏”出现在同一个文档中,则记录一个链接,通常在一个稀疏矩阵中,其中列和行是单词/标记/术语。矩阵中的条目表示两个词之间的实际关系。共现可以记录为 1,或者如果共现的频率很重要,您可以为每个共现将其增加一,或者除了缩放共现之间强度的转换之外还可以这样做.

    一般来说,搜索引擎都是巨大的野兽,拥有更多的花招。共现只是搜索引擎使用的许多技巧中的一种,PageRank 是另一种,但更为重要。

    co-occurance 的优点是非常简单,你可以在纯文本上使用它,你可以对它们应用快速的矩阵运算。 PageRank 之类的东西可能需要您具有其他功能,例如超链接。研究论文有类似的东西,可以与一种 PageRank 算法一起使用,即参考。但是,如果您对文本中的标记感兴趣,它并不能真正帮助您。

    关于“闭包的语义上下文”,我不完全确定他们指的是什么。我冒昧地认为这意味着给定一个术语或句子或你有什么,你进入由共现生成的图形/网络以找到其他相关术语。如果我们在 'broken' 和 'hurt' 之间以及 'pain' 和 'hurt' 之间同时出现,如果我们看到了 'pain' 这个词,那么闭包将返回所有三个词。但这只是我的预感。我必须阅读这篇论文才能在上下文中理解它。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2020-02-07
      • 2014-08-03
      • 2015-03-05
      • 1970-01-01
      • 1970-01-01
      • 2019-01-24
      • 2019-01-08
      • 2013-07-03
      相关资源
      最近更新 更多