【问题标题】:api showing context of words in sentencesapi显示句子中单词的上下文
【发布时间】:2013-02-24 20:56:27
【问题描述】:

您好,我对用于确定句子中单词上下文的 API 感到好奇

自从我看到情绪聚合器(试图评估句子情绪的脚本)的出现以来,我一直在想更复杂的版本。基本上我看到的情感聚合器其实很简单,他们只是试图给一个句子分配一个正负值,但仍然不知道上下文。同样,我对机器检测上下文的当前进展感到失望

我在想一个更复杂的算法会为一个词分配更多属性并将它们与其他词进行比较

示例:

The quick brown fox jumped over a lazy dog.

狐狸这个词将被解释为一个对象

{
    word: fox,
    type: noun,
    relation: ...
}

它现在知道 fox 指的是哺乳动物,而不是动词“to baffle of deceive”,例如,这对于翻译成另一种语言或判断机器人的良好反应很有用

有什么好的 API 或开源项目吗?

【问题讨论】:

    标签: api machine-learning nlp speech


    【解决方案1】:

    从来没有深入研究过 NLP,但听起来像“词性标注器”可以让你知道一个词在特定上下文中是名词还是动词。这个至少对你的句子有用。 http://cogcomp.cs.illinois.edu/demo/pos/?id=4

    【讨论】:

      【解决方案2】:

      对于高级情感分析,一个可能的步骤是找到每个单词的词义以及单词之间的依赖关系。一旦你掌握了这些信息,你可以做很多事情。例如,您可以处理否定,使用育儿(更广泛的概念)来平滑感官等。您还可以超越简单的喜欢/不喜欢来识别目标意图或主题(例如,暴力、非法活动等)。正确检测词义的能力消除了大部分噪音。 (例如,“喜欢”这个词在“像其他人一样,我已经......”中并不表达情感。)

      【讨论】:

        【解决方案3】:

        单词有一些单独的含义,正如您提到的,它们在不同的句子中具有不同的含义。让我们假设一个词有一个含义列表。当将一个单词从一种语言翻译成另一种语言时,单词的含义可以预测为该列表中的哪个含义在该句子中最有可能成为(在给定句子中与其他单词一起出现的概率更高)

        这种情况可以通过机器学习中的 HMM 来解决。你可以从康奈尔大学的网站上阅读blog post 关于隐马尔可夫模型和文本翻译的文章。

        你应该看看那种 API。斯坦福大学有一个 Java NLP Api,你应该看看这里:http://dbpubs.stanford.edu:8091/~klein/javadoc/edu/stanford/nlp/ie/hmm/package-tree.html

        【讨论】:

          猜你喜欢
          • 2015-01-12
          • 2020-01-29
          • 1970-01-01
          • 2019-12-06
          • 1970-01-01
          • 2021-09-30
          • 2020-07-29
          • 1970-01-01
          • 2014-12-19
          相关资源
          最近更新 更多