【问题标题】:Open source equivalent to opencalais (Preferably PHP or Python?)相当于 opencalais 的开源(最好是 PHP 或 Python?)
【发布时间】:2011-10-19 20:53:17
【问题描述】:

是否有类似 opencalais 的开源版本 - 最好是 PHP 或 Python?

【问题讨论】:

  • 他们的Python API 有什么问题?
  • 我不喜欢他们的条款。它并不是真正意义上的开放——我宁愿自己托管“服务”,完全控制,而不是对我施加限制和各种其他限制。
  • 懒得翻遍该网站上的所有营销 BS。它有什么作用?
  • @Daniel Roseman:从广义上讲,它是一种提供文本分析功能的“服务”;意思是,它从提交的文档中提取“显着”信息,并以包括 JSON 和 RDF 在内的多种格式返回提取的数据。可用于数据挖掘应用等。

标签: php python text-processing


【解决方案1】:

从概念上讲,这是一个有趣的想法。好像是在解析基本的文本或者HTML内容,然后在microformats中包装实体

你为什么不只是为他们的服务提供 Web API?

自己实施解决方案应该很简单——这只是大量正则表达式和微格式模板的一个例子。

【讨论】:

    【解决方案2】:

    似乎他们的主要服务是Named Entity Recognition,并在此基础上进行了一些推断。 NER 仍然是自然语言处理中的一个研究问题。这意味着没有万能的算法,尽管商业供应商可能会试图说服您。

    也就是说,Python 的 nltk does have some relevant features

    【讨论】:

      【解决方案3】:

      Stanford NER 用于命名实体识别,Dependency parser 将是与 Opencalais 等效的一些构建块。

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 1970-01-01
        • 2011-11-03
        • 2011-10-10
        • 2010-10-28
        • 1970-01-01
        • 2012-12-03
        • 1970-01-01
        相关资源
        最近更新 更多