【问题标题】:Finding city, country, company name from a tweet text using Java使用 Java 从推文文本中查找城市、国家、公司名称
【发布时间】:2011-11-23 13:04:37
【问题描述】:

我正在尝试构建一个示例应用程序,我想在其中解析一条推文并找到城市名称, 该推文中的国家名称和公司名称。

执行此操作的愚蠢方法是维护列表 国家、城市和公司名称的名称,并在推文文本中找到这些名称,但 每次我想添加新东西时,方法都需要改变。

是否有一个 library 可以解析字符串并给我这些信息?或者你能建议我一种我应该采取的方式吗?

【问题讨论】:

  • 您能否举几个您希望能够使用此方法解析的推文示例?

标签: java text twitter nlp


【解决方案1】:

Apache StanbolEnhancer 组件通过其 RESTful API 提供 NER 服务。您可以简单地将推文内容提供给 Stanbol,它会为您提供增强功能,即人员、地点、组织作为增强功能。

您可以试用演示服务器:
http://dev.iks-project.eu:8081/engines
http://fise.demo.nuxeo.com/engines

【讨论】:

    【解决方案2】:

    您正在寻找命名实体识别。

    【讨论】:

      【解决方案3】:

      假设所有推文都具有相同的结构,并且您想要的信息不在块文本中,您可以编写一个简单的解析器来获取信息。

      【讨论】:

        猜你喜欢
        • 2012-03-07
        • 2017-06-25
        • 1970-01-01
        • 2019-10-27
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2017-06-30
        • 1970-01-01
        相关资源
        最近更新 更多