【问题标题】:Identifying geographical locations in text识别文本中的地理位置
【发布时间】:2010-11-15 02:50:06
【问题描述】:

为了确定特定字符串是否与地理位置相关,我们做了哪些工作?例如:

'troy, ny'
'austin, texas'
'hotels in las vegas, nv'

我想我有点期待的是一种统计方法,它可以在一定程度上确定前两个是位置。最后一个可能需要一个启发式方法来抓取“%s,%s”,然后使用相同的技术。我正在寻找不太依赖“在”命题的方法,因为它不是一个完全明确或始终可用的位置指标。

谁能指出我的方法、论文或现有实用程序?谢谢!

【问题讨论】:

    标签: nlp geography


    【解决方案1】:

    您描述的问题通常称为地理查询解析或更一般地称为地理信息检索。

    在 2007 年 CLEF (http://www.uni-hildesheim.de/geoclef/2007/Query-Parsing.htm) 上有一项最近的任务。获胜的团队使用了基于规则的语法,这与您可能不想要的相似。 www2009 上的另一篇论文谈到了 GeoParser:http://www2009.eprints.org/239/

    CIKM 2007 也有一些关于地理信息检索的论文:http://www.geo.unizh.ch/~rsp/gir07/accepted.html

    我不知道有任何开源软件可以做到这一点,但它可能会被捆绑到像 Lemur 这样的搜索引擎中。

    【讨论】:

      【解决方案2】:

      Everyblock.com 采用了一种非常有趣的方法,专注于用英语表达位置的方式——它们基本上使用了一些复杂且广泛的正则表达式,这些正则表达式现已开源。他们的应用程序旨在扫描新闻文章、评论和各种公共数据源,并将它们与特定位置相关联,并且运行良好。诸如“旧金山 20 号东北角和瓦伦西亚街的建筑物发生火灾”之类的表达非常准确地进行了地理编码。可以学习源码here。您可能想要的特定部分是 ebpub/ebpub/geocoder/base.py,位于 ebpub 下载中,以及它周围的所有内容,例如从 SmartGeocoder 类开始并向后工作。

      【讨论】:

        【解决方案3】:

        帮助链接:geonames.org search

        返回找到的名称 搜索词作为 xml 或 json 文档

        示例:http://ws.geonames.org/search?q=troy,%20ny&maxRows=10

        【讨论】:

        • 将单个字符串映射到位置,但对于在任意文本中查找位置没有用处。
        【解决方案4】:

        我正在geocode.xyz 构建一个免费的地理分析器

        (目前支持约 50 个欧洲国家,即将提供全球覆盖)

        地理解析的示例应用程序可以在OpenWikiMap找到

        【讨论】:

          猜你喜欢
          • 1970-01-01
          • 1970-01-01
          • 1970-01-01
          • 2018-03-03
          • 1970-01-01
          • 2022-12-08
          • 1970-01-01
          • 1970-01-01
          • 1970-01-01
          相关资源
          最近更新 更多