【问题标题】:Given a list of company names, how to fetch company names, website url, year established, number of employees etc给定公司名称列表,如何获取公司名称、网站 url、成立年份、员工人数等
【发布时间】:2012-08-27 22:18:38
【问题描述】:

我有一个公司名称列表,例如 Microsoft Corp、Kimberly Clark Corporation 等,对于每家公司,我想检索以下字段:

  1. 公司标志
  2. 谷歌地图的地理标识符
  3. 网站网址
  4. 成立年份
  5. 证券交易所和证券交易所股票代码
  6. 一种获取过去几天股价的方法
  7. 关于/来自维基百科的摘要
  8. 子公司和母公司列表。例如,对于波音来说,它将是 Jeppessen 和 Availl, Inc 等。

我研究了 Sparql 和 Dbpedia。关于如何提出 sparql 查询来检索其中一些信息的任何建议? (我不需要检索所有字段,只需几个字段即可开始。)

谢谢!

【问题讨论】:

  • 我即将解决一个类似的问题,很想知道你的进展如何。

标签: sparql dbpedia


【解决方案1】:

您可以开始使用这样的查询:

select * where {
  values ?company { dbpedia:Microsoft
                    <http://dbpedia.org/resource/Apple_Inc.>
                    dbpedia:Kimberly-Clark
                  } 
  OPTIONAL { { ?company dbpprop:logo ?logo  FILTER(isIRI(?logo)) }
             UNION 
             { ?company foaf:depiction ?logo FILTER(isIRI(?logo)) } }
  OPTIONAL { ?company dbpedia-owl:abstract ?abstract 
             FILTER(langMatches(lang(?abstract),"EN")) }
  OPTIONAL { ?company geo:lat ?latitude ;
                      geo:long ?longitude }
  OPTIONAL { ?company dbpedia-owl:foundingDate ?foundingDate }
  OPTIONAL { ?company dbpedia-owl:wikiPageExternalLink ?externalLink }
  OPTIONAL { ?company dbpprop:symbol ?stockSymbol }
  OPTIONAL { ?company dbpedia-owl:subsidiary ?subsidiaryPage }
}

SPARQL Results

我基于我在 DBpedia 页面上看到的 MicrosoftKimberly-ClarkApple, Inc. 的属性。数据不是特别干净,因此,我在查询中添加了一些过滤器:

  • 并非所有这些都列出子公司,并且 Microsoft 的子公司财产与子公司无关,而是一个可能列举一些子公司的页面。

  • 一些公司的徽标信息不正确(因此FILTERs 和isIRI)。例如,Apple 的dbpprop:logo 是整数150。我认为这来自维基百科信息框行| logo = [[File:{{#property:p154}}|150px]],其中150 被拉出而不是更有意义的值。按isIRI 过滤会有所帮助。

  • 有些公司有多个成立日期。我不确定您如何决定使用多个中的哪一个。

  • 虽然公司页面通常列为外部链接,但并非所有与页面关联的外部链接都是公司页面。我不确定您如何选择一个作为公司页面。

话虽如此,看来您可以从 DBpedia 获得很多此类信息。

【讨论】:

  • 我正在做同样的任务,不过,这里的 SPARQL 结果是巨大的。为什么是这样?我所追求的只是一组带有徽标和公司名称的结果。这可能吗?
  • @gray 请注意,问题上已经有similar comment
【解决方案2】:

您可以从以下 sparql 查询开始。它检索名称为“Apple Inc.”的主题的所有三元组。

select distinct ?subject ?predicate ?object where { 
  ?subject ?predicate ?object .
  ?subject <http://xmlns.com/foaf/0.1/name> "Apple Inc."@en .
}

SPARQL results

subject     predicate   object
http://dbpedia.org/resource/Apple_Inc.  http://www.w3.org/1999/02/22-rdf-syntax-ns#type     http://www.w3.org/2002/07/owl#Thing
http://dbpedia.org/resource/Apple_Inc.  http://www.w3.org/1999/02/22-rdf-syntax-ns#type     http://dbpedia.org/ontology/Company
http://dbpedia.org/resource/Apple_Inc.  http://www.w3.org/1999/02/22-rdf-syntax-ns#type     http://www.opengis.net/gml/_Feature
http://dbpedia.org/resource/Apple_Inc.  http://www.w3.org/1999/02/22-rdf-syntax-ns#type     http://dbpedia.org/ontology/Organisation
http://dbpedia.org/resource/Apple_Inc.  http://www.w3.org/1999/02/22-rdf-syntax-ns#type     http://dbpedia.org/ontology/Agent
http://dbpedia.org/resource/Apple_Inc.  http://www.w3.org/1999/02/22-rdf-syntax-ns#type     http://schema.org/Organization
http://dbpedia.org/resource/Apple_Inc.  http://www.w3.org/1999/02/22-rdf-syntax-ns#type     http://dbpedia.org/class/yago/ComputerCompaniesOfTheUnitedStates
http://dbpedia.org/resource/Apple_Inc.  http://www.w3.org/1999/02/22-rdf-syntax-ns#type     http://dbpedia.org/class/yago/SoftwareCompaniesOfTheUnitedStates
http://dbpedia.org/resource/Apple_Inc.  http://www.w3.org/1999/02/22-rdf-syntax-ns#type     http://dbpedia.org/class/yago/RetailCompaniesOfTheUnitedStates
http://dbpedia.org/resource/Apple_Inc.  http://www.w3.org/1999/02/22-rdf-syntax-ns#type     http://dbpedia.org/class/yago/CompaniesEstablishedIn1976
http://dbpedia.org/resource/Apple_Inc.  http://www.w3.org/1999/02/22-rdf-syntax-ns#type     http://dbpedia.org/class/yago/ComputerHardwareCompanies
http://dbpedia.org/resource/Apple_Inc.  http://www.w3.org/1999/02/22-rdf-syntax-ns#type     http://umbel.org/umbel/rc/Organization
http://dbpedia.org/resource/Apple_Inc.  http://www.w3.org/1999/02/22-rdf-syntax-ns#type     http://dbpedia.org/class/yago/Company108058098
http://dbpedia.org/resource/Apple_Inc.  http://www.w3.org/1999/02/22-rdf-syntax-ns#type     http://dbpedia.org/class/yago/HomeComputerHardwareCompanies
http://dbpedia.org/resource/Apple_Inc.  http://www.w3.org/1999/02/22-rdf-syntax-ns#type     http://dbpedia.org/class/yago/CompaniesBasedInCupertino,California
http://dbpedia.org/resource/Apple_Inc.  http://www.w3.org/1999/02/22-rdf-syntax-ns#type     http://dbpedia.org/class/yago/MobilePhoneManuFACturers

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2019-06-03
    • 2020-11-01
    • 1970-01-01
    • 2010-12-22
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2017-02-24
    相关资源
    最近更新 更多