【发布时间】:2016-05-06 19:09:05
【问题描述】:
假设在一个 RDF 数据集中,有一组范围从 0 到 100 的值(例如,百分比)。我想计算给定范围内的值的数量,例如 100 - 90 | 90 - 80 | ... | 10 - 0。我期望的输出如下所示:
╔════════════════╦════════╗
║ Range ║ Count ║
╠════════════════╬════════╣
║ 100 >= x < 90 ║ 4521 ║
║ 90 >= x < 80 ║ 650 ║
║ ... ║ ... ║
║ 10 >= x <= 0 ║ 2650 ║
╚════════════════╩════════╝
我目前正在使用 SPARQL 子查询和过滤器来获得解决方案。但这似乎是一个常见的用例,我的直觉告诉我应该有更好的方法来做到这一点。有没有更好(或更有效)的方法来获得这个答案?
目前的解决方案如下所示。
PREFIX dqv: <http://www.w3.org/ns/dqv#>
select distinct ?count90_100 ?count80_90 ?count10_0 where {
?m a dqv:QualityMeasurement .
{ select count(?m) as ?count90_100 where { ?m dqv:value ?value FILTER (?value > 90 && ?value <= 100) }}
{ select count(?m) as ?count80_90 where { ?m dqv:value ?value FILTER (?value > 80 && ?value <= 90) }}
{ select count(?m) as ?count10_0 where { ?m dqv:value ?value FILTER (?value >= 0 && ?value <= 10) }}
}
【问题讨论】:
标签: optimization sparql rdf linked-data