【发布时间】:2017-03-07 18:03:43
【问题描述】:
全部,
我是图形数据库领域的新手,想知道这种类型的示例是否适用于图形数据库。
假设我正在看一场棒球比赛。当每个球员去击球时,有 3 种可能的结果:击球、三振或步行。
对于每个击球手和整个棒球赛季,我想弄清楚的是序列的计数。
例如,对于上板 n 次的击球手,有多少人具有特定的顺序(例如,击球/步行/三振出局或击球/击球/击球/击球),如果是,有多少相同的顺序击球手重复按时间索引的相同顺序。为了进一步解释,时间会让我知道某个特定的序列(例如击球/步行/三振出局或击球/击球/击球/击球)是否发生在赛季开始、中期或下半年。
对于键值类型数据库,原始数据如下所示:
Batter Time Game Event Bat
------- ----- ---- --------- ---
Charles April 1 Hit 1
Charles April 1 strikeout 2
Charles April 1 Walk 3
Doug April 1 Walk 1
Doug April 1 Hit 2
Doug April 1 strikeout 3
Charles April 2 strikeout 1
Charles April 2 strikeout 2
Doug May 5 Hit 1
Doug May 5 Hit 2
Doug May 5 Hit 3
Doug May 5 Hit 4
因此,我的输出将如下所示:
Sequence Freq Unique Batters Time
----------------------- ---- -------------- ------
hit 5000 600 April
walk/strikeout 3000 350 April
strikeout/strikeout/hit 2000 175 April
hit/hit/hit/hit/hit 1000 80 April
hit 6000 800 May
walk/strikeout 3500 425 May
strikeout/strikeout/hit 2750 225 May
hit/hit/hit/hit/hit 1250 120 May
. . . .
. . . .
. . . .
. . . .
如果这对于图形数据库是可行的,它是否也可以扩展?如果击球手不是 3 个可能的结果,而是 10,000,000 名击球手有 10,000 个潜在结果怎么办?
更重要的是,10,000 个独特的结果将在组合设置中排序(例如 10,000 CHOOSE 2、10,000 CHOOSE 3 等)。
那么我的问题是,如果图形数据库是合适的,您会如何建议设置解决方案?
提前非常感谢。
【问题讨论】:
标签: time-series combinations sequence graph-databases combinatorics