【发布时间】:2013-11-27 14:20:57
【问题描述】:
我有一个数据集如下:
Visitor ID Page Id TimeStamp
1 a x1
2 b x2
3 c x3
2 d x4
以下是数据的规则:
1)。将其视为访问者访问网站并进行一些交互的 Web 数据。 VID 代表访客唯一 ID。 Page Id 是他访问过的页面的 ID,Time stamp 是访问的时间。
2)。如果页面刷新,则时间戳将更改,因此将在数据集中创建一个新行,其 VID、页面 ID 的值相同,但时间戳的值不同。
3)。如果访问者点击其他页面,时间戳和页面 ID 都会更改。假设他首先在页面“a”上,然后转到页面“b”,因此他将在数据集中有另一条具有相同 VID 的记录,但页面 id 现在 =b 并且时间戳是新的时间戳。
问题:
我想找出在访问页面“a”之后访问页面“b”的所有唯一 VID。请注意,我希望它用于特定的会话或一天。
有人可以帮助使用 sql 和 Pythonic 的方式吗?
谢谢
【问题讨论】: