【发布时间】:2018-09-11 02:54:15
【问题描述】:
我有一个包含两列“主机”和“日期”的数据框;它描述了在七个月的特定日期针对多个不同服务器的一系列网络攻击。
这是数据的样子,
> china_atks %>% head(100)
host date
1 groucho-oregon 2013-03-03
2 groucho-oregon 2013-03-03
...
46 groucho-singapore 2013-03-03
48 groucho-singapore 2013-03-04
...
其中“groucho-oregon”、“groucho-signapore”等是攻击目标服务器的主机名。
大约有 190,000 条记录,从 03/03/2013 到 08/09/2013,例如
> unique(china_atks$date)
[1] "2013-03-03" "2013-03-04" "2013-03-05" "2013-03-06" "2013-03-07"
"2013-03-08" "2013-03-09"
[8] "2013-03-10" "2013-03-11" "2013-03-12" "2013-03-13" "2013-03-14"
"2013-03-15" "2013-03-16"
[15] "2013-03-17" "2013-03-18" "2013-03-19" "2013-03-20" "2013-03-21"
"2013-03-22" "2013-03-23"
...
我想创建一个多线时间序列图表,以可视化每个单独的服务器在日期范围内每天收到多少次攻击,但我不知道如何将数据传递给 ggplot 来实现这一点.有九个唯一的主机名,因此图表将显示九行。
谢谢!
【问题讨论】:
-
您没有数据中的攻击次数,如果有,它在哪里?
-
每一行似乎是一个单独的观察,因此可以通过总结来计算攻击次数。
-
不,攻击次数必须计入实际数据帧本身——这应该是我的第一步吗?
-
请在上面的示例数据中添加更多日期。