【发布时间】:2020-11-20 14:24:20
【问题描述】:
我看过很多论文将网络数据转换为图像,我正在尝试做同样的事情,我从 kaggle 获得了 87 个应用程序的网络数据。数据有三列'Source.IP'、'Destination.IP'和'Payload'看起来像这样
x 轴上是 source.ips,y 轴上是 dest ip,我想学习 CNN 以进行基于有效负载的流量矩阵分类。 我尝试生成热图,因为我使用 pandas 和 matplotlib/seaborn 来生成图表,由于重复的源/目标 ips,我不得不旋转表格。
g1 = true_ele.groupby(["Destination.IP","Source.IP"], as_index=False)['Payload'].mean()
table = g1.pivot(index='Destination.IP',columns='Source.IP',values='Payload')
为了删除重复项,我决定按有效负载对源/目标 ips 进行分组,这不好,因为我正在丢失数据。
我想问的是,有没有更好的方法来根据上面的数据生成图像,这样我就不会丢失数据,并且能够生成有意义的图像来学习 CNN。
【问题讨论】:
标签: python matplotlib seaborn conv-neural-network network-traffic