【发布时间】:2015-07-25 18:41:13
【问题描述】:
我正在使用网络跟踪数据集,并将初始数据加载到 pandas 数据框中,如下所示:
我创建了一个 python 字典,其中包含常见的端口号和应用程序名称,例如
port_dict = {80: 'http', 20: 'ftp', 21: 'ftp'}
我想通过添加额外的列来修改我的数据框,这些列的名称将是 ports_dict 的唯一值,如果 sport 或 dport 中的任何一个包含相关键,则新添加的列应该有一个值True, False 否则,像这样:
在上图中,列https 应该有True,因为运动是443。
我将如何实现这一目标?
【问题讨论】:
-
看起来是多列应用的一个不错的用例。只需使用您的映射字典编写一个函数。将此功能应用于您的列的切片。结束。 stackoverflow.com/questions/16353729/…