【发布时间】:2019-09-19 17:53:41
【问题描述】:
我已将连续数据集转换为分类数据。当转换后连续数据的值为 0.0 时,我会得到 nan 值。下面是我的代码
import pandas as pd
import matplotlib as plt
df = pd.read_csv('NSL-KDD/KDDTrain+.txt',header=None)
data = df[33]
bins = [0.000,0.05,0.10,0.15,0.20,0.25,0.30,0.35,0.40,0.45,0.50,0.55,0.60,0.65,0.70,0.75,0.80,0.85,0.90,0.95,1.00]
category = pd.cut(data,bins)
category = category.to_frame()
print (category)
如何转换这些值,以免得到 NaN 值。我附上了两个屏幕截图,以便更好地了解实际数据的外观以及转换数据的外观。 This is the main dataset。 This is the what it becomes after using bins and pandas.cut()。 “0.00”如何与数据集中的其他值保持一致。
【问题讨论】:
-
Stack Overflow Discourages screenshots of code, errors & data。由于包含不必要的屏幕截图,该问题可能会被否决。通过使用屏幕截图,您会阻止任何人帮助您。没有人想从屏幕截图中重新输入您的内容。此外,没有来自
NSL-KDD/KDDTrain+.txt的样本数据,很难重现错误。 -
添加fillna(0)??
-
你的垃圾箱可以写成
bins = np.arange(0,1.05,0.05)。 -
fillna 不工作我试过了。