【发布时间】:2018-06-29 14:49:06
【问题描述】:
fraud_indices = np.array(dataset[dataset.Class == 1].index)
fraud_samples = dataset.iloc[fraud_indices, :]
我在一个数据集上使用上述代码,该数据集有一列“类”,其中包含 0 和 1。我想做的很简单,我正在获取数据集中 Class == 1 的索引,并且我正在使用它来制作一个子集。
但是,即使索引是从同一数据集获得的,我在第二行也收到错误“位置索引器超出范围”。他们怎么可能越界?有人可以帮忙吗?
【问题讨论】:
-
dataset.loc[fraud_indices]呢? -
.loc 没有给出错误但不能正常工作。我应该得到 492 行,但使用 .loc 我得到随机更高的行数
-
嗯,我再次检查您的问题,为什么不使用
fraud_samples = dataset[dataset.Class == 1]? -
这样索引的目的是什么?为什么不
dataset.loc[dataset.Class == 1, :]?
标签: python pandas dataframe dataset