♤DataFrame
✦选择数据
1、loc:通过行和列的名字来获取值2、iloc:通过下标获取值
注意:
iloc使用索引定位时,会按照索引规则取值,如[1:5]会取出1,2,3,4这4个值
loc按照label标签取值,如[‘A’:‘C’]则A,B,C都取到
3、at:通过行列标签获得指定值(获得单个数据)
4、iat:通过行列标签的整数索引来选取指定值
5、布尔类型的数组:通常用于筛选符合某些条件的行
✦处理丢失数据
1、dropna(axis=0, how=‘any’, thresh=None, subset=None, inplace=False) #默认丢弃含有缺失值的行
参数说明:
axis:轴。0或’index’,表示按行删除;1或’columns’,表示按列删除。
how:筛选方式。‘any’,表示该行/列只要有一个以上的空值,就删除该行/列;‘all’,表示该行/列全部都为空值,就删除该行/列。
thresh:非空元素最低数量。int型,默认为None。如果该行/列中,非空元素数量小于这个值,就删除该行/列。thresh=n保留至少有n个非NaN数据的行
subset:子集。列表,元素为行或者列的索引。如果axis=0或者‘index’,subset中元素为列的索引;如果axis=1或者‘column’,subset中元素为行的索引。由subset限制的子区域,是判断是否删除该行/列的条件判断区域。
inplace:是否原地替换。布尔值,默认为False。如果为True,则在原DataFrame上进行操作,返回值为None。
2、.fillna(value,method,axis,inplace,limit)
参数说明:
value:被填充的数据
method:填充的方式,backfill,bfill,pad,ffill
limit:限制填充个数
3、.isnull()判断是否有控制,多用于整体检验
.isnan()多用于单个值的检验
注意
1、np.nan不是一个空对象,用i is None 判断是False
2、对某个值是否为空值进行判断,只能哦那个np.isnan(i)
3、np.nan非空对象,类型为float
✦导入导出
参考官方教程
✦合并