立即学习:https://edu.csdn.net/course/play/27352/363901?utm_source=blogtoedu
Series:
- series由一个带索引数据构成的一维数组
- Series给数组和一组索引绑定在一起
- 想获取版和规定的内容,使用:values属性和inde属性
series和numpy的数组很像,区别:
numpy通过隐式索引对数据进行从左,series通过显索引将索引和数值关联。
- series隐式索引不支持负数操作
- 取值默认为显式索引
- 切片默认为隐式索引
- 切片包括末尾位置
对数据的选五,series处理的不是很好,对数据访问时,一会显式,一会隐式容易造成混乱。
python于是提供了三个索引器,用以清晰访问数据:
- loc:只是用显式索引,label based indexing(标签)
- iloc:只使用隐式索引,position indexing (位置),包含切片的最后一个
- ix:前两种索引的混合模式,住哟啊用在DataFrame中,但不推荐
DataFrame:可以看作是通用的Numpy数组,也可ui看作特殊字典;;是最常见的结构可以想象成一个Excel内容,每一行都有行,每一列都有列名的二维结构
创建的DataFrame方式:
- 通过单个Series对象字典创建
- 通过字典列表创建
- 通过series对象字典创建
- 通过numpy二维数组创建
- 通过numpy结构化数组创建
DataFrame可以看作是二维数组的增强数组。
Index:Pandas的Index对象是一个独立的对象,用来表示数据的索引,可以把他看做不变的数组tuple或者有序的集合;;它作为不可变数组时候,除了数组的一些读操作外,还具有一些Numpy数组的属性;;Index作为有序集合操作主要是为了进行一些基于集合的操作,比如集合的交叉并补操作