了解Pandas统计分析库
Pandas介绍
以NumPy库为底层基础
提供了大量能快速便捷地处理数据的函数和方法
可快速处理千万级以上的数据
可以和Matplotlib等绘图库协作,快速实现数据可视化
Pandas数据结构
Series
–value
–index
DataFrame
–由多列Series组成
Series数据结构
创建Series对象
使用列表创建Series
–自动生成索引
–设置索引
使用字典创建Series
–key被设置为索引
Series保存数据的特点
数值类型可以不一致
Series算术运算
计算中会自动对齐不同索引的数据
例图: