pandas 是基于numpy构件的强大的数据处理模块,其核心的数据结构有两个:Series 与 DataFrame
一:Series
Series 是一种类似于表的东西,拥有索引(index)与其对应的值(value)
1)创建Series:
Sereies方法接收两个参数,第一个与value相关,第二个用来指定索引。而创建的方式有两种:
一种为用两个list作为参数分别代表value和index的值[index参数不写则默认0开始自增长]
另一种为dict作为第一参数,若不写第二参数,则其key变成index,value即是value,若有第二参数,则用第二参数元素作为index.[index对应不上的则被抛弃]
import pandas as pd
1 obj_1 = pd.Series([1,2,3,4]) #若不指定索引则默认为从零开始的自增长 2 3 --->obj_1 4 0 1 5 1 2 6 2 3 7 3 4 8 dtype: int64 9 10 obj_2 = pd.Series([1,2,3,4], index=['a','b','c','d']) #指定索引 11 12 obj_2 13 --->a 1 14 b 2 15 c 3 16 d 4 17 dtype: int64