【python数据分析+实战】【2.2】本地数据的采集与操作（CSV、Excel文件操作）

一、CSV文件

• Comma-Separated Values
• 以纯文本形式存储的表格数据（以逗号作为分隔符），通常第一行为列名

但是可以用它打开，这里就自动解析成了行和列的显示风格了

• 文件操作

• numpy 的 np.loadtxt(), 较复杂
• 利用pandas处理，快捷方便

• 1、读操作

【python数据分析+实战】【2.2】本地数据的采集与操作（CSV、Excel文件操作）
• df_obj = pd.read_csv()，返回DataFrame类型的数据做
• 索引在左，数值在右。索引是pandas自动创建的。

• 2、写操作

• df_obj.to_csv(), 参数index=False不写入索引列

【python数据分析+实战】【2.2】本地数据的采集与操作（CSV、Excel文件操作）

3、练习题执行如下代码，在csv文件的左侧不要产生索引列

二、Excel文件

• Microsoft为使用Windows和Apple Macintosh操作系统的电脑编写的一款电子
表格软件
• 数据分析处理只关心数据，不关心样式

1、Excel vs CSV

• 都可以通过Microsoft的Excel程序打开
• Excel：除了文本，数据也可以包含图表、样式、工作簿等
• CSV：每条记录都存储为一行文本文件，每一条新行都表示一个新的数据记录。CSV不能存储图表或样式

2、读取文件

• pd.read_excel()
• 参数sheet_name：工作簿的索引号，可以是单个工作簿或多个工作簿

【python数据分析+实战】【2.2】本地数据的采集与操作（CSV、Excel文件操作）

df_obj.head(10)就是显示 10行

3、写入文件

• 写入单个工作簿： pd.to_excel()
• 写入多个工作簿：
• writer = pd.ExcelWriter('output.xlsx’)
df1.to_excel(writer,'Sheet1’)
df2.to_excel(writer,'Sheet2’)
writer.save()

一、CSV文件

• 文件操作

• 1、读操作

• 2、写操作

3、练习题 执行如下代码，在csv文件的左侧不要产生索引列

二、Excel文件

1、Excel vs CSV

2、读取文件

df_obj.head(10)就是显示 10行

3、 写入文件

3、练习题执行如下代码，在csv文件的左侧不要产生索引列

3、写入文件