一、CSV文件
• Comma-Separated Values
• 以纯文本形式存储的表格数据(以逗号作为分隔符),通常第一行为列名
但是可以用它打开,这里就自动解析成了行和列的显示风格了

• 文件操作
• numpy 的 np.loadtxt(), 较复杂
• 利用pandas处理,快捷方便
• 1、读操作
• df_obj = pd.read_csv(),返回DataFrame类型的数据做
• 索引在左,数值在右。索引是pandas自动创建的。

• 2、写操作
• df_obj.to_csv(), 参数index=False不写入索引列
-
3、练习题 执行如下代码,在csv文件的左侧不要产生索引列
二、Excel文件
• Microsoft为使用Windows和Apple Macintosh操作系统的电脑编写的一款电子
表格软件
• 数据分析处理只关心数据,不关心样式
1、Excel vs CSV
• 都可以通过Microsoft的Excel程序打开
• Excel:除了文本,数据也可以包含图表、样式、 工作簿等
• CSV:每条记录都存储为一行文本文件,每一条新行都表示一个新的数据记录。CSV不能存储图表或样式
2、读取文件
• pd.read_excel()
• 参数sheet_name:工作簿的索引号,可以是单个工作簿或多个工作簿
df_obj.head(10)就是显示 10行

3、 写入文件
• 写入单个工作簿: pd.to_excel()
• 写入多个工作簿:
• writer = pd.ExcelWriter('output.xlsx’)
df1.to_excel(writer,'Sheet1’)
df2.to_excel(writer,'Sheet2’)
writer.save()