【发布时间】:2012-12-31 04:37:52
【问题描述】:
将 CSV 文件读入pandas DataFrame 的 Python 方法是什么(然后我可以将其用于统计操作,可以有不同类型的列等)?
我的CSV文件"value.txt"有以下内容:
Date,"price","factor_1","factor_2"
2012-06-11,1600.20,1.255,1.548
2012-06-12,1610.02,1.258,1.554
2012-06-13,1618.07,1.249,1.552
2012-06-14,1624.40,1.253,1.556
2012-06-15,1626.15,1.258,1.552
2012-06-16,1626.15,1.263,1.558
2012-06-17,1626.15,1.264,1.572
在 R 中,我们将使用以下方法读取此文件:
price <- read.csv("value.txt")
这将返回一个 R data.frame:
> price <- read.csv("value.txt")
> price
Date price factor_1 factor_2
1 2012-06-11 1600.20 1.255 1.548
2 2012-06-12 1610.02 1.258 1.554
3 2012-06-13 1618.07 1.249 1.552
4 2012-06-14 1624.40 1.253 1.556
5 2012-06-15 1626.15 1.258 1.552
6 2012-06-16 1626.15 1.263 1.558
7 2012-06-17 1626.15 1.264 1.572
有没有 Pythonic 方式来获得相同的功能?
【问题讨论】:
-
你能推荐一下dataframe有什么特别之处吗?你可以用它做什么统计操作?
-
dataframe 可以包含多种类型的数据,例如每一列都可以是一个列表,您可以单独对待每个列表,对其应用一些函数,并讨论统计操作,例如均值 , 标准差 , 四分位数 , ...
-
谢谢!这实际上对我非常有用。我总是用 csv 模块加载 csv 文件,它给了我一个列表列表。这个 data.frame 听起来好多了!
-
@LWZ:查看我的编辑和链接,如果简洁地回答了您的问题,请查看我的链接。这就是我们在这里“出售”福利包所能做的尽可能多的事情。更广泛的问题“与普通 Python 数组/列表列表相比,使用 pandas 数据帧有什么好处?” 有很多好处,这里就不一一列举了……
标签: python pandas csv dataframe