【发布时间】:2017-06-15 21:24:24
【问题描述】:
我正在使用 Pandas 的 read_csv 方法在 Python 中读取一个巨大的 csv 文件。我有一列包含格式为:YYYY-MM-DD HH:MM:SS 的日期和时间(都在同一列中)。 I 是数据的第 0 列。目前我正在做的是:
format = "%Y-%m-%d %H:%M:%S"
parser = lambda x: pd.datetime.strptime(x, format)
data = pd.read_csv("path/to/file", sep=',', encoding='ISO-8859-1', parse_dates=[0], date_parser=parser)
但它告诉我在导入时使用指定 dtype 选项。我尝试在调用中添加一个参数:dtype = {[0]:pandas.datetime} 但它不起作用。你有更好的解决方法吗?或者有人可以解释如何正确使用 dtype 参数吗?我尝试阅读文档,但没有太大帮助。
【问题讨论】:
-
你能发布你得到的实际错误吗?
-
尝试不使用
date_parser参数。 Pandas 对此有一个很好的默认设置。
标签: python python-3.x csv pandas datetime