【问题标题】:reading csv file python 3.6 using pandas使用熊猫读取csv文件python 3.6
【发布时间】:2017-06-15 21:24:24
【问题描述】:

我正在使用 Pandas 的 read_csv 方法在 Python 中读取一个巨大的 csv 文件。我有一列包含格式为:YYYY-MM-DD HH:MM:SS 的日期和时间(都在同一列中)。 I 是数据的第 0 列。目前我正在做的是:

    format = "%Y-%m-%d %H:%M:%S"
    parser = lambda x: pd.datetime.strptime(x, format)
    data = pd.read_csv("path/to/file", sep=',', encoding='ISO-8859-1', parse_dates=[0], date_parser=parser)

但它告诉我在导入时使用指定 dtype 选项。我尝试在调用中添加一个参数:dtype = {[0]:pandas.datetime} 但它不起作用。你有更好的解决方法吗?或者有人可以解释如何正确使用 dtype 参数吗?我尝试阅读文档,但没有太大帮助。

【问题讨论】:

  • 你能发布你得到的实际错误吗?
  • 尝试不使用 date_parser 参数。 Pandas 对此有一个很好的默认设置。

标签: python python-3.x csv pandas datetime


【解决方案1】:

也许你可以在读取文件后尝试格式化列

data = pd.read_csv("path/to/file", sep=',', encoding='ISO-8859-1')

data[0] = pd.to_datetime(data[0], format= "%Y-%m-%d %H:%M:%S")

希望对你有帮助。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2020-10-06
    • 1970-01-01
    • 1970-01-01
    • 2019-11-11
    • 2017-10-27
    • 1970-01-01
    • 2021-08-16
    相关资源
    最近更新 更多