【问题标题】:how can i read 3500 rows from a csv file using pandas?如何使用 pandas 从 csv 文件中读取 3500 行?
【发布时间】:2020-03-22 08:08:12
【问题描述】:

pd.read_csv(...)

  1. 我尝试这样做,但它只读取了 1520 行。但主 CSV 文件有 35000 行。

【问题讨论】:

  • 问题的标题和正文不一致 - 是 3500 行 CSV 文件还是 35000 行 CSV 文件?
  • 您能否提供上下文并解释您的数据是什么样的?您在哪里看到 .csv 文件有 35000 行且 ntot 1520?

标签: pandas data-analysis large-data


【解决方案1】:

您可以简单地在 read_csv() 函数中使用“nrows”字段:

Import pandas as pd
df = pd.read_csv(“some.csv”,nrows=3500)

您也可以在此链接read_csv()找到更多信息

【讨论】:

  • 显示此错误:C:\Users\prono\PycharmProjects\EducationaldataofBD\venv\Scripts\python.exe C:/Users/prono/PycharmProjects/EducationaldataofBD/venv/demo.py Traceback(大多数最近通话最后):文件“pandas/_libs/parsers.pyx”,第 1151 行,在 pandas._libs.parsers.TextReader._convert_tokens 文件“pandas/_libs/parsers.pyx”,第 1281 行,在 pandas._libs.parsers。 TextReader._convert_with_dtype
  • 文件“pandas/_libs/parsers.pyx”,第 1297 行,在 pandas._libs.parsers.TextReader._string_convert 文件“pandas/_libs/parsers.pyx”,第 1520 行,在 pandas._libs .parsers._string_box_utf8 UnicodeDecodeError: 'utf-8' codec can't decode byte 0x92 in position 26: invalid start byte 在处理上述异常期间,发生了另一个异常:Traceback(最近一次调用最后一次):文件“C:/用户/prono/PycharmProjects/EducationaldataofBD/venv/demo.py",第 4 行,在 国家 = pd.read_csv('C:\\Users\\prono\\PycharmProjects\\EducationaldataofBD\\venv\\abc.csv ', nrows=35000)
  • 您需要检查您的 csv 文件的编码。有不同的类型 [参见 py doc][1]。接下来,您可以更改 read_csv() 的编码选项。即:df= pd.read_csv(“some.csv”, encoding=“utf-8”, nrows=3500) [1]: docs.python.org/3/library/codecs.html#standard-encodings
猜你喜欢
  • 2019-08-09
  • 2019-08-12
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2014-11-15
  • 2021-09-24
相关资源
最近更新 更多