【发布时间】:2019-01-26 21:52:03
【问题描述】:
我正在尝试使用 pandas 读取一个 excel 文件(+50000 行),它在所有情况下都会给我同样的错误。 代码:
strfile='C:\\Users\\...\\excel_files\\excelfile_01.xls'
尝试01:
import pandas as pd
data = pd.read_excel(strfile, low_memory=False)
尝试02:
import pandas as pd
data = pd.read_excel(strfile, encoding='utf-16-le',low_memory=False)
尝试03:
import pandas as pd
data = pd.read_excel(strfile, encoding='sys.getfilesystemencoding()',low_memory=False)
尝试04:
import pandas as pd
data = pd.read_excel(strfile, encoding='latin-1',low_memory=False)
所有情况下的错误:
UnicodeDecodeError: 'utf-16-le' codec can't decode bytes in position 146-147: unexpected end of data
任何帮助/提示将不胜感激。 提前致谢。
【问题讨论】:
-
encoding='latin-1'? -
@coldspeed,谢谢,已经测试过了,但与结果相同的错误
-
作为测试,您是否尝试过另存为 CSV 并使用
pd.read_csv? -
@jpp 我已经用 1 个文件进行了测试(我有 400 多个 excel 文件需要阅读)但给了我以下错误:'utf-8' codec can't decode byte 0xd0 in position 0:无效的继续字节
-
尝试以现代
.xlsx格式保存您的旧.xls文件并将其发送至pd.read_excel()