【发布时间】:2020-07-24 04:12:47
【问题描述】:
我正在尝试读取和清理 Excel 工作表中的数据,并将清理后的数据导入 MySQL 数据库。我的问题是 Excel 工作表的阅读部分花费了太长时间。我想尽可能优化这个时间。
我尝试了以下方法:
from openpyxl import load_workbook
from openpyxl.utils.dataframe import dataframe_to_rows
start_time = datetime.datetime.now()
wb = load_workbook(filename='Book1.xlsx', read_only=True, data_only=True)
ws=wb.active
column = ws.max_column
row = ws.max_row
for i in range(1, row+1):
for j in range(1, column+1):
cell_obj = ws.cell(row=i, column=j)
if cell_obj.value != None:
print(cell_obj.value)
print('----------------This Row this execute--------------------------------')
end_time = datetime.datetime.now()
print(end_time-start_time)
我非常感谢任何建议,例如 Cython,但请不要建议使用 CSV 文件。
【问题讨论】:
-
我在git 上有未解决的问题。寻求帮助。
标签: python python-3.x python-2.7 cython cythonize