【发布时间】:2020-08-04 19:12:42
【问题描述】:
我有一个包含超过 600,000 行和 111 列的 Microsoft Access 表。我需要做的就是以 .csv 格式获取此表(以转换为 Pandas df)或直接转换为 Pandas 数据框。我尝试了以下方法:
-
将表格导出为 .xlsx 格式。这给了我一个包含超过 500,000 kb 数据的工作表,但是当我打开它时完全是空白的。
-
将数据导出为 .txt。我已经这样做了,但看起来表格中的分隔符/不一致的格式存在问题,当你到达后面的列时,这些数据会被搞砸(即,有些列在我不应该出现时都是空值)将 .txt 文件拉入 Pandas)
-
对 pyodbc 包有点混乱,但我已经能够主要找到有关让 Python 进入访问或通过 pyodbc 操作 Access 数据库的信息。
需要明确的是,我不想操纵或关联这个数据库,我只是想获得原始数据,这样我就可以通过我用 Python 构建的随机森林模型来运行它。如果我的任何措辞不正确/有问题,请原谅我,我在今天之前从未使用过 Access。
【问题讨论】:
标签: python excel pandas ms-access export-to-csv