【发布时间】:2022-05-11 15:43:05
【问题描述】:
我在由企业 IT 严格管理的 Windows 7 笔记本电脑上运行 PostgreSQL 9.6。我没有这台笔记本电脑的管理员权限,但可以通过 BeyondTrust 授予的提升权限做“很多”事情,包括软件安装。
我使用这个数据库从各种来源导入一些中等规模的数据集,并进行一些深入的分析和报告。这些数据集具有疯狂的编码和格式变化,这在导入它们时会带来挑战。对于一个数据集,我首先将其导入 MySQL,从数据中去除违规字符,将其导出回 CSV,最后将清理后的数据导入 PostgreSQL。
作为实验,我在运行 macOS 10.12 的家用 iMac 上安装了 PostgreSQL 9.6 和 pg_loader,它能够毫无问题地导入所有数据集。
以这一切为背景,我需要使用pg_loader 来导入各种数据集。但是,该网站不提供 Windows 安装程序或在 Windows 上编译它的说明。
谁能给我指明以下方向之一,列表从最可取到最不可取?
- pg_loader 的 Windows 安装程序
- 可与 pg_loader 相媲美的 Windows 安装程序
- 在 Windows 上编译 pg_loader 的详细说明
- 在导入前使用 Python 清理数据的建议(警告:我对 Python 的经验很少)
【问题讨论】:
-
当谈到 Windows 的 pgloader 时,我觉得即使作者不是一个伟大的粉丝,并且在他的 git 页面上对它感兴趣。 github.com/dimitri/pgloader/issues/385 你不能调整你的 postgres 编码以允许你必须在 MySQL 中删除的“字符”吗?您是否尝试过仅使用 COPY 命令来加载数据? postgresql.org/docs/9.6/static/sql-copy.html 对于 python 方法,您可以读取文件并在导入之前使用 replace / strip 删除有问题的字符。
标签: windows postgresql pgloader