【发布时间】:2019-02-05 00:18:41
【问题描述】:
我一直在 Jupyter 笔记本中处理一个项目,并想使用重复数据删除。通过 anaconda,windows 机器上只有 dedupe-hcluster 可用,所以我安装了它并尝试在笔记本中导入 hcluster,结果出现此错误:
“ImportError:DLL 加载失败:%1 不是有效的 Win32 应用程序。”
根据我阅读的内容,这意味着 Python 是 32 位,而 hcluster 是 64 位,反之亦然。我不清楚如何解决这个问题。
然后我尝试将 notebook 转换为 Pycharm 脚本,以便我可以使用其他版本的 dedupe,dedupe、dedupe-hcluster 或 pandas-dedupe。我在安装 pandas-dedupe 时遇到了问题,所以选择了前两个。导入重复数据删除会出现此错误:
“ImportError: 没有名为 _lowlevel 的模块”
并且导入 hcluster 会出现此错误:
“ImportError: 无法导入名称 _hierarchy”
我已经对所有这三个问题进行了无休止的阅读,并且离解决其中任何一个问题还差得远。 任何有关如何解决上述任何问题的建议将不胜感激。
【问题讨论】: