【发布时间】:2018-03-28 15:26:15
【问题描述】:
我必须将数据从 excel 文件导入数据库。 这些文件的结构与模型的结构不匹配,所以我想我需要做一些数据操作来相应地安排元组。
我必须导入的文件如下所示:
django-model 有以下属性:Country, Commodity, Year, Value
那么读取数据的最佳方式是什么,以正确的结构排列数据并将其导入数据库(最好自动更新现有元组)。
我花了很多时间研究现有的 python 和 django 库来满足这个要求(如 PyExcel、Pandas、Django-Excel、Django-Import-Export),但我真的不知道哪个是最好的以及是否支持在导入前重新排列数据。
希望你能给我一些关于这个任务的建议和解决方案:)
【问题讨论】:
-
什么是“数据库”?您只是将文件上传到数据库,还是必须进行某种分析?到目前为止,您尝试过什么?
-
@Evan 我只想从文件中获取数据到数据库中,不需要分析。但如上所述,我需要手动调整结构,因为数据集不是每年分开的。基本上我认为一些库允许我将 excel 数据读入数据结构(数组或字典),然后编辑/调整这个数组,然后将它输入到数据库中是最好的。不幸的是,我没有从任何提到的库中找到有关此的信息。
-
根据您的说法,我建议使用 pandas 库及其 read_excel() 函数。您可以创建数据框,对其进行操作,然后将其输出到 CSV 或数据库(例如 SQL),但如果您不告诉我们您的数据库是什么,我们将无法帮助您。
-
@Evan 好的,我会查一下。该数据库是带有 django 模型的 PostgreSQL。数据库对我如何实现功能有影响吗?
标签: python django pandas pyexcel django-excel