【发布时间】:2013-11-11 18:47:54
【问题描述】:
我最近开始使用 Python 进行编程,并且正在创建一个数据库。
我已经设法从源中提取所有这些文件,因此它们都在我计算机上的一个目录中。
所有这些文件的结构都相同,我想做的是搜索这些多维字典并找到一组特定键的值。
这些json文件的结构都差不多,
{
"userid": 34535367,
"result": {
"list": [
{
"name": 264,
"age": 64,
"id": 456345345
},
{
"name": 263,
"age": 42,
"id": 364563463456
}
]
}
}
就我而言,我想从数百万个 JSON 文件中搜索“名称”键并返回数千个名称的相关数据(质量、ID 和原始用户 ID)。
基本上我在这方面很陌生,我所掌握的一点编程知识都在 Python 中。我很高兴开始学习我需要的任何东西,但我不确定该往哪个方向发展。
【问题讨论】:
-
这些数据存在于数百万个 JSON 文件中而不是适当的数据库中,有什么理由吗?
-
我不得不通过 Web API 调用所有这些,现在我有 200 万个文件,可能过滤掉了 1 亿个选项。
-
根据您查询和更新数据的频率,最好将它们插入数据库中。
-
您需要稍后获取更多数据,还是数据集现在已经完成?
-
哦,好吧,我必须经常访问它,是的,有什么关于最好学习的数据库的建议吗?我将获取数百万条数据
标签: python mysql database json