【发布时间】:2018-04-17 15:26:36
【问题描述】:
我将 Json 用于 NLP/ML,这意味着我的 json 文件是 HUUUGE。
使用 MyPy(不要混淆这是 python。)
import json
from pprint import pprint
from typing import List
from Models.NewsDataModel import NewsDataModel, CreateNewNewsModelFromJson
jsonDataPath = "../DataSource/evileye-quorraengine-News-export.json"
rootJson = json.load(open(jsonDataPath))
def GetNewsData(max:int=0, hasMaxValue:bool=False)->List[NewsDataModel]:
newsDataList = []
jsonKeys = rootJson.keys()
for newsDataKey in jsonKeys:
newNewsData = CreateNewNewsModelFromJson(rootJson[newsDataKey])
newsDataList.append(newNewsData)
if hasMaxValue and len(newsDataList) >= max:
break
return newsDataList
但是。因为我有 120000 个密钥,所以只获取密钥需要 5 秒以上。 我如何限制要检索的键?
【问题讨论】: