【发布时间】:2017-06-22 08:35:25
【问题描述】:
我有一个解析100MB 文件的程序,然后我在数据上应用了一些函数。我没有实现检查瓶颈的功能...
所以我只是把我的实现放在评论中,然后把pass
为什么 python 使用这么多内存?
解析文件需要 15 分钟,我可以看到 python 正在使用 3GB 内存,CPU 使用率为 15%,内存使用率为 70%。
它是否应用程序是 io 绑定的?
如何加快解析速度?或者对慢解析没有什么可做的吗?
文件示例: 年龄和薪水
50 1000
40 123
1233 123213
代码:
def parse(pathToFile):
myList = []
with open(pathToFile) as f:
for line in f:
s = line.split()
age, salary = [int(v) for v in s]
Jemand = Mensch(age, salary)
myList.append(Jemand)
return myList
【问题讨论】:
-
根据您要执行的操作,您最好使用类似
numpy的np.loadtxt来快速读取文件。
标签: python python-2.7 parsing io