【发布时间】:2013-04-04 19:47:18
【问题描述】:
解析 8GB 文本文件的最快方法是什么? Python 的性能会与 c# 相媲美吗?
exampledomain NS ns.anameserver.com.
exampledomain NS ns2.anameserver.com.
exampledomain NS ns3.anameserver.com.
anotherdomain NS ns1.nameservers.com.
cooldomain NS ns.example.com.
cooldomain NS ns2.example.com.
我需要解析每一行并使用每行的第一项和第三项更新数据库表,忽略每行中的 NS。
【问题讨论】:
-
您确实需要进一步扩展您正在尝试做的事情,您可以解析它的速度完全取决于实际过程,更不用说更新数据库的延迟以及变量读取不同存储介质上的速度。
-
嗯,解析一个文本文件很容易......因此,解析它并比较结果
-
如果您知道哪个 Regex 引擎更快是至关重要的,那么您应该尝试两者。
-
在几乎所有情况下,用于读取输入文件的 IO 将比您执行的处理更复杂(除非处理本身涉及 IO,在这种情况下,处理的字符串操作部分仍然是程序的一小部分)。我敢打赌,这无关紧要。您可能需要担心的唯一想法是确保您流式传输数据并且不要一次将整个文件放入内存。