【发布时间】:2020-01-14 10:23:18
【问题描述】:
我刚开始学习 C# 和 dotnet,目前正在做一个小项目。该项目的目的是将两个 200 MB 的 csv 文件合并为一个。本质上,它是具有相同项目但语言不同的同一个文件。我需要做的是从一个文件中读取几列,然后通过匹配两个文件中的项目 ID 将它们添加到另一个文件中。
上面我做了(程序运行得非常快,24 秒,+/- 60MB RAM)但是....应用程序只使用一个线程来执行此操作。我想做的是将程序划分为使用两个线程: 一种通过 ID 匹配项目并创建新的 csv 就绪字符串(大部分逻辑,返回字符串)。 第二个从第一个中选择字符串并将其写入本地文件,而第一个开始在下一行工作。
以上是否可行,如果可以,有人可以指出正确的方向吗?
【问题讨论】:
-
听起来很适合生产者-消费者模式。请看这个答案 - stackoverflow.com/a/42197839/4553518
-
检查ConcurrentQueue 以从一个线程收集字符串(
Enqueue方法)并成为文件写入线程的来源(循环中调用TryDequeue方法)。可以使用多个匹配线程,但您必须将第二个 csv 文件分成几部分。您可以使用CancellationTokenSource.Token 向写入线程发送stop信号。 -
通常当您使用文件系统时,使用线程实际上会减慢您的代码速度。
-
@Enigmativity 应该使用一个线程来写入文件以避免性能下降。但是可以使用多个线程来做一些计算(比如加入 csv 文件)
-
@oleksa - 这没有任何意义。
标签: c# .net multithreading