【问题标题】:C# dotnet core multithreaded read/writeC# dotnet core 多线程读/写
【发布时间】:2020-01-14 10:23:18
【问题描述】:

我刚开始学习 C# 和 dotnet,目前正在做一个小项目。该项目的目的是将两个 200 MB 的 csv 文件合并为一个。本质上,它是具有相同项目但语言不同的同一个文件。我需要做的是从一个文件中读取几列,然后通过匹配两个文件中的项目 ID 将它们添加到另一个文件中。

上面我做了(程序运行得非常快,24 秒,+/- 60MB RAM)但是....应用程序只使用一个线程来执行此操作。我想做的是将程序划分为使用两个线程: 一种通过 ID 匹配项目并创建新的 csv 就绪字符串(大部分逻辑,返回字符串)。 第二个从第一个中选择字符串并将其写入本地文件,而第一个开始在下一行工作。

以上是否可行,如果可以,有人可以指出正确的方向吗?

【问题讨论】:

  • 听起来很适合生产者-消费者模式。请看这个答案 - stackoverflow.com/a/42197839/4553518
  • 检查ConcurrentQueue 以从一个线程收集字符串(Enqueue 方法)并成为文件写入线程的来源(循环中调用TryDequeue 方法)。可以使用多个匹配线程,但您必须将第二个 csv 文件分成几部分。您可以使用CancellationTokenSource.Token 向写入线程发送stop 信号。
  • 通常当您使用文件系统时,使用线程实际上会减慢您的代码速度。
  • @Enigmativity 应该使用一个线程来写入文件以避免性能下降。但是可以使用多个线程来做一些计算(比如加入 csv 文件)
  • @oleksa - 这没有任何意义。

标签: c# .net multithreading


【解决方案1】:

解决方案是使用 Async/Await,然后异步读取文件 1 并同时处理第二部分。但是,它并没有带来任何性能提升。

【讨论】:

  • 通常情况下,多线程或并行不会带来您期望的相同收益,除非您明确处理超过管理多个线程开销的长操作。
  • 您介意更新您的答案以包含您最终搭建脚手架来评估此问题的代码吗?这将更好地帮助有类似问题的未来读者。
猜你喜欢
  • 1970-01-01
  • 2017-06-19
  • 1970-01-01
  • 1970-01-01
  • 2014-06-22
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多