【问题标题】:Combining IAsyncEnumerator and executing them asynchronously结合 IAsyncEnumerator 并异步执行它们
【发布时间】:2021-07-15 21:44:34
【问题描述】:

第一个函数旨在使 linq 能够安全地并行执行 lambda 函数(甚至是 async void 函数)。

所以你可以做 collection.AsParallel().ForAllASync(async x => await x.Action)。

第二个函数旨在使您能够并行组合和执行多个 IAsyncEnumerables 并尽快返回它们的结果。

我有以下代码:

    public static async Task ForAllAsync<TSource>(
        this ParallelQuery<TSource> source, 
        Func<TSource, Task> selector,
        int? maxDegreeOfParallelism = null)
    {
        int maxAsyncThreadCount = maxDegreeOfParallelism ?? Math.Min(System.Environment.ProcessorCount, 128);
        using SemaphoreSlim throttler = new SemaphoreSlim(maxAsyncThreadCount, maxAsyncThreadCount);

        IEnumerable<Task> tasks = source.Select(async input =>
        {
            await throttler.WaitAsync().ConfigureAwait(false);
            
            try
            {
                await selector(input).ConfigureAwait(false);
            }
            finally
            {
                throttler.Release();
            }
        });

        await Task.WhenAll(tasks).ConfigureAwait(true);
    }

    public static async IAsyncEnumerable<T> ForAllAsync<TSource, T>(
        this ParallelQuery<TSource> source,
        Func<TSource, IAsyncEnumerable<T>> selector,
        int? maxDegreeOfParallelism = null,
        [EnumeratorCancellation]CancellationToken cancellationToken = default) 
        where T : new()
    {
        IEnumerable<(IAsyncEnumerator<T>, bool)> enumerators = 
            source.Select(x => (selector.Invoke(x).GetAsyncEnumerator(cancellationToken), true)).ToList();

        while (enumerators.Any())
        {
            await enumerators.AsParallel()
                .ForAllAsync(async e => e.Item2 = (await e.Item1.MoveNextAsync()), maxDegreeOfParallelism)
                .ConfigureAwait(false);
            foreach (var enumerator in enumerators)
            {
                yield return enumerator.Item1.Current;
            }
            enumerators = enumerators.Where(e => e.Item2);
        }
    }

在迭代器到达末尾后,代码会以某种方式继续返回结果。

我正在使用这些函数来组合多个 IAsyncEnumerable 函数线程,这些函数调用 API 端点,但相同类型的结果除外。

为什么?

【问题讨论】:

  • 这似乎与您的帖子an hour ago 非常相似。发生了什么变化?
  • 不同的问题。修复 ToList() 后,现在代码不会停止返回结果。根据我对接受的答案的理解,其余代码应该是正确的。
  • 关于返回IAsyncEnumerable&lt;T&gt; 的第二个ForAllAsync 方法,您可能需要查看System.Interactive.Async 包中AsyncEnumerableEx.Merge 运算符的实现。该运算符具有以下签名:public static IAsyncEnumerable&lt;TSource&gt; Merge&lt;TSource&gt;(this IEnumerable&lt;IAsyncEnumerable&lt;TSource&gt;&gt; sources);
  • 这看起来很像我所需要的。谢谢!不过我很好奇我做错了什么。
  • PLINQ 库在设计上不是异步友好的,单个 ForAllAsync 运算符不会使其异步友好。因此,对于您的异步问题,您最好忘记 AsParallel 作为解决方案。您的ForAllAsync 实现与在更流行的IEnumerable&lt;T&gt; 接口上运行的ForEachAsync 实现(12)非​​常相似(如果不相同)。

标签: c# multithreading linq parallel-processing iasyncenumerable


【解决方案1】:

(IAsyncEnumerator&lt;T&gt;, bool) 类型是 ValueTuple&lt;IAsyncEnumerator&lt;T&gt;, bool&gt; 类型的简写,value type。这意味着在分配时它不是通过引用传递的,而是被复制的。所以这个 lambda 不能按预期工作:

async e => e.Item2 = (await e.Item1.MoveNextAsync())

它不会更改存储在列表中的条目的bool 部分,而是更改临时副本的值,因此不会保留更改。

要使其按预期工作,您必须切换到 reference type tuples (Tuple&lt;IAsyncEnumerator&lt;T&gt;, bool&gt;),或替换列表中的整个条目:

List<(IAsyncEnumerator<T>, bool)> enumerators = source./*...*/.ToList()
//...
var entry = enumerators[index];
enumerators[index] = (entry.Item1, await entry.Item1.MoveNextAsync());

请注意 List&lt;T&gt;is not thread-safe,因此为了从多个线程同时安全地更新它,您必须使用 lock 保护它。

【讨论】:

  • 好收获。只读元组不允许 bool 更改,因此在这些情况下,必须替换整个条目。仍在测试中。
  • 我创建了一个包含两个值的类。工作精美,谢谢!遗憾的是,它并不太快,因为按照我编写代码的方式,线程要等到所有线程都完成后再旋转任何新线程。我尝试再次实施 Merge,确保我做得正确,但它仍然很慢。最后,Merge 需要 300 秒,您帮助我修复的实现需要大约 120 秒,我在初始帖子中的 cmets 中指出的替代但更脏的实现大约需要 60 秒,所有这些都是针对相同的查询和相同的结果。
  • @EduardG AsyncEnumerableEx.Merge 比自定义实现慢五倍是奇怪和意外的。我的猜测是selector 投射的IAsyncEnumerable&lt;T&gt;s 会相互干扰,并且同时枚举太多会导致系统资源耗尽。这可能就是您在自定义机制中包含 maxDegreeOfParallelism 参数的原因。在能够提供任何具体解释或建议之前,我需要查看您用于创建序列的实际 selector
猜你喜欢
  • 1970-01-01
  • 2015-03-12
  • 2018-05-06
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2018-08-18
  • 2012-02-22
相关资源
最近更新 更多