【问题标题】:Most efficient way of finding circular references in list在列表中查找循环引用的最有效方法
【发布时间】:2018-03-11 02:48:25
【问题描述】:

鉴于以下重定向列表

[
    {
        "old": "a",
        "target": "b"
    },
    {
        "old": "b",
        "target": "c"
    },
    {
        "old": "c",
        "target": "d"
    },
    {
        "old": "d",
        "target": "a"
    },
    {
        "old": "o",
        "target": "n"
    },
    {
        "old": "n",
        "target": "b"
    },
    {
        "old": "j",
        "target": "x"
    },
    {
        "old": "whatever",
        "target": "something"
    }
]

在这里我们可以看到第一项“a”应该重定向到“b”。 如果我们遵循列表,我们可以看到以下模式:

a -> b
b -> c
c -> d
d -> a

所以我们最终会得到一个循环引用,因为“a”最终会指向“d”而“d”指向“a”。

找到循环引用的最有效方法是什么?

我在 C# 中提出了以下算法

var items = JsonConvert.DeserializeObject<IEnumerable<Item>>(json)
    .GroupBy(x => x.Old)
    .Select(x => x.First())
    .ToDictionary(x => x.Old, x => x.Target);
var circulars = new Dictionary<string, string>();
foreach (var item in items)
{
    var target = item.Value;
    while (items.ContainsKey(target))
    {
        target = items[target];

        if (target.Equals(item.Key))
        {
            circulars.Add(target, item.Value);
            break;
        }
    }
}

这会给我一个包含 4 个项目的列表,如下所示:

[
    {
        "old": "a",
        "target": "b"
    },
    {
        "old": "b",
        "target": "c"
    },
    {
        "old": "c",
        "target": "d"
    },
    {
        "old": "d",
        "target": "a"
    }
]

但我只对告诉用户类似的事情感兴趣

“嘿,你不能那样做,这将是一个循环引用,因为“a”指向“b”,“b”指向“c”,“d”指向“a”

那么,你们有什么建议吗? 我确信存在一些其他(更好的)算法可以做到这一点...... :)

【问题讨论】:

  • 尝试图论中的循环检测算法
  • 马上查一下,谢谢! :)
  • 还是“嘿,你不能那样做,B 和 C 是循环引用,因为 A 和 D”? - 你只能报告一个循环 - 它没有开始和结束 - 这是一个循环。
  • 嗯,好问题。目标是通知用户,由于 B、C 和 D,他们最终会进入重定向循环(我猜?)
  • 在我们的软件中,我们说“检测到循环,包括节点:A、B、C、D”。

标签: c# algorithm circular-reference cycle-detection


【解决方案1】:

虽然通用图形循环查找算法可以工作,但由于 “旧是唯一的,目标不是” 约束,您的情况有点特殊。这实际上意味着,每个节点只能有一个后继节点,因此它最多只能是一个周期的一部分。另外,当DFS-Traversing节点时,不会有任何fork,因此迭代DFS实现变得非常容易。

给定一个任意的起始节点,这个函数可以找到一个从起始节点可达的循环:

/// <summary>
/// Returns a node that is part of a cycle or null if no cycle is found
/// </summary>
static string FindCycleHelper(string start, Dictionary<string, string> successors, HashSet<string> stackVisited)
{
    string current = start;
    while (current != null)
    {
        if (stackVisited.Contains(current))
        {
            // this node is part of a cycle
            return current;
        }

        stackVisited.Add(current);

        successors.TryGetValue(current, out current);
    }

    return null;
}

为了保持效率,可以将其扩展为在到达已检查节点时提前返回(使用previouslyVisited):

/// <summary>
/// Returns a node that is part of a cycle or null if no cycle is found
/// </summary>
static string FindCycleHelper(string start, Dictionary<string, string> successors, HashSet<string> stackVisited, HashSet<string> previouslyVisited)
{
    string current = start;
    while (current != null)
    {
        if (previouslyVisited.Contains(current))
        {
            return null;
        }
        if (stackVisited.Contains(current))
        {
            // this node is part of a cycle
            return current;
        }

        stackVisited.Add(current);

        successors.TryGetValue(current, out current);
    }

    return null;
}

以下函数用于保持访问集的一致性

static string FindCycle(string start, Dictionary<string, string> successors, HashSet<string> globalVisited)
{
    HashSet<string> stackVisited = new HashSet<string>();

    var result = FindCycleHelper(start, successors, stackVisited, globalVisited);

    // update collection of previously processed nodes
    globalVisited.UnionWith(stackVisited);

    return result;
}

为每个old 节点调用它以检查循环。当检测到循环起始节点时,可以单独创建循环信息:

// static testdata - can be obtained from JSON for real code
IEnumerable<Item> items = new Item[]
{
    new Item{ Old = "a", Target = "b" },
    new Item{ Old = "b", Target = "c" },
    new Item{ Old = "c", Target = "d" },
    new Item{ Old = "d", Target = "a" },
    new Item{ Old = "j", Target = "x" },
    new Item{ Old = "w", Target = "s" },
};
var successors = items.ToDictionary(x => x.Old, x => x.Target);

var visited = new HashSet<string>();

List<List<string>> cycles = new List<List<string>>();

foreach (var item in items)
{
    string cycleStart = FindCycle(item.Old, successors, visited);

    if (cycleStart != null)
    {
        // cycle found, get detail information about involved nodes
        List<string> cycle = GetCycleMembers(cycleStart, successors);
        cycles.Add(cycle);
    }
}

以任何你想要的方式输出你找到的循环。例如

foreach (var cycle in cycles)
{
    Console.WriteLine("Cycle:");
    Console.WriteLine(string.Join(" # ", cycle));
    Console.WriteLine();
}

GetCycleMembers 的实现非常简单——它依赖于正确的起始节点:

/// <summary>
/// Returns the list of nodes that are involved in a cycle
/// </summary>
/// <param name="cycleStart">This is required to belong to a cycle, otherwise an exception will be thrown</param>
/// <param name="successors"></param>
/// <returns></returns>
private static List<string> GetCycleMembers(string cycleStart, Dictionary<string, string> successors)
{
    var visited = new HashSet<string>();
    var members = new List<string>();
    var current = cycleStart;
    while (!visited.Contains(current))
    {
        members.Add(current);
        visited.Add(current);
        current = successors[current];
    }
    return members;
}

【讨论】:

  • 不错!非常感谢,我已经修改了我的代码,我也用你的代码进行了测试,我得到了相同的输出,非常好。无论如何,我似乎发现了一个错误。我在上面的示例中更新了 JSON,我添加了另外两个项,键为“o”和键“n”。 “n”指向“b”并且我认为算法应该能够看到b指向c等等,你明白我的意思吗?
  • @JOSEFtw 无论是从a 还是b 开始,都是同一个循环。我的实现旨在找到每个循环,而不是在途中某处以循环结束的每个起点。如果你想要不同的结果,你需要不同的实现。
  • 好的,所以键“n”不应该出现在循环中,对吗?
  • @JOSEFtw 是的,这是我的理解,因为进入循环后你不会再次到达n(它不是循环的一部分)
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多