【问题标题】:Transposition table causes chess engine to lose转置表导致国际象棋引擎丢失
【发布时间】:2015-12-10 03:40:38
【问题描述】:

前奏:我知道这个问题对于 Stack Overflow 之类的人来说可能有点过于宽泛。虽然,我尝试添加尽可能多的信息。

我正在从头开始用 C++ 编写一个国际象棋引擎,并且大部分已经完成(除了它的评估功能很弱)。奇怪的是,每次启用转置表时,引擎都会因一个非常明显的错误而失败(放弃一个皇后,或者有时是一个皇后和另一块)。禁用转置表探测时,引擎可以轻松战胜 Nero 和 TSCP。

我使用了一个非常简单的转置表实现,它采用始终替换方案,取自 Bruce Morland 的网站 here

这是探测实现:

bool probe_table(TranspositionTable& t_table, unsigned int ply,
uint64 hash_key, unsigned int depth, unsigned int& pv_move, int& score,
int alpha, int beta)
{
    unsigned int index = hash_key % t_table.num_entries;

    assert(index < t_table.num_entries);

    if(t_table.t_entry[index].hash_key == hash_key)
    {
        pv_move = t_table.t_entry[index].move;

        if(t_table.t_entry[index].depth >= depth)
        {
            score = t_table.t_entry[index].score;

            if(score > IS_MATE) score -= ply;
            else if(score < -IS_MATE) score += ply;

            switch(t_table.t_entry[index].flag)
            {
                case TFALPHA:
                {
                    if(score <= alpha)
                    {
                        score = alpha;
                        return 1;
                    }
                }
                case TFBETA:
                {
                    if(score >= beta)
                    {
                        score = beta;
                        return 1;
                    }
                }
                case TFEXACT:
                {
                    return 1;
                }
                default: assert(false); // At least one flag must be set.
            }
        }
    }

    return 0;
}

在 alpha-beta 搜索期间,表被探测(条目也被正确存储,取决于截止值等):

if(probe_table(board.t_table, board.ply, board.hash_key, depth, pv_move,
    score, alpha, beta))
{
    return score;
}

编辑:为了完整起见,这里是在搜索中存储代码的重要部分的 sn-p:

if(score > alpha) // Alpha cutoff.
{
    if(score >= beta) // Beta cutoff.
    {
        ...

        store_entry(board.t_table, board.ply, board.hash_key, best_move,
                    beta, depth, TFBETA);

        return beta;
    }

    alpha = score;

    ...
    }
}

...

assert(alpha >= old_alpha);

if(alpha != old_alpha)
{
    store_entry(board.t_table, board.ply, board.hash_key, best_move,
        best_score, depth, TFEXACT);
}
else
{
    store_entry(board.t_table, board.ply, board.hash_key, best_move,
        alpha, depth, TFALPHA);
}

我已经考虑并探索了引擎其他所有部分的故障,但没有发生。完全禁用探测(但仍使用表格存储 PV 线),效果很好。

我还考虑过我幼稚的思考是否会影响事情。为了思考,只要有思考动作可用,我只需将bestmove xxxx ponder xxxx 打印到 UCI。如果启用了思考,GUI 让引擎思考(这只是一个常规搜索,但稍后将通过转置表使用)。

为了测试,我完全禁用了思考,没有任何改善。在获得了一段时间的胜利后,引擎干脆放弃了它的女王。我相信这可能是由于表格中的某些错误条目,或者可能是我无法理解的其他某种不稳定因素。

这就是我需要以前遇到过这种情况的人为我指明大方向的地方。

编辑:正如 grek40 所问,这是一个刚刚发生的例子(引擎是白色的,白色移动):

引擎又一次,基于愚蠢的动作输掉了比赛。请注意,引擎达到了这样一个错误的位置,可能是因为转置表本身。

分析这个位置在比赛期间填充的换位表:

info score cp -425 depth 1 nodes 1 time 0 pv e1d1
info score cp -425 depth 2 nodes 2 time 0 pv e1d1
info score cp -425 depth 3 nodes 3 time 0 pv e1d1
info score cp -425 depth 4 nodes 4 time 0 pv e1d1
info score cp -425 depth 5 nodes 5 time 0 pv e1d1
info score cp -425 depth 6 nodes 6 time 0 pv e1d1
info score cp -425 depth 7 nodes 7 time 0 pv e1d1
info score cp -425 depth 8 nodes 8 time 0 pv e1d1
info score cp -425 depth 9 nodes 9 time 0 pv e1d1
info score cp -425 depth 10 nodes 10 time 0 pv e1d1
info score cp -440 depth 11 nodes 10285162 time 3673 pv f5f8 e7f8 b2b3 b7b5 e1c1 d6d5 a3a4
info score cp -440 depth 12 nodes 29407669 time 10845 pv f5f8 e7f8 e1f1 f8e7 f1f5 d6d5
bestmove f5f8 ponder e7f8

再次分析没有转置表(实际上,有表,但已清除):

info score cp -415 depth 1 nodes 82 time 0 pv f5f8
info score cp -415 depth 2 nodes 200 time 0 pv f5f8 e7f8
info score cp -405 depth 3 nodes 900 time 0 pv f5f8 e7f8 b2b3
info score cp -425 depth 4 nodes 2936 time 1 pv f5f8 e7f8 b2b3 f8e7
info score cp -415 depth 5 nodes 10988 time 4 pv f5f8 e7f8 b2b3 b7b5 e1d1
info score cp -425 depth 6 nodes 65686 time 25 pv f5f8 e7f8 e1f1 d7e7 f1d1 b7b5
info score cp -420 depth 7 nodes 194124 time 76 pv f5f8 e7f8 b2b3 b7b5 e1f1 f8e7 f1f7
info score cp -425 depth 8 nodes 357753 time 141 pv f5f8 e7f8 b2b3 b7b5 e1f1 f8e7 f1f5 d7c7
info score cp -425 depth 9 nodes 779686 time 292 pv f5f8 e7f8 e1f1 f8e7 f1f5 h4h8
info score cp -425 depth 10 nodes 1484178 time 560 pv f5f8 e7f8 e1f1 f8e7 f1f5 h4h8
info score cp -435 depth 11 nodes 29481132 time 11117 pv f5f8 d6d5 e1e5
info score cp -435 depth 12 nodes 106448053 time 41083 pv f5f8 e7f8
bestmove f5f8 ponder e7f8

值得注意的是,在深度10上,从转置表搜索得到的分数是准确的。

编辑:这个位置是在赛后分析的。游戏过程中,引擎没有来得及完成更高深度的搜索,导致播放e1d1,太可笑了。

为什么会发生这种情况?引擎从深度 1 开始找到更好的移动,但从换位表中找到了不同的移动。我也想知道为什么转置表搜索中没有PV行。

我最好的猜测是来自 Bruce Morland 网站的搜索不稳定引述:Zobrist 密钥不考虑到达节点所采用的路径。并非每条路径都是相同的。如果在树中的某个其他点遇到,哈希元素中的分数可能基于包含重复的路径。重复可能会导致平局得分,或者至少是不同的得分。

编辑:当没有 TFEXACT 值时,我尝试禁用存储到表中。也就是说,我停止存储和检索 TFALPHA/TFBETA 值,它运行良好。有人知道为什么吗?

【问题讨论】:

  • 您能否通过确定的移动顺序重现您的问题?
  • 你需要调试你的代码。准确找出哪些代码路径由于转置表检查而导致出现错误的移动。添加函数以转储表。仅为表添加单元测试。当您确实确定发生了换位时,请打印一些内容。
  • @grek40 添加了一个刚刚发生的例子。
  • 我最好的猜测是你的散列被破坏了。要么它过于频繁地产生冲突,要么你没有在哈希中包含一些重要的信息(例如移动的一侧)。尝试以这种方式添加存储整个棋盘位置的代码并检查冲突(即不同位置的相同哈希)。
  • 你可以看我的github获取我的TT代码:github.com/fernandotenorio/Tunguska

标签: c++ chess


【解决方案1】:

我确实注意到您设置您的(通过引用)pv_move之前检查您的深度标准是否满足。这意味着 probe_table 可能正在更改 pv_move 并且仍然返回 0(没有命中)(并且 not 设置 score)。这看起来很糟糕?

【讨论】:

  • 如果哈希表条目存在,则为PV行,其第一个元素为PV移动,与深度无关。 PV 移动作为移动的得分较高,并首先由 Alpha-Beta 搜索。如果发现移动不好,它就会正常移动。但是,如果条目存在并且满足深度标准,则使用标志设置相关分数,然后 probe_table() 返回。然后 Alpha-Beta 看到满足深度标准并返回该位置的分数而不进行搜索。 TL;DR 这是设计使然。
  • 好的,谢谢。感谢您提供 Morland 链接和您的代码。将您的代码与站点代码进行比较,看起来 Morland 从未在移动循环 inside 中记录 TFALPHA 哈希,只有在此之后才具有最大 alpha。你似乎在存储alpha==oldalphainside。不知道这是否也能有所作为......
  • TFALPHA 没有被记录在移动循环中。每当发生 beta 截止时,TFBETA 就在移动循环内。我正计划尝试删除 Alpha/Beta 截止条目并尝试仅使用 TFEXACT 条目,看看是否会有所不同。
  • 虽然,你可能是对的。我会尝试使用 Morland 的确切代码。
  • 其实,没关系,没关系。如果 score &gt;= beta 则在使用 TFBETA 散列后立即返回 beta。
猜你喜欢
  • 2022-01-05
  • 2015-05-02
  • 1970-01-01
  • 1970-01-01
  • 2022-01-11
  • 1970-01-01
  • 1970-01-01
  • 2020-04-26
  • 2012-03-22
相关资源
最近更新 更多