RISCV：如何计算分支指令？答案

【问题标题】：RISCV: how the branch intstructions are calculated?RISCV：如何计算分支指令？
【发布时间】：2019-12-18 12:24:48
【问题描述】：

我试图了解现代 CPU 的工作原理。我专注于 RISC-V。分支的类型很少：

BEQ
BNE
BLT
BGE
BLTU
BGEU

我使用venus 模拟器来测试这个，我也在尝试模拟它，到目前为止它工作得很好，但我不明白，分支是如何计算的。根据我的阅读，ALU 单元只有一个信号输出 - ZERO（除了它的数学输出），只要输出为零，它就会处于活动状态。但是我如何仅根据ZERO 输出来确定是否应该采用分支？它们是如何计算的？

示例代码：

addi t0, zero, 9
addi t1, zero, 10
blt t0, t1, end
end:

分支示例：

BEQ - 减去 2 个数字，如果 ZERO 处于活动状态，则分支

BNE - 减去 2 个数字，如果 ZERO 未激活，则分支

BLT - 在这里我有点困惑；我应该减去然后看符号位，还是什么？

BGE / BGEU - 以及如何区分这些？我应该使用什么数学指令？

谢谢

【问题讨论】：

一个简单的比较器只需要通过从高位进行比较直到找到不同的位来进行字典比较。不需要减法器

标签： cpu cpu-architecture riscv alu riscv32

【解决方案1】：

您不必做减法来比较两个（有符号或无符号）数字。例如，您可以使用级联 7485 chip。有了这个芯片，你可以在不做任何减法的情况下完成所有的分支计算。

【讨论】：

是的，我在我的 prew homeBrew-cpu 中使用过这个，但是，ALU 的零输出有多大用处？

【解决方案2】：

是的，零输出给你相等/不相等。如果运行速度更快（在部分时钟周期中更早准备好）和/或使用更少的功率（更少的晶体管开关），您也可以使用 XOR 而不是 SUB 进行相等比较。

有趣的事实：MIPS 只有 eq / ne 和 signed-compare-against-against-zero 条件，所有这些都可以在没有进位传播或任何其他级联位的情况下快速测试。这很重要，因为它在解码的同一阶段检查分支条件，从而减少了分支延迟。（所以 1 个分支延迟槽隐藏了延迟。）

为什么要使用只有零输出的 ALU？这使得它无法用于除完全相等之外的比较。

您需要其他输出来从减法结果中确定 GT / GE / LE / LT（及其无符号等价物）。

对于无符号条件，您只需要零和一个进位/借位（无符号溢出）标志。

结果的符号位本身不足以满足有符号条件，因为有符号溢出是可能的：(-1) - (-2) = +1 : -1 > -2 (signbit clear) but (8-bit wraparound) 0x80 - 0x7F = +1 (符号位也清楚）但-128 < 127。只有在比较与零时，数字本身的符号位才有用。

如果您扩大结果（通过对输入进行符号扩展并多做一位加/减），这使得有符号溢出不可能，因此第 33 位直接是有符号小于结果。

您还可以从 signed_overflow XOR signbit 获得有符号小于结果，而不是实际扩大 + 添加。如果 RISC-V 有任何架构方式让软件检查有符号整数溢出，您可能还需要 ALU 输出来检测有符号溢出。

可以通过查看进位和从 MSB（符号位）执行来计算有符号溢出。如果这些不同，你就有溢出。即 SF = 这两个进位的 XOR。另请参阅http://teaching.idallen.com/dat2343/10f/notes/040_overflow.txt，详细了解无符号进位与有符号溢出的 2 位和 4 位示例。

在带有 FLAGS 寄存器的 CPU（例如 x86 和 ARM）中，这些 ALU 输出实际上进入一个带有命名位的特殊寄存器。您可以查看x86 manual for conditional-jump instructions 以了解条件名称（如l（有符号小于）或b（无符号））如何映射到这些标志：

签名条件：

jl（又名 RISC-V blt）：如果少则跳转（SF≠ OF）。这是来自减法/ cmp 的输出符号位不等于溢出标志
jle ：小于或等于时跳转 (ZF=1 or SF≠ OF)。
jge（又名 RISC-V bge）：如果大于或等于则跳转（SF=OF）。
jg（又名 RISC-V bgt）：如果更大，则跳短（ZF=0 and SF=OF）。

如果您决定让 ALU 只生成“有符号小于”输出而不是单独的 SF 和 OF 输出，那很好。 SF==OF 就是 !(SF != OF)。

（x86 也有一些相同操作码的助记词同义词，例如 jl = jnge。“只有”16 个 FLAGS 谓词，包括单独的 OF=0（测试溢出，而不是比较结果），以及奇偶校验标志。您只关心实际的有符号/无符号比较条件。）

如果您仔细考虑一些示例案例，例如测试 INT_MAX > INT_MIN，您就会明白为什么这些条件是有意义的，就像我在上面展示的 8 位数字示例一样。

无符号：

jb（又名 RISC-V bltu）：如果低于（CF=1）则跳转。这只是测试进位标志。
jae（又名 RISC-V bgeu）：如果高于或等于（CF=0），则短接。
ja（又名 RISC-V bgtu）：如果高于（CF=0 and ZF=0）则短接。

（请注意，x86 减法设置 CF = 借用输出，因此1 - 2 设置 CF=1。其他一些 ISA（例如 ARM）反转进位标志以进行减法。在实现 RISC-V 时，这将全部在 CPU 内部，在架构上对软件不可见。）

我不知道 RISC-V 是否真的有所有这些不同的分支条件，但是 x86 有。

实现有符号或无符号比较器的方法可能比做减法更简单。

但是，如果您已经有一个加/减 ALU 并且想要搭载它，那么您可能只希望它生成进位和有符号小于输出以及零。

这样您就不需要单独的符号标志输出，也不需要获取整数结果的 MSB。它只是 ALU 内部的一个额外的 XOR 门来组合这两个东西。

【讨论】：