计算浮点数据类型的范围答案

【问题标题】：Computing the ranges of floating point data types计算浮点数据类型的范围
【发布时间】：2009-02-09 18:55:15
【问题描述】：

是否可以在不读取 float.h 和使用 ANSI C 的情况下以可移植的方式计算 float、double 和 long double 数据类型的范围？便携是指目标机器不符合 IEEE 754 标准的情况。

我正在阅读 K&R 书，练习 2-1 要求我“计算”它们，所以我认为这意味着完全避免包含 FLT_MIN、FLT_MAX、DBL_MIN 和 DBL_MAX 的 float.h（直接读取这些值肯定不会分类作为“计算”）。

【问题讨论】：

标签： c

【解决方案1】：

有可能（至少对于 IEEE 754 float 和 double 值）通过（伪代码）计算最大浮点值：

~(-1.0) | 0.5

在进行位旋转之前，我们必须将浮点值转换为整数，然后再转换回来。这可以通过以下方式完成：

uint64_t m_one, half;
double max;

*(double *)(void *)&m_one = -1.0;
*(double *)(void *)&half = 0.5;
*(uint64_t *)(void *)&max = ~m_one | half;

那么它是如何工作的呢？为此，我们必须知道如何对浮点值进行编码。

最高位编码符号，接下来的k 位编码指数，最低位将保存小数部分。对于2 的幂，小数部分为0。

指数将以2**(k-1) - 1 的偏差（偏移量）存储，这意味着0 的指数对应于除了最高位之外的所有模式。

有两种具有特殊含义的指数位模式：

这意味着最大的正则指数将通过设置除最低位之外的所有位进行编码，如果减去偏差，则对应于 2**k - 2 或 2**(k-1) - 1 的值。

对于double 值，k = 11，即最大指数为1023，因此最大浮点值顺序为2**1023，约为1E+308。

最大的价值将有

现在，我们可以理解幻数的工作原理了：

当我们通过逻辑或组合这两个值时，我们会得到我们想要的位模式。

该计算也适用于 x86 80 位扩展精度值（又名long double），但必须按字节进行位旋转，因为没有足够大的整数类型来保存 32 位硬件上的值.

偏差实际上并不一定是2**(k-1) - 1 - 只要它是奇数，它就可以用于任意偏差。偏差必须是奇数，否则1.0 和0.5 的指数的位模式将在除最低位之外的其他地方有所不同。

如果浮点类型的基数b（又名基数）不是2，则必须使用b**(-1) 而不是0.5 = 2**(-1)。

如果最大指数值不是 reservedrd，请使用 1.0 而不是 0.5。无论基数或偏差如何，这都将起作用（这意味着它不再限于奇数值）。使用1.0的区别在于不会清除最低指数位。

总结一下：

~(-1.0) | 0.5

只要基数为2，偏差为奇数并保留最高指数即可。

~(-1.0) | 1.0

适用于任何基数或偏差，只要不保留最高指数。

【讨论】：

说“for IEEE 754”否定了问题的前提。
@Jonathan：至少'至少'并不意味着'仅用于' - 这适用于每个浮点值，偏差为2**(k-1) - 1，保留指数为2**k - 1，其中包括一半和四倍精度值以及 x86 上的 80 位扩展精度值
@Jonathan：如果您不限制可能的编码方案，您还想如何“计算”一些东西？只是没有适用于所有编码的算法！

【解决方案2】：

对于所有应用程序的 99.99%，您应该假设 IEEE 754 并使用<float.h> 中定义的常量。在另外 0.01% 中，您将使用非常专业的硬件，在这种情况下，您应该知道根据硬件使用什么。

【讨论】：

【解决方案3】：

冒着多余答案的风险：

没有。没有可移植的方法来计算范围。这就是提供 <float.h> 标头的原因 - 因为没有可移植的方法来获取其中包含的信息。

【讨论】：

【解决方案4】：

你可以试着让一个浮动更大直到它溢出。

【讨论】：