一个非常简单的解决方案是使用合适的表驱动近似值。如果您正确减少输入,您实际上并不需要大量数据。 exp(a)==exp(a/2)*exp(a/2),这意味着你真的只需要为1 < x < 2计算exp(x)。在该范围内,runga-kutta 近似将给出合理的结果,大约 16 个条目 IIRC。
同样,sqrt(a) == 2 * sqrt(a/4) == sqrt(4*a) / 2 这意味着您只需要1 < a < 4 的表条目。 Log(a) 有点难:log(a) == 1 + log(a/e)。这是一个相当慢的迭代,但 log(1024) 只有 6.9,所以你不会有很多迭代。
您可以对 pow 使用类似的“整数优先”算法:pow(x,y)==pow(x, floor(y)) * pow(x, frac(y))。这是因为pow(double, int) 是微不足道的(分而治之)。
[编辑] 对于log(a) 的整数部分,存储一个表1, e, e^2, e^3, e^4, e^5, e^6, e^7 可能很有用,因此您可以通过在该表中对a 进行简单的硬编码二进制搜索来减少log(a) == n + log(a/e^n)。从 7 步到 3 步的改进不是很大,但这意味着您只需将 e^n 除以一次,而不是 n 乘以 e。
[编辑 2]
对于最后一个log(a/e^n) 术语,您可以使用log(a/e^n) = log((a/e^n)^8)/8 - 每次迭代按表查找 产生3 个更多位。这使您的代码和表格大小保持较小。这通常是嵌入式系统的代码,它们没有大缓存。
[编辑 3]
这对我来说仍然不聪明。 log(a) = log(2) + log(a/2)。您可以只存储定点值log2=0.30102999566,计算前导零的数量,将a 移动到用于查找表的范围内,然后将该移动(整数)乘以定点常量log2。可以低至 3 条指令。
使用e 进行缩减步骤只会给你一个“不错的”log(e)=1.0 常量,但这是错误的优化。 0.30102999566 和 1.0 一样好;两者都是 10.22 定点的 32 位常量。使用 2 作为范围缩小的常数允许您使用位移位进行除法。
您仍然可以从编辑 2 中获得诀窍,log(a/2^n) = log((a/2^n)^8)/8。基本上,这会给你一个结果(a + b/8 + c/64 + d/512) * 0.30102999566 - b,c,d 在 [0,7] 范围内。 a.bcd 真的是一个八进制数。毫不奇怪,因为我们使用 8 作为电源。 (这个技巧同样适用于 2、4 或 16 次方。)
[编辑 4]
仍然有一个开放的结局。 pow(x, frac(y) 只是 pow(sqrt(x), 2 * frac(y)),我们有一个不错的 1/sqrt(x)。这为我们提供了更有效的方法。说frac(y)=0.101二进制,即1/2加1/8。那么这意味着x^0.101 是(x^1/2 * x^1/8)。但是x^1/2 只是sqrt(x) 而x^1/8 是(sqrt(sqrt(sqrt(x)))。再保存一个操作,Newton-Raphson NR(x) 给我们1/sqrt(x) 所以我们计算1.0/(NR(x)*NR((NR(NR(x)))。我们只反转最终结果,不要直接使用 sqrt 函数。