在阅读Lua的源代码时,我注意到 Lua 使用宏将double值四舍五入为 32 位int值。该宏在Llimits.h头文件中定义,内容如下:
double
int
Llimits.h
union i_cast {double d; int i[2]}; #define double2int(i, d, t) \ {volatile union i_cast u; u.d = (d) + 6755399441055744.0; \ (i) = (t)u.i[ENDIANLOC];}
这里ENDIANLOC根据字节序定义:0为小端,1为大端架构;Lua 小心地处理字节序。t参数替换为整数类型,如intor unsigned int。
ENDIANLOC
t
unsigned int
我做了一些研究,发现该宏有一种更简单的格式,它使用相同的技术:
#define double2int(i, d) \ {double t = ((d) + 6755399441055744.0); i = *((int *)(&t));}
或者,在 C++ 风格中:
inline int double2int(double d) { d += 6755399441055744.0; return reinterpret_cast<int&>(d); }
这个技巧可以在任何使用IEEE 754的机器上运行(这意味着今天几乎每台机器)。它适用于正数和负数,并且四舍五入遵循银行家规则。(这并不奇怪,因为它遵循 IEEE 754。)
我写了一个小程序来测试它:
int main() { double d = -12345678.9; int i; double2int(i, d) printf("%d\n", i); return 0; }
它-12345679按预期输出 。
-12345679
我想详细了解这个棘手的宏是如何工作的。幻数6755399441055744.0其实是 2 51 + 2 52,也就是 1.5 脳 2 52,二进制中的 1.5 可以表示为 1.1。当任何 32 位整数被添加到这个幻数时——
6755399441055744.0
好吧,我从这里迷路了。 这个技巧是如何工作的?
正如@Mysticial 指出的那样,这种方法并不局限于 32-bit ,只要数字在 2 52int范围内,它也可以扩展到 64-bit 。(虽然宏需要一些修改。)int
有些资料说这种方法不能在Direct3D中使用。
当使用 Microsoft assembler for x86 时,有一个用汇编代码编写的更快的宏(以下也是从 Lua 源代码中提取的):
#define double2int(i,n) __asm {__asm fld n __asm fistp i}
单精度数也有类似的幻数: 1.5 脳 2 23。
double浮点类型的值表示如下:
它可以看作是两个 32 位整数;现在,int所有版本的代码(假设它是 32-bit int)都是图中右侧的那个,所以你最终所做的只是取最低的 32 位尾数。
现在,到神奇的数字;正如你所说的那样,6755399441055744 是 2 51 + 2 52;添加这样一个数字会迫使double进入 2 52和 2 53之间的“甜范围” ,正如Wikipedia 所解释的那样,它具有一个有趣的属性:
在 2 52 = 4,503,599,627,370,496 和 2 53 = 9,007,199,254,740,992 之间,可表示的数字恰好是整数。
这是因为尾数是 52 位宽。
关于添加 2 51 + 2 52的另一个有趣的事实是,它只影响尾数在两个最高位 - 无论如何都会被丢弃,因为我们只取它的最低 32 位。
最后但并非最不重要的:标志。
IEEE 754 浮点使用幅度和符号表示,而“正规”机器上的整数使用 2 的补码算法;这是如何处理的?
我们只讨论了正整数;现在假设我们正在处理一个 32 位可表示的范围内的负数int,因此(绝对值)小于 (鈭�2 31 +1);叫它听鈭抋。这样一个数显然是通过加上幻数使正数,得到的值为2 52 +2 51+ (鈭抋)。
现在,如果我们用 2’ 补码表示来解释尾数,我们会得到什么?它必须是 (2 52 + 2 51 ) 和 (鈭抋) 的 2’ 补和的结果。同样,第一项仅影响高两位,位 0-50 中剩余的是 (-抋) 的 2-檚 补表示(同样,减去高两位)。
由于将 2’檚 补数减少到更小的宽度只是通过切除左侧多余的位来完成,因此取较低的 32 位可以让我们在 32 位中正确地得到 (‘) 2’ 补数算术。