假设您正在使用x86 32位系统。您的任务是尽快完成更新。
您需要注意两个问题:1.地址对齐。2.读取机器字长(4个字节)的存储器。
在给定的字符串中找到第一个对齐地址并不难。
然后,我们可以用4个字节读取一次内存,并计算其总长度。但是,一旦4个字节中有一个零字节,我们就应该停止,并在零字节之前计数剩余的字节。为了快速检查零字节,glibc提供了一个代码段:
unsigned long int longword, himagic, lomagic; himagic = 0x80808080L; lomagic = 0x01010101L; // There's zero byte in 4 bytes. if (((longword - lomagic) & ~longword & himagic) != 0) { // do left thing... }
我在Visual C ++中使用它来与CRT的实现进行比较。CRT的速度比上述速度快得多。
我不熟悉CRT的实现,他们是否使用更快的方法来检查零字节?
第一个CRT是 直接 用汇编器编写的。您可以在此处看到其源代码C:\Program Files\Microsoft Visual Studio 9.0\VC\crt\src\intel\strlen.asm(这是针对VS 2008的)
C:\Program Files\Microsoft Visual Studio 9.0\VC\crt\src\intel\strlen.asm