如何在python中将字节字符串转换为int?
这样说:'y\xcc\xa6\xbb'
'y\xcc\xa6\xbb'
我想出了一个聪明/愚蠢的方法:
sum(ord(c) << (i * 8) for i, c in enumerate('y\xcc\xa6\xbb'[::-1]))
我知道必须有内置的东西或在标准库中可以更简单地执行此操作…
这与转换可以使用int(xxx,16)的十六进制数字字符串不同,但是我想转换为实际字节值的字符串。
更新:
我有点喜欢James的回答,因为它不需要导入另一个模块,但是Greg的方法更快:
>>> from timeit import Timer >>> Timer('struct.unpack("<L", "y\xcc\xa6\xbb")[0]', 'import struct').timeit() 0.36242198944091797 >>> Timer("int('y\xcc\xa6\xbb'.encode('hex'), 16)").timeit() 1.1432669162750244
我的骇客方法:
>>> Timer("sum(ord(c) << (i * 8) for i, c in enumerate('y\xcc\xa6\xbb'[::-1]))").timeit() 2.8819329738616943
进一步更新:
有人在评论中问导入另一个模块有什么问题。好吧,导入模块不一定便宜,请看一下:
>>> Timer("""import struct\nstruct.unpack(">L", "y\xcc\xa6\xbb")[0]""").timeit() 0.98822188377380371
包括导入模块的成本在内,几乎抵消了该方法所具有的所有优势。我认为,这仅包括在整个基准测试运行中一次导入一次的费用;看一下我每次强制重新加载时会发生什么:
>>> Timer("""reload(struct)\nstruct.unpack(">L", "y\xcc\xa6\xbb")[0]""", 'import struct').timeit() 68.474128007888794
不用说,如果您每次导入都执行此方法很多次,则成比例地减少了一个问题。也可能是I / O成本而不是CPU,因此它可能取决于特定计算机的容量和负载特性。
你还可以使用struct模块来执行此操作:
struct
>>> struct.unpack("<L", "y\xcc\xa6\xbb")[0] 3148270713L
在Python 3.2和更高版本中,使用
>>> int.from_bytes(b'y\xcc\xa6\xbb', byteorder='big') 2043455163
要么
>>> int.from_bytes(b'y\xcc\xa6\xbb', byteorder='little') 3148270713
根据你的字节字符串的字节序。