python之timeit模块


timeit模块:

  • timeit 模块定义了接受两个参数的 Timer 类。两个参数都是字符串。 第一个参数是你要计时的语句或者函数。 传递给 Timer 的第二个参数是为第一个参数语句构建环境的导入语句。 从内部讲, timeit 构建起一个独立的虚拟环境, 手工地执行建立语句,然后手工地编译和执行被计时语句。

  • 一旦有了 Timer 对象,最简单的事就是调用 timeit(),它接受一个参数为每个测试中调用被计时语句的次数,默认为一百万次;返回所耗费的秒数。

  • Timer 对象的另一个主要方法是 repeat(), 它接受两个可选参数。 第一个参数是重复整个测试的次数,第二个参数是每个测试中调用被计时语句的次数。 两个参数都是可选的,它们的默认值分别是 3 和1000000。repeat() 方法返回以秒记录的每个测试循环的耗时列表。Python 有一个方便的 min 函数可以把输入的列表返回成最小值,如: min(t.repeat(3, 1000000))

测试一个列表推导式与for循环的时间

import timeit
    foooo = """
    sum = []
    for i in range(1000):
        sum.append(i)
    """

    print(timeit.timeit(stmt="[i for i in range(1000)]", number=100000))
    print(timeit.timeit(stmt=foooo, number=100000))

    #res:
    #3.2855970134734345
    #8.19918414604134

使用列表推导式要比正常使用list追加元素 通过10w次循环会快上近5秒左右,速度快上近三倍。

timeit 模块抽象出了;两个可以直接使用的方法,包了一层可以让我们不用关心内部的实现,下面看一下模块里面的代码:

def timeit(stmt="pass", setup="pass", timer=default_timer,
               number=default_number):
        """Convenience function to create Timer object and call timeit method."""
        return Timer(stmt, setup, timer).timeit(number)

    def repeat(stmt="pass", setup="pass", timer=default_timer,
               repeat=default_repeat, number=default_number):
        """Convenience function to create Timer object and call repeat method."""
        return Timer(stmt, setup, timer).repeat(repeat, number)

可以看到这两个方法都是对Timer类包了一层这几个参数:

stmt: 这个参数就是statement,可以把要进行计算时间的代码放在里面。他可以直接接受字符串的表达式,也可以接受单个变量,也可以接受函数。

setup: 这个参数可以将stmt的环境传进去。比如各种import和参数什么的。

timer: 这个参数一般使用不到,具体使用可以参看文档。

Timer类下面还有repeattimeit方法 使用也非常方便就是 timeit.timeittimeit.repeat

一个就是上面例子的timeit,一个就是repeat 其实repeat就比timeit多了一个执行Timer次数的参数。这个执行次数会以数组的形式返回.

import timeit

    foooo = """
    sum = []
    for i in range(1000):
        sum.append(i)
    """

    print(timeit.repeat(stmt="[i for i in range(1000)]", repeat=2, number=100000))
    print(min(timeit.repeat(stmt="[i for i in range(1000)]", repeat=2, number=100000)))

    #res:
    #[3.4540683642063277, 3.300991128415932]
    #3.321008256502136

我们可以根据此,对所有执行时间取min最小值,平均值,最大值得到我们想要的数据。

# coding: utf-8
    import timeit

    # 初始化类
    x = """
    say_hi.ParseFromString(p)
    """

    y = """
    simplejson.loads(x)
    """

    print(timeit.timeit(stmt=x, setup="import say_hi_pb2;"
                                      "say_hi = say_hi_pb2.SayHi();"
                                      "say_hi.id = 13423;"
                                      "say_hi.something = 'axiba';"
                                      "say_hi.extra_info = 'xiba';"
                                      "p =say_hi.SerializeToString()", number=1000000))

    print(timeit.timeit(stmt=y, setup="import simplejson; "
                                      "json={"
                                      "'id': 13423,"
                                      "'something': 'axiba',"
                                      "'extra_info': 'xiba',"
                                      "};"
                                      "x = simplejson.dumps(json)", number=1000000))  
```     

另外需要补充一点是,如果你想直接 stmt 那里执行函数。可以把函数申明在当前文件中,然后在 stmt = func() 执行函数。然后使用 `setup= ‘from __main__ import func` 即可,如果要import 多个需要使用 `setup = from __main__ importfunc; import simplejson'`


```python      
    def test1():
        n=0
        for i in range(101):
            n+=i
        return n
    def test2():
        return sum(range(101))
    def test3():
        return sum(x for x in range(101))
    if __name__=='__main__':
        from timeit import Timer
        t1=Timer("test1()","from __main__ import test1")
        t2=Timer("test2()","from __main__ import test2")
        t3=Timer("test3()","from __main__ import test3")
        print(t1.timeit(10000))
        print(t2.timeit(10000))
        print(t3.timeit(10000))
        print(t1.repeat(3,10000))
        print(t2.repeat(3,10000))
        print(t3.repeat(3,10000))
        t4 = timeit.timeit(stmt=test1,setup="from __main__ import test1",number=10000)
        t5 = timeit.timeit(stmt=test2,setup="from __main__ import test2",number=10000)
        t6 = timeit.timeit(stmt=test3,setup="from __main__ import test3",number=10000)
        print(t4) #0.05130029071325269
        print(t5) #0.015494466822610305
        print(t6) #0.05650903115721077
        print(timeit.repeat(stmt=test1,setup="from __main__ import test1",number=10000)) # [0.05308853391023148, 0.04544335904366706, 0.05969025402337652]
        print(timeit.repeat(stmt=test2,setup="from __main__ import test2",number=10000)) # [0.012824560678924846, 0.017111019558035345, 0.01429126826003152]
        print(timeit.repeat(stmt=test3,setup="from __main__ import test3",number=10000)) # [0.07385010910706968, 0.06244617606430164, 0.06273494371932059]

    #res:
    0.043916918200588385
    0.014892355541932578
    0.05214884436618059
    [0.04372713709398021, 0.04197132052492908, 0.04255431716177577]
    [0.014356804181737959, 0.012456603785177323, 0.012629659578433372]
    [0.0543709217115389, 0.05334180294099272, 0.05334931226535494]


原文链接:https://www.cnblogs.com/Uncle-Guang/p/8796507.html