python并发编程——多线程

编程的乐趣在于让程序越来越快，这里将给大家介绍一个种加快程序运行的的编程方式——多线程

1 著名的全局解释锁（GIL）

说起python并发编程，就不得不说著名的全局解释锁（GIL）了。有兴趣的同学可以我查找一下相关的资料了解一下GIL,在这里大家只要知道一点，因为GIL的存在， 对于任何Python程序，不管有多少的处理器，任何时候都总是只有一个线程在执行。

下面先看一个例子：

#!/usr/bin/env python
# -*- coding: utf-8 -*-
"""
Created on Mon Jun  5 16:12:14 2017

@author: 80002419
"""
import threading
import time

def cost(fun):##定义一个装饰器，用来计算函数运行的时间
    def wrapper(*args,**kargs):
        before_tm = time.time()
        fun(*args,**kargs);
        after_tm = time.time()
        fun.__doc__
        print("{0} cost:{1}".format(fun.__name__,after_tm-before_tm))
    return wrapper

def fibs1(n):
    if (n == 1):
        return 0
    elif(n == 2):
        return 1
    else:
        return fibs1(n-2)+fibs1(n-1)

def fibs2(n):
    list = []
    if (n == 1):
        list = [0]
        return list[-1] 
    elif(n == 2):
        list = [0,1]
        return list[-1] 
    else:
        list = [0,1]
        for i in range(2,n):
            list.append(list[i-1]+list[i-2])
        return list[-1]    

@cost
def nothread():
    fibs1(35) 
    fibs1(35)


#@cost
#def nothread1():
#    print(fibs2(40))
#    print(fibs2(40))

@cost
#使用多线程的程序
def inthread():
    threads = []
    for i in range(2):
        t = threading.Thread(target = fibs1,args =(35,))
        t.start()
        threads.append(t)
    for t in  threads:
        t.join()

@cost    
def inthread1():
    for i in range(2):
        t = threading.Thread(target=fibs1, args=(35,))
        t.start()
    main_thread = threading.currentThread()
    for t in threading.enumerate():
        if t is main_thread:
            continue
        t.join()

nothread()
inthread()

打印结果：

nothread cost:5.41788887978
inthread cost:14.6728241444

上面的例子对比了一个cpu密集型程序分别使用多线程和不使用多线程的情况，我们可以得到结论： 对于cpu密集型任务，使用多线程反而会减慢程序的运行。

这是为什么呢？

因为GIL在任何时候，仅仅允许一个单一的线程能够获取Python对象或者C API。每100个字节的Python指令解释器将重新获取锁，这（潜在的）阻塞了I/O操作

同时 GIL是必须的，这是Python设计的问题：Python解释器是非线程安全的。这意味着当从线程内尝试安全的访问Python对象的时候将有一个全局的强制锁。当然python 多线程也有可以加快程序运行的时候：当我们开发和网络通信或者数据输入/输出相关的程序，比如网络爬虫、文本处理等等。这时候由于网络情况和I/O的性能的限制，Python解释器会等待读写数据的函数调用返回，这个时候就可以利用多线程库提高并发效率了。这类任务我们称为IO（密集型任务）

2 Semaphore类 ——python对象访问量的控制

在多线程编程中，为了防止不同的线程同时对一个公用的资源（比如全部变量）进行修改，需要进行同时访问的数量（通常是1）。信号量同步基于内部计数器，每调用一次acquire()，计数器减1；每调用一次release()，计数器加1.当计数器为0时，acquire()调用被阻塞。

下面来看一个例子：

#!/usr/bin/env python
# -*- coding: utf-8 -*-
"""
Created on Mon Jun  5 16:12:14 2017

@author: 80002419
"""
from threading import Thread, Semaphore 
import time,threading

sema = Semaphore(3) # 定义一个信号量为3的Semaphone对象，

#定义一个测试函数作为，被访问的对象
def test(tid):
    with sema:
        print("信号量：{0}".format(tid))
        time.sleep(0.5)
        print('release!')

thds = []
for i in range(6):
    t = Thread(target = test,args=(i,))
    t.start()
    thds.append(t)

for t in thds:
    t.join()

打印结果：

信号量：2
信号量：1
信号量：0
release!
信号量：0
release!
信号量：0
release!
信号量：0
release!
release!
release!

结果分析：

当信号量sema信号为0时，此时不再不允许进程对test 再进行访问了，release 之后才能再继续生成亲的进程对其访问， Semaphore类的作用就是限制公共资源的访问量

3 锁——lock 与 Rlock

先看一段代码：

#!/usr/bin/env python
# -*- coding: utf-8 -*-
"""
Created on Mon Jun  5 16:12:14 2017

@author: 80002419
"""
from threading import Thread, Lock
import time,threading

value = 0;

def changeValue():
    global value
    new = value + 1
    time.sleep(0.001)#让其它进程可以切换进来
    value = new

thds = []
for _ in range(100):
    t = Thread(target = changeValue)
    t.start()
    thds.append(t)

for t in thds:
    t.join()

print(value)

打印结果：

结果分析: 多个线程同时访问 value 变量，经过cpu存储后，再写回内存，如果进程A,进程B,在访问value时值为0 ，进程A经过函数处理后，value = 1 ，再写回内存，value =1 ,进程B 执行完成后，会刷新value 但是写回的value 还是1，所以并不能保护执行了100次changeValue后，结果为100

那么我们怎么能保证执行的结果就是100呢：再看一段代码：

#!/usr/bin/env python
# -*- coding: utf-8 -*-
"""
Created on Mon Jun  5 16:12:14 2017

@author: 80002419
"""
from threading import Thread, Lock
import time,threading

value = 0

lock = Lock()

def changeValue():
    global value
    with lock:
        new = value + 1
        time.sleep(0.001)#让其它进程可以切换进来
        value = new

thds = []

for _ in range(100):
    t = Thread(target = changeValue)
    t.start()
    thds.append(t)
for t in thds:
    t.join()
print(value)

打印结果：

100

Lock也可以叫做互斥锁，其实相当于信号量为1，上面例子lock 也就可以用 sema = Semaphore()代替

原文链接：https://blog.csdn.net/u014770372/article/details/73549404?utm_medium=distribute.pc_category.none-task-blog-hot-4.nonecase&depth_1-utm_source=distribute.pc_category.none-task-blog-hot-4.nonecase

python并发编程——多线程

编程的乐趣在于让程序越来越快，这里将给大家介绍一个种加快程序运行的的编程方式——多线程

1 著名的全局解释锁（GIL）

2 Semaphore类 ——python对象访问量的控制

热门标签