1.进程创建方式

python进阶之 进程&线程区别 随笔 第1张
import time
import os
from multiprocessing import Process
def func ():
    time.sleep(1)
    print(1,os.getpid(),os.getppid())

if __name__ == '__main__':
    #异步执行func,在一秒钟的时间通过生成多个子进程来执行多个func
    #1.先实例化
    #2.实例化对象.start()
    # 目标函数:target=
    Process(target=func).start()   #process类通知操作系统要为当前代码快在开辟一个进程,是异步过程
使用Process模块 python进阶之 进程&线程区别 随笔 第3张
import time
from multiprocessing import Process
class Myprocess(Process): #继承Process类
    def __init__(self,name):  #重新父类的__init__方法
        super().__init__()
        self.name =name

    def run(self):  #必须是run函数名
        print(os.getpid(),os.getppid(),'我爱你%s' % self.name)
        time.sleep(3)
if __name__ == '__main__':
    start_time = time.time()
    p1 = Myprocess('kobe')
    p2 = Myprocess('kobe')
    p3 = Myprocess('kobe')
    p1.start()
    p2.start()
    p3.start()
    p1.join()  #阻塞,直到p1对应的进程结束之后,才结束阻塞,是异步阻塞,阻塞等待一个子进程结束
    p2.join()
    p3.join()
    print(time.time()-start_time)
    ##阻塞一个子进程:p.join()
    #阻塞多个子进程,将子进程加入到列表,然后分别阻塞
'''
10600 9384 我爱你kobe
10448 9384 我爱你kobe
10032 9384 我爱你kobe
1.1659998893737793
从上面结果来看,我们知道join也是异步阻塞的,在同一秒钟分别执行了p1,p2,p3的time.sleep()
和我本来预想的要阻塞3s+是结果是不同的
'''
继承Process类创建多进程

2.线程创建方式

SRE实战 互联网时代守护先锋,助力企业售后服务体系运筹帷幄!一键直达领取阿里云限量特价优惠。 python进阶之 进程&线程区别 随笔 第5张
from threading import Thread
import os
def func():
    print('in fucn ',os.getpid())
print('in main ',os.getpid())
Thread(target=func).start()
#两个打印pid是一样的,说明线程是由进程产生的
使用Thread模块 python进阶之 进程&线程区别 随笔 第7张
from threading import Thread
import time
class Sayhi(Thread):
    def __init__(self,name):
        super().__init__()   #重写父类的__init__方法
        self.name=name
    def run(self):
        time.sleep(2)
        print('%s say hello' % self.name)


if __name__ == '__main__':
    t = Sayhi('kobe')
    t.start()
    print('主线程')
继承Thread类创建多线程

3.进程和线程的区别

线程和进程的区别
   进程: 数据隔离(但是也可以丛进程间的数据共享)  开销大
   线程: 数据共享 开销小
   cpython中多进程可以使用多核(并发编程),多线程不可以使用多核
  通俗来讲:比如有个4核(cpu)的主机,当使用多进程的时候,系统会自动的根据进程调度算法来分配今晨给资源,然后分别在不同的cpu上面执行,这就是多进程
                    当时用多线程的时候,由于GIL锁的存在,多线程始终是在一个cpu上面执行,造成闲的cpu闲死,忙的cpu忙死

os.getpid()不同

#线程 
from threading import Thread
import os
import time
def func():
    print('in func',os.getpid())
tt = Thread(target=func)
tt.start()
print('in main', os.getpid())
#进程 from multiprocessing import Process import os import time def func(): print('in func',os.getpid()) if __name__ == '__main__': tt = Process(target=func) tt.start() print('in main', os.getpid())

注意线程不需要if __name__ == '__main__':
  进程和线程的创建原理不同,所以不需要if __name__ == '__main__',但是可以使用这种方式
  因为新的线程是在主线程的内存中,所以新的线程和主线程共享同一段代码,不需要import导入,也就不存在子线程中又重复一次创建线程的过程

二者pid对比:
  在进程内,父进程创建的所有子进程都是不同的pid,说明父进程只是创建了子进程并在子进程执行代码的时候会import 父进程文件,其余父子相互之间独立,使用不同的内存空间,所以pid不同
  在线程中,主线程和子线程的pid完全相同,说明子线程是在主线程内部创建出来的,并且主线程会所有子线程的结束才结束。

 二者开销对比

#线程开销时间
import time
from threading import Thread
def func(item):
  item +=1
if __name__ == '__main__':
    start = time.time()
    t_l = []
    for i in range(100):
        t = Thread(target=func,args=(i,))
        t.start()
        t_l.append(t)
    for t in t_l:
        t.join()
    print(time.time()-start)

#进程开销时间
import time
def func(item):
  item +=1
from multiprocessing import Process
if __name__ == '__main__':
    start = time.time()
    t_l = []
    for i in range(100):
        t = Process(target=func,args=(i,))
        t.start()
        t_l.append(t)
    for t in t_l:
        t.join()
    print(time.time()-start)

注意:为什么要join()?
  因为要等待所有线程或进程全部都运行完,才计算时间
  不能再func()函数里面写join()方法,这样就是同一时间只有一个线程或进程在之心,变成同步的了

二者开销对比:
  分别执行上面代码,能够看到,做相同的操作,100个进程使用的时间比100个线程使用时间更长
  说明进程在创建\销毁\上下文切换之间,需要更多的时间和系统资源

 二者数据是否共享

#多个线程之间共享全局变量
from threading import Thread
item = 0
def func():
    global item
    item +=1
f_l= []
for ii in range(1000):
    tt = Thread(target=func)
    tt.start()
    f_l.append(tt)

[x.join() for x in f_l ]
print(item)


#多个进程之间数据不共享(但是可以通过Manager来实现共享)
from multiprocessing import Process,Manager
item = 0
def func():
    global item
    item +=1
if __name__ == '__main__':
    f_l= []
    for ii in range(10):
        tt = Process(target=func)
        tt.start()
        f_l.append(tt)
    [x.join() for x in f_l ]
    print(item)

二者数据是否共享:
  在线程内,主线程内的全局变量对于子线程来说完全共享,其他不是全局的就不共享
  在进程内,父进程和子线程的数据完全隔离,因为父子之间分别有不同的内存空间。

 

 

 

 

 

tets

扫码关注我们
微信号:SRE实战
拒绝背锅 运筹帷幄