代码收藏家技术教程 2025-06-18

Python线程并行编程详解：Threading模块用法与性能优化指南

Python基于线程的并行：`threading`模块的用法详解

在Python中，threading模块是实现多线程编程的核心工具。通过多线程，开发者可以充分利用I/O密集型任务的并发特性，提升程序的执行效率。本文将深入解析threading模块的核心功能、使用方法以及常见问题，帮助开发者掌握多线程编程的核心技巧。

一、`threading`模块简介

1. 线程与进程的区别

线程：线程是进程内的轻量级执行单元，共享进程的内存空间，创建和切换的开销较小。

进程：进程是独立的运行单元，拥有独立的内存空间，适合CPU密集型任务（通过multiprocessing模块实现）。

由于Python的全局解释器锁（GIL），threading模块的线程无法实现真正的并行计算，但适合I/O密集型任务（如网络请求、文件读写）。

二、线程的创建与管理

1. 直接创建线程

使用threading.Thread类创建线程，指定目标函数和参数：

import threading
import time

def worker(num):
    print(f"线程 {num} 开始执行")
    time.sleep(2)  # 模拟耗时操作
    print(f"线程 {num} 执行结束")

# 创建线程
threads = []
for i in range(3):
    t = threading.Thread(target=worker, args=(i,))
    threads.append(t)
    t.start()

# 等待所有线程完成
for t in threads:
    t.join()

print("所有线程执行完毕")

关键点：

start()：启动线程。

join()：阻塞主线程，等待子线程执行完毕。

2. 继承`Thread`类

通过继承Thread类并重写run()方法定义线程任务：

import threading

class MyThread(threading.Thread):
    def run(self):
        print(f"线程 {self.name} 开始执行")
        # 执行任务
        print(f"线程 {self.name} 执行结束")

# 创建并启动线程
threads = [MyThread() for _ in range(3)]
for t in threads:
    t.start()
for t in threads:
    t.join()

优势：便于封装复杂逻辑和状态管理。

三、线程同步与资源共享

1. 锁（Lock）

当多个线程共享资源时，需使用锁避免数据竞争：

import threading

counter = 0
lock = threading.Lock()

def increment():
    global counter
    with lock:
        for _ in range(100000):
            counter += 1

# 创建线程
threads = [threading.Thread(target=increment) for _ in range(5)]
for t in threads:
    t.start()
for t in threads:
    t.join()

print(f"最终计数器值: {counter}")  # 应输出 500000

关键点：

with lock：确保同一时间只有一个线程访问共享资源。

死锁风险：避免在锁内调用其他锁或阻塞操作。

2. 条件变量（Condition）

用于线程间的协调通信，例如生产者-消费者模型：

import threading

items = []
condition = threading.Condition()

def producer():
    for i in range(5):
        with condition:
            items.append(i)
            print(f"生产者生产了 {i}")
            condition.notify()  # 通知消费者
        time.sleep(0.1)

def consumer():
    while True:
        with condition:
            while not items:
                condition.wait()  # 等待生产者通知
            item = items.pop(0)
            print(f"消费者消费了 {item}")
        if item == 4:
            break

# 创建并启动线程
t1 = threading.Thread(target=producer)
t2 = threading.Thread(target=consumer)
t1.start()
t2.start()
t1.join()
t2.join()

关键点：

notify()：唤醒等待的线程。

wait()：释放锁并等待通知。

3. 信号量（Semaphore）

限制同时访问某个资源的线程数量：

import threading

semaphore = threading.Semaphore(2)  # 最多允许2个线程同时访问

def limited_access():
    with semaphore:
        print(f"线程 {threading.current_thread().name} 进入临界区")
        time.sleep(1)
        print(f"线程 {threading.current_thread().name} 离开临界区")

# 创建线程
threads = [threading.Thread(target=limited_access) for _ in range(5)]
for t in threads:
    t.start()
for t in threads:
    t.join()

应用场景：数据库连接池、资源限流等。

四、守护线程（Daemon Thread）

守护线程是主线程结束后自动终止的线程，适合后台任务（如日志记录）：

import threading
import time

def background_task():
    while True:
        print("守护线程正在运行")
        time.sleep(1)

# 创建守护线程
t = threading.Thread(target=background_task, daemon=True)
t.start()

# 主线程休眠3秒后退出
time.sleep(3)
print("主线程结束")

关键点：

daemon=True：设置线程为守护线程。

注意事项：守护线程可能在主线程退出时被强制终止，需确保资源正确释放。

五、线程池与任务队列

1. 结合`queue.Queue`

使用队列管理任务分配，避免手动管理线程：

import threading
import queue
import time

def worker(q):
    while not q.empty():
        item = q.get()
        print(f"处理任务 {item}")
        time.sleep(1)
        q.task_done()

# 初始化队列并添加任务
q = queue.Queue()
for i in range(10):
    q.put(i)

# 创建线程池
threads = [threading.Thread(target=worker, args=(q,)) for _ in range(3)]
for t in threads:
    t.start()
q.join()  # 等待所有任务完成
print("所有任务处理完毕")

优势：

自动管理任务分配。

提升代码可维护性和扩展性。

六、常见问题与最佳实践

1. GIL的限制

问题：GIL导致CPU密集型任务无法并行执行。

解决方案：

使用multiprocessing模块实现多进程并行。

将计算密集型任务外包给C扩展或异步框架（如asyncio）。

2. 死锁与资源泄漏

问题：多个锁的嵌套使用可能导致死锁。

解决方案：

使用with语句确保锁的释放。

按固定顺序获取锁，避免循环依赖。

3. 异常处理

问题：线程中的异常未捕获可能导致程序崩溃。

解决方案：

在run()方法中使用try-except块捕获异常。

使用threading.excepthook注册全局异常处理函数。

七、总结

threading模块是Python实现并发编程的重要工具，尤其适合I/O密集型任务。通过合理使用线程、锁、条件变量和队列，开发者可以高效地管理并发任务。然而，需注意GIL的限制、线程安全和资源管理，避免潜在问题。在实际开发中，结合queue.Queue和线程池可以进一步提升代码的健壮性和可扩展性。

掌握threading模块的核心用法，不仅能优化程序性能，还能为复杂场景（如网络爬虫、实时数据处理）提供高效的解决方案。

作者：酷爱码

物联沃分享整理
物联沃-IOTWORD物联网 » Python线程并行编程详解：Threading模块用法与性能优化指南