解锁多线程死锁之谜：深入探讨使用GDB调试的技巧 _死锁

多线程编程是现代软件开发中的一项重要技术，但随之而来的挑战之一是多线程死锁。多线程死锁是程序中的一种常见问题，它会导致线程相互等待，陷入无法继续执行的状态。这里，我们将探讨多线程死锁的概念、原理，同时我们通过一个例子来介绍如何使用GDB（GNU Debugger）这一工具来排查和解决多线程死锁问题。

文章插图
多线程死锁的概念
多线程死锁是多线程编程中的一种关键问题。它发生在多个线程试图获取一组资源（通常是锁或资源对象）时，导致彼此相互等待的情况。具体来说，当线程1持有资源A并等待资源B ，而线程2持有资源B并等待资源A时，就可能发生死锁。
多线程死锁原理
为了更好地理解多线程死锁的原理，让我们考虑一个简单的示例。假设有两个资源A和B，以及两个线程（Thread 1和Thread 2）。线程1需要获取资源A和B，线程2需要获取资源B和A 。如果线程1获取了资源A，而线程2获取了资源B ，它们都无法继续，因为它们都需要对方持有的资源才能继续。这就是典型的死锁情况。

多线程死锁通常发生在以下情况下：

线程同时持有一个资源并等待另一个资源。
资源分配不当，线程没有按照相同的顺序获取资源。

多线程死锁之所以会发生，是因为线程之间的相互依赖和等待。当多个线程需要共享资源时，它们可能会按不同的顺序获取这些资源，导致资源互斥问题，最终引发死锁。
排查多线程死锁GDB是一个强大的调试工具，可以用来排查多线程死锁问题。下面通过一个例子来说下如何使用gdb调试死锁问题，这也是前段时间我碰锁问题新学到的技能。
简单的代码如下：

#include <stdio.h>#include <pthread.h>#include <stdlib.h>#include <unistd.h>#include <time.h>pthread_mutex_t mutex1 = PTHREAD_MUTEX_INITIALIZER;pthread_mutex_t mutex2 = PTHREAD_MUTEX_INITIALIZER;pthread_cond_t exit_condition = PTHREAD_COND_INITIALIZER;int should_exit = 0;void *thread1_function(void *arg) {while (1) {printf("Thread 1: Attempting to acquire mutex1...n");pthread_mutex_lock(&mutex1);printf("Thread 1: Acquired mutex1.n");printf("Thread 1: Attempting to acquire mutex2...n");pthread_mutex_lock(&mutex2);printf("Thread 1: Acquired mutex2.n");// 在此处检查是否应该退出if (should_exit) {pthread_mutex_unlock(&mutex2);pthread_mutex_unlock(&mutex1);break;}pthread_mutex_unlock(&mutex1);pthread_mutex_unlock(&mutex2);}printf("Thread 1 exit done!n");pthread_exit(NULL);}void *thread2_function(void *arg) {sleep(5); // 让线程2休眠10秒钟printf("Thread 2: Attempting to acquire mutex2...n");pthread_mutex_lock(&mutex2);printf("Thread 2: Acquired mutex2.n");printf("Thread 2: Notifying Thread 1 to exit...n");should_exit = 1;pthread_cond_signal(&exit_condition);//通过不释放该锁制造死锁pthread_mutex_unlock(&mutex2);printf("Thread 2 exit done!n");//exit执行后不会再执行该函数后面部分pthread_exit(NULL);}int mAIn() {pthread_t thread1, thread2;pthread_create(&thread1, NULL, thread1_function, NULL);pthread_create(&thread2, NULL, thread2_function, NULL);pthread_join(thread1, NULL);pthread_join(thread2, NULL);return 0;}

代码很简单，通过创建两个线程，线程1睡眠5s为mutex2加锁并通知线程1进行退出，之后线程2退出，线程1是个while循环，不停的对mutex1进行加解锁，并加锁后检测是否退出，退出则对mutex2进行加锁打?。?缓笫头舖utex1、mutex2进行退出。
使用：gcc thread.c -g -lpthread -o thread编译，因为要gdb调试所以需要带上-g参数，正常现象会执行结束打印如下：

文章插图
现在我们屏蔽掉线程2释放mutex2进行死锁调试：

void *thread2_function(void *arg) {sleep(5); // 让线程2休眠10秒钟printf("Thread 2: Attempting to acquire mutex2...n");pthread_mutex_lock(&mutex2);printf("Thread 2: Acquired mutex2.n");printf("Thread 2: Notifying Thread 1 to exit...n");should_exit = 1;pthread_cond_signal(&exit_condition);//通过不释放该锁制造死锁//pthread_mutex_unlock(&mutex2);printf("Thread 2 exit done!n");//exit执行后不会再执行该函数后面部分pthread_exit(NULL);}

实际环境中我们并不知道死锁发生，所以我们通过gdb先运行一次直到程序无法正常退出时，执行bt查看堆栈：