深入探究 Linux 线程创建：glibc 的 pthread_create 与神秘的 clone 函数-51CTO.COM

在Linux下进行多线程编程时，我们通常会使用POSIX线程库（pthread），它提供了一组用于线程管理的API函数，其中最常用的就是pthread_create函数。不过，了解pthread_create的内部工作原理和底层系统调用对于深入理解Linux多线程编程非常重要。

clone与fork

pthread_create函数是glibc中实现的POSIX线程库的一部分，它是基于Linux系统调用clone来创建线程的。clone函数是一个比fork更灵活和底层的系统调用，它允许我们创建一个新的进程或线程，而fork只能创建新进程。

clone函数和fork函数都用于创建新的执行流，但它们有一些重要的区别：

(1) 创建级别：

fork函数用于创建一个新的进程，新进程是调用进程的副本。
clone函数可以用于创建新的线程或新的进程，取决于传递给它的标志。这使clone比fork更加灵活。

(2) 共享资源：

fork创建的进程有独立的地址空间，父子进程之间不共享内存。
clone可以选择与父进程共享内存、文件描述符等资源，这可以用于创建线程。

(3) 系统开销：

由于fork会复制整个地址空间，因此开销较大。
clone可以选择共享资源，因此通常比fork更高效。

clone函数的实现原理

clone函数通过传递不同的标志参数来控制其行为。以下是一些常见的标志参数及其作用：

CLONE_VM：共享虚拟内存，子进程/线程与父进程共享地址空间。
CLONE_FS：共享文件系统信息，子进程/线程与父进程共享文件系统。
CLONE_FILES：共享文件描述符表，子进程/线程与父进程共享打开的文件。
CLONE_SIGHAND：共享信号处理，子进程/线程与父进程共享信号处理器表。
CLONE_PARENT_SETTID：设置父进程的TID（线程ID）。
CLONE_CHILD_SETTID：设置子进程/线程的TID。

clone函数的核心思想是在新的执行流中执行一个新的函数，这个函数通常是main函数的替代品。这个新函数在创建线程时会被调用，它可以执行不同的任务，使得多线程编程成为可能。

clone函数创建线程示例

要使用clone函数创建线程，我们需要传递适当的标志参数和一个函数指针，该函数指针指向线程要执行的函数。以下是一个简单的示例：

#define _GNU_SOURCE
#include <stdio.h>
#include <sched.h>
#include <stdlib.h>
#include <sys/types.h>
#include <unistd.h>

#define STACK_SIZE (1024 * 1024)

void *child_function(void *arg) {
    printf("Child thread: PID=%d, TID=%ld\n", getpid(), syscall(SYS_gettid));
    return NULL;
}

int main() {
    char *stack;
    char *stack_top;
    pid_t pid;

    stack = (char *)malloc(STACK_SIZE);
    if (stack == NULL) {
        perror("malloc");
        exit(EXIT_FAILURE);
    }

    stack_top = stack + STACK_SIZE;

    pid = clone(child_function, stack_top, CLONE_VM | CLONE_FS | CLONE_FILES | CLONE_SIGHAND, NULL);
    if (pid == -1) {
        perror("clone");
        exit(EXIT_FAILURE);
    }

    printf("Parent thread: PID=%d, TID=%ld, Child PID=%d\n", getpid(), syscall(SYS_gettid), pid);

    // Wait for the child to finish
    if (waitpid(pid, NULL, 0) == -1) {
        perror("waitpid");
        exit(EXIT_FAILURE);
    }

    free(stack);
    return 0;
}

这个示例中，我们使用clone函数创建了一个新线程，新线程将执行child_function函数。父线程和子线程可以共享虚拟内存、文件系统信息等资源，这使得它们可以方便地共享数据。