18.Linux-信号的保存与处理

JAY.LIN 收录于 Linux

2025-03-09 约 4056 字预计阅读 9 分钟

https://bing.ee123.net/img/rand?artid=146119052

18.Linux 信号的保存与处理

一、信号保存

1.1 常见的概念

• 实际执行信号的处理动作称为信号递达(Delivery)

• 信号从产生到递达之间的状态，称为信号未决(Pending)。

• 进程可以选择阻塞(Block)某个信号。被阻塞的信号将保持在未决状态，直到进程解除对此信号的阻塞才执行递达的动作。

1.2 在内核中的表示

• 每个信号都有两个标志位分别表示阻塞(block)和未决(pending)，还有一个函数指针表表示处理动作。信号产生时，内核在进程控制块中设置该信号的未决标志，直到信号递达才清除该标志。

• 在上图的例子中，SIGHUP信号未阻塞也未产生过，当它递达时执行默认处理动作。

如果在进程解除对某信号的阻塞之前这种信号产生过多次将如何处理?

Linux是这样实现的：常规信号在递达之前产生多次只计一次，而实时信号在递达之前产生多次可以依次放在一个队列里。

从上图来看，每个信号只有一个bit的未决标志，非0即1，不记录该信号产生了多少次，阻塞标志也是这样表示的。因此，未决和阻塞标志可以用相同的数据类型sigset_t来存储，sigset_t称为信号集。这个类型可以表示每个信号的“有效”或“无效”状态，在阻塞信号集中“有效”和“无效”的含义是该信号是否被阻塞，而在未决信号集中“有效”和“无效”的含义是该信号是否处于未决状态。 阻塞信号集也叫做当前进程的信号屏蔽字 ，这里的“屏蔽”应该理解为阻塞而不是忽略。

1.3 信号集操作函数

基础函数

#include <signal.h> 
int sigemptyset(sigset_t *set); 
int sigfillset(sigset_t *set); 
int sigaddset(sigset_t *set, int signo); 
int sigdelset(sigset_t *set, int signo); 
int sigismember(const sigset_t *set, int signo);

• 函数sigemptyset初始化set所指向的信号集，使其中所有信号的对应bit清零，表示该信号集不包含任何有效信号。

• 函数sigfillset初始化set所指向的信号集，使其中所有信号的对应bit置1，表示该信号集的全是有效信号。

• 在使用sigset_t类型的变量之前，一定要调用sigemptyset或sigfillset做初始化使信号集处于确定的状态。初始化sigset_t变量之后就可以在调用sigaddset和sigdelset在该信号集中添加或删除某种有效信号。

• sigismember是一个布尔函数，用于判断一个信号集的有效信号中是否包含某种信号，若包含则返回1，不包含则返回0，出错返回-1。

sigprocmask

#include <signal.h>

int sigprocmask(int how, const sigset_t* set,sigset_t* oldset);
//作用：可以读取或更改进程的信号屏蔽字(阻塞信号集)。
//参数：
//	how:选项
//		SIG_BLOCK；将set的信号添加到信号屏蔽字中
//		SIG_UNBLOCK：将set的信号从信号屏蔽字中解除
//		SIG_SETMASK：将信号屏蔽字置为set指向的集合
//	set：如果set不为空则更改进程的信号屏蔽字
//	oldset：如果oldset不为空则通过oldset读取进程的当前信号屏蔽字。
//返回值：成功返回0，失败则返回-1。

sigpending

#include <signal.h>

int sigpending(sigset_t *set);
//作用：读取当前进程的未决信号集并通过set参数传出。
//返回值：成功返回0，失败返回-1.

接下来我们做个小实验：

先屏蔽2号信号，按下Ctrl+C观察其信号集的变化，在解除对2号信号的屏蔽。

#include<iostream>
#include<signal.h>
using namespace std;

//打印
void Print(sigset_t& set)
{
    for(int i=31;i>0;i--)
    {
        if(sigismember(&set,i))
            cout<<1;
        else
            cout<<0;
    }
    cout<<endl;
}
int main()
{
    //将2号信号屏蔽
    sigset_t set,oset;
    sigemptyset(&set);
    sigemptyset(&oset);
    sigaddset(&set,2);
    //将2号信号的屏蔽字添加到block表中
    sigprocmask(SIG_SETMASK,&set,&oset);

    int cnt=15;
    while(true)
    {
        //获取并打印pending表
        sigset_t pending;
        sigpending(&pending);
        cout<<"Pending Table:";
        Print(pending);
        sleep(1);
        if(cnt==0)
        {
            //解除对2号信号的屏蔽
            sigprocmask(SIG_SETMASK,&oset,nullptr);
        }
        cnt--;
    }
    return 0;
}

caryon@VM-24-10-ubuntu:~/linux/signal$ ./signal 
Pending Table:0000000000000000000000000000000
Pending Table:0000000000000000000000000000000
^CPending Table:0000000000000000000000000000010
Pending Table:0000000000000000000000000000010
Pending Table:0000000000000000000000000000010
Pending Table:0000000000000000000000000000010
Pending Table:0000000000000000000000000000010
Pending Table:0000000000000000000000000000010
Pending Table:0000000000000000000000000000010
Pending Table:0000000000000000000000000000010
Pending Table:0000000000000000000000000000010
Pending Table:0000000000000000000000000000010
Pending Table:0000000000000000000000000000010
Pending Table:0000000000000000000000000000010
Pending Table:0000000000000000000000000000010
Pending Table:0000000000000000000000000000010

我们可以看到实在解除了屏蔽之后Ctrl+C才被执行的。

二、信号处理

前面我们提出过一个问题：信号的处理时立即处理的吗？并不是，而是在合适的时候进行处理的，那么什么是合适的时候呢？

进程从内核态切换回用户态的时候 会监测当前进程的pending表和block表并结合handler表去处理信号。

2.1 信号处理流程

如果信号的处理动作是用户自定义函数，在信号递达时就调用这个函数，这样的话就称为捕捉信号。

理解：

用户程序自定义了 SIGQUIT 信号的处理函数 sighandler 。在当前执行 main 函数发生了中断或异常切换到内核态。处理完中断后要返回用户态的 main 函数之前检查到有信号 SIGQUIT 递达。内核决定返回用户态后不是恢复 main 函数的上下下继续执行，而是执行 sighandler 函数。（ sighandler 和 main 函数使用不同的堆栈空间，它们之间不存在调用和被调用的关系,是两个独立的控制流程。）sighandler 函数返回后自动执行特殊的系统调用 sigreturn 再次进入内核态。如果没有新的信号要递达，那么这次再返回用户态就是恢复 main 函数的上下文继续执行了。

信号捕捉方法执行时为什么要做权限切换？直接内核执行不就完了吗？
用户的自定义行为可能存在着安全风险

上图可以看出要经历四次用户到内核，内核到用户的切换，故可将上图转化为：

具体的用户态与内核态的理解请看：

2.2 信号处理的操作

前面我们提到过了一种信号捕捉的方法：signal，还有另外的一种捕捉方法：sigaction

#include <signal.h>

int sigaction(int signum,const struct sigaction * act,struct sigaction * oldact);
//作用：读取和修改与指定信号相关联的处理动作。
//参数：
//	signum:指定信号的编号。
//	act和oldact：若act指针⾮空,则根据act修改该信号的处理动作。若oact指针⾮空,则通过ldact传出该信号原来的处理动作。
//	act和oact指向sigaction结构体:
//		struct sigaction {
//		    void     (*sa_handler)(int);
//		    void     (*sa_sigaction)(int, siginfo_t *, void *);
//		    sigset_t   sa_mask;
//		    int        sa_flags;
//		    void     (*sa_restorer)(void);
//		};
//	将sa_handler赋值为常数SIG_IGN传给sigaction表示忽略信号,赋值为常数SIG_DFL表⽰执⾏系统默认动作,赋值为一个函数指针表示⽤自定义函数捕捉信号,
//	或者说向内核添加了一个信号处理函数,该函数返回值为void,可以带⼀个int参数，通过参数可以得知当前信号的编号,这样就可以⽤同一个函数处理多种信号。
//	显然,这也是⼀个回调函数,不是被main函数调⽤,⽽是被系统所调⽤。
//返回值：调⽤成功则返回0,出错则返回-1。

处理信号期间可能会再次陷入内核，比如信号的处理时间很长而信号持续累加就会使得栈溢出呀！

当某个信号的处理函数被调用时，内核自动将当前信号加入进程的信号屏蔽字，当信号处理函数返回时自动恢复原来的信号屏蔽字。这样就保证了在处理某个信号时，如果这种信号再次产生，那么它会被阻塞到当前处理结束为止。

如果在调用信号处理函数时，除了当前信号被自动屏蔽之外,还希望自动屏蔽另外一些信号则可以用sa_mask字段说明这些需要额外屏蔽的信号。当信号处理函数返回时自动恢复原来的信号屏蔽字。

三、补充知识

3.1 可重入函数

我们试想这样一个情形：
main函数调用insert函数向一个链表head中插入节点node1，插入操作分为两步，刚做完第一步的时候因为硬件中断使进程切换到内核，再次回用户态之前检查到有信号待处理，于是切换到sighandler函数，sighandler也调用insert函数向同一个链表head中插入节点node2，插入操作的两步都做完之后从sighandler返回内核态，再次回到用户态就从main函数调用的insert函数中继续往下执行。先前做第一步之后被打断，现在继续做完第而二步。结果是main函数和sighandler先后向链表中插入两个节点，而最后只有一个节点真正插入链表中了。

像上例这样的insert函数被不同的控制流程调用，有可能在第一次调用还没返回时就再次进入该函数，这称为重入。insert函数访问一个全局链表，有可能因为重入而造成错乱，像这样的函数称为 不可重入函数 ；反之，如果一个函数只访问自己的局部变量或参数则称为 可重入函数 。

3.2 volatile

该关键字在C当中我们已经有所涉猎，今天我们站在信号的角度重新理解一下

#include <stdio.h>
#include <signal.h>
int flag = 0;
void handler(int sig)
{
    printf("chage flag 0 to 1\n");
    flag = 1;
}
int main()
{
    signal(2, handler);
    while (!flag);
    printf("process quit normal\n");
    return 0;
}

当我们正常编译时可以看到：

caryon@VM-24-10-ubuntu:~/linux/signal$ make 
g++ -o signal signal.cc
caryon@VM-24-10-ubuntu:~/linux/signal$ ./signal
^Cchage flag 0 to 1
process quit normal

当我们开了优化时可以看到：

caryon@VM-24-10-ubuntu:~/linux/signal$ make
g++ -o signal signal.cc -O2
caryon@VM-24-10-ubuntu:~/linux/signal$ ./signal
^Cchage flag 0 to 1 
^Cchage flag 0 to 1 
^Cchage flag 0 to 1

优化情况下CTRL-C的2号信号被捕捉，执行自定义动作，修改 flag＝1 ，是while条件依旧满足进程继续运行！但是很明显flag肯定已经被修改了为何循环依旧执行呢？

很明显，while 循环检查的 flag，并不是内存中最新的 flag，这就存在了数据二异性的问题。while 检测的 flag 其实已经因为优化，被放在了CPU寄存器当中。如何解决呢？很明显需要 volatile （异变关键字）

volatile作用就是保持内存的可见性，告知编译器，被该关键字修饰的变量，不允许被优化，对该变量的任何操作，都必须在真实的内存中进行。

3.3 SIGCHLD信号

进程时讲过用wait和waitpid函数清理僵尸进程。父进程可以阻塞等待子进程结束也可以非阻塞地查询是否有子进程结束等待清理(也就是轮询的方式)。采用第一种方式，父进程阻塞了就不能处理自己的工作了；采用第二种方式，父进程在处理自己的工作的同时还要记得时不时地轮询一下，程序实现复杂。

其实，子进程在终止时会给父进程发SIGCHLD信号，该信号的默认处理动作是忽略，父进程可以自定义SIGCHLD信号的处理函数，这样的话父进程只需专心处理自己的工作就不必关心子进程了，子进程终止时会通知父进程，父进程在信号处理函数中调用wait清理子进程即可。

#include <stdio.h>
#include <stdlib.h>
#include <signal.h>
#include <sys/wait.h>
void handler(int sig)
{
    pid_t id;
    while ((id = waitpid(-1, NULL, WNOHANG)) > 0)
    {
        printf("wait child success: %d\n", id);
    }
    printf("child is quit! %d\n", getpid());
}
int main()
{
    signal(SIGCHLD, handler);
    pid_t cid;
    if ((cid = fork()) == 0)
    { 
    	// child
        printf("child : %d\n", getpid());
        sleep(3);
        exit(1);
    }
    while (1)
    {
        printf("father proc is doing some thing!\n");
        sleep(1);
    }
    return 0;
}

caryon@VM-24-10-ubuntu:~/linux/signal$ ./signal
father proc is doing some thing!
child : 3491430
father proc is doing some thing!
father proc is doing some thing!
father proc is doing some thing!
wait child success: 3491430
child is quit! 3491429
father proc is doing some thing!

事实上，由于UNIX的历史原因，要想不产生僵尸进程还有另外一种办法：父进程调用sigaction将SIGCHLD的处理动作置为SIG_IGN，这样fork出来的子进程在终止时会自动清理掉而不会产生僵尸进程，也不会通知父进程。 系统默认的忽略动作和用户用sigaction函数自定义的忽略通常是没有区别的，但这是个特例。 此方法对于Linux可用，但不保证在其它UNIX系统上都可用。