如何增强Linux内核中的访问控制安全

安全 网站安全 Linux
篇幅有限,本文只是介绍了Linux上的拦截技术,后续有机会可以一起探讨windows和macOS上的拦截技术。下面,一起来看。

背景

前段时间,我们的项目组在帮客户解决一些操作系统安全领域的问题,涉及到windows,Linux,macOS三大操作系统平台。无论什么操作系统,本质上都是一个软件,任何软件在一开始设计的时候,都不能***的满足人们的需求,所以操作系统也是一样,为了尽可能的满足人们需求,不得不提供一些供人们定制操作系统的机制。当然除了官方提供的一些机制,也有一些黑魔法,这些黑魔法不被推荐使用,但是有时候面对具体的业务场景,可以作为一个参考的思路。

[[251647]]

Linux中常见的拦截过滤

本文着重介绍Linux平台上常见的拦截:

  • 用户态动态库拦截。
  • 内核态系统调用拦截。
  • 堆栈式文件系统拦截。
  • inline hook拦截。
  • LSM(Linux Security Modules)

动态库劫持

Linux上的动态库劫持主要是基于LD_PRELOAD环境变量,这个环境变量的主要作用是改变动态库的加载顺序,让用户有选择的载入不同动态库中的相同函数。但是使用不当就会引起严重的安全问题,我们可以通过它在主程序和动态连接库中加载别的动态函数,这就给我们提供了一个机会,向别人的程序注入恶意的代码。

假设有以下用户名密码验证的函数:

  1. #include <stdio.h> 
  2. #include <string.h> 
  3. #include <stdlib.h> 
  4. int main(int argc, char **argv) 
  5. char passwd[] = "password"; 
  6. if (argc < 2) { 
  7. printf("Invalid argc!\n"); 
  8. return; 
  9. if (!strcmp(passwd, argv[1])) { 
  10. printf("Correct Password!\n"); 
  11. return; 
  12. printf("Invalid Password!\n"); 

我们再写一段hookStrcmp的程序,让这个比较永远正确。

  1. #include <stdio.h> 
  2. int strcmp(const char *s1, const char *s2) 
  3. /* 永远返回0,表示两个字符串相等 */ 
  4. return 0; 

依次执行以下命令,就会使我们的hook程序先执行。

  1. gcc -Wall -fPIC -shared -o hookStrcmp.so hookStrcmp.c 
  2. export LD_PRELOAD=”./hookStrcmp.so” 

结果会发现,我们自己写的strcmp函数优先被调用了。这是一个最简单的劫持 ,但是如果劫持了类似于geteuid/getuid/getgid,让其返回0,就相当于暴露了root权限。所以为了安全起见,一般将LD_PRELOAD环境变量禁用掉。

Linux系统调用劫持

最近发现在4.4.0的内核中有513多个系统调用(很多都没用过),系统调用劫持的目的是改变系统中原有的系统调用,用我们自己的程序替换原有的系统调用。Linux内核中所有的系统调用都是放在一个叫做sys_call_table的内核数组中,数组的值就表示这个系统调用服务程序的入口地址。整个系统调用的流程如下:

当用户态发起一个系统调用时,会通过80软中断进入到syscall hander,进而进入全局的系统调用表sys_call_table去查找具体的系统调用,那么如果我们将这个数组中的地址改成我们自己的程序地址,就可以实现系统调用劫持。但是内核为了安全,对这种操作做了一些限制:

  • sys_call_table的符号没有导出,不能直接获取。
  • sys_call_table所在的内存页是只读属性的,无法直接进行修改。

对于以上两个问题,解决方案如下(方法不止一种):

  • 获取sys_call_table的地址 :
    1. grep sys_call_table /boot/System.map-uname -r 
  • 控制页表只读属性是由CR0寄存器的WP位控制的,只要将这个位清零就可以对只读页表进行修改。
  1. /* make the page writable */ 
  2. int make_rw(unsigned long address) 
  3. unsigned int level; 
  4. pte_t *pte = lookup_address(address, &level);//查找虚拟地址所在的页表地址 
  5. pte->pte |= _PAGE_RW;//设置页表读写属性 
  6. return 0; 
  1. /* make the page write protected */ 
  2. int make_ro(unsigned long address) 
  3. unsigned int level; 
  4. pte_t *pte = lookup_address(address, &level); 
  5. pte->pte &= ~_PAGE_RW;//设置只读属性 
  6. return 0; 

1. 开始替换系统调用

本文实现的是对 ls这个命令对应的系统调用,系统调用号是__NR_getdents。

  1. static int syscall_init_module(void) 
  2. orig_getdents = sys_call_table[__NR_getdents]; 
  3. make_rw((unsigned long)sys_call_table); //修改页属性 
  4. sys_call_table[__NR_getdents] = (unsigned long *)hacked_getdents; //设置新的系统调用地址 
  5. make_ro((unsigned long)sys_call_table); 
  6. return 0; 

2. 恢复原状

  1. static void syscall_cleanup_module(void) 
  2. printk(KERN_ALERT "Module syscall unloaded.\n"); 
  3. make_rw((unsigned long)sys_call_table); 
  4. sys_call_table[__NR_getdents] = (unsigned long *)orig_getdents; 
  5. make_ro((unsigned long)sys_call_table); 

使用Makefile编译,insmod插入内核模块后,再执行ls时,就会进入到我们的系统调用,我们可以在hook代码中删掉某些文件,ls就不会显示这些文件,但是这些文件还是存在的。

堆栈式文件系统

Linux通过vfs虚拟文件系统来统一抽象具体的磁盘文件系统,从上到下的IO栈形成了一个堆栈式。通过对内核源码的分析,以一次读操作为例,从上到下所执行的流程如下:

内核中采用了很多c语言形式的面向对象,也就是函数指针的形式,例如read是vfs提供用户的接口,具体底下调用的是ext2的read操作。我们只要实现VFS提供的各种接口,就可以实现一个堆栈式文件系统。Linux内核中已经集成了一些堆栈式文件系统,例如Ubuntu在安装时会提醒你是否需要加密home目录,其实就是一个堆栈式的加密文件系统(eCryptfs),原理如下:

实现了一个堆栈式文件系统,相当于所有的读写操作都会进入到我们的文件系统,可以拿到所有的数据,就可以进行做一些拦截过滤。

以下是我实现的一个最简单的堆栈式文件系统,实现了最简单的打开、读写文件,麻雀虽小但五脏俱全。

https://github.com/wangzhangjun/wzjfs

inline hook

我们知道内核中的函数不可能把所有功能都在这个函数中全部实现,它必定要调用它的下层函数。如果这个下层函数可以得到我们想要的过滤信息内容,就可以把下层函数在上层函数中的offset替换成新的函数的offset,这样上层函数调用下层函数时,就会跳到新的函数中,在新的函数中做过滤和劫持内容的工作。所以从原理上来说,inline hook可以想hook哪里就hook哪里。

inline hook 有两个重要的问题:

  • 如何定位hook点。
  • 如何注入hook函数入口。

1. 对于***个问题:

需要有一点的内核源码经验,比如说对于read操作,源码如下:

在这里当发起read系统调用后,就会进入到sys_read,在sys_read中会调用vfs_read函数,在vfs_read的参数中正好有我们需要过滤的信息,那么就可以把vfs_read当做一个hook点。

2. 对于第二个问题:

如何Hook?这里介绍两种方式:

  • ***种方式:直接进行二进制替换,将call指令的操作数替换为hook函数的地址。
  • 第二种方式:Linux内核提供的kprobes机制。

其原理是在hook点注入int 3(x86)的机器码,让cpu运行到这里的时候会触发sig_trap信号,然后将用户自定义的hook函数注入到sig_trap的回调函数中,达到触发hook函数的目的。这个其实也是调试器的原理。

LSM

LSM是Linux Secrity Module的简称,即linux安全模块。是一种通用的Linux安全框架,具有效率高,简单易用等特点。原理如下:

LSM在内核中做了以下工作:

  • 在特定的内核数据结构中加入安全域。
  • 在内核源代码中不同的关键点插入对安全钩子函数的调用。
  • 加入一个通用的安全系统调用。
  • 提供了函数允许内核模块注册为安全模块或者注销。
  • 将capabilities逻辑的大部分移植为一个可选的安全模块,具有可扩展性。

适用场景

对于以上几种Hook方式,有其不同的应用场景。

  • 动态库劫持不太完全,劫持的信息有可能满足不了我们的需求,还有可能别人在你之前劫持了,一旦禁用LD_PRELOAD就失效了。
  • 系统调用劫持,劫持的信息有可能满足不了我们的需求,例如不能获取struct file结构体,不能获取文件的绝对路径等。
  • 堆栈式文件系统,依赖于Mount,可能需要重启系统。
  • inline hook,灵活性高,随意Hook,即时生效无需重启,但是在不同内核版本之间通用性差,一旦某些函数发生了变化,Hook失效。
  • LSM,在早期的内核中,只能允许一个LSM内核模块加载,例如加载了SELinux,就不能加载其他的LSM模块,在***的内核版本中不存在这个问题。

总结

篇幅有限,本文只是介绍了Linux上的拦截技术,后续有机会可以一起探讨windows和macOS上的拦截技术。事实上类似的审计HOOK放到任何一个系统中都是刚需,不只是kernel,我们可以看到越来越多的vm和runtime甚至包括很多web组件、前端应用都提供了更灵活的hook方式,这是透明化和实时性两个安全大趋势下最常见的解决方案。

【本文是51CTO专栏作者“ThoughtWorks”的原创稿件,微信公众号:思特沃克,转载请联系原作者】

戳这里,看该作者更多好文

责任编辑:赵宁宁 来源: 51CTO专栏
相关推荐

2013-01-22 11:10:11

2020-12-23 09:40:17

物联网安全访问控制

2010-12-28 10:36:41

Linux

2009-07-06 20:55:48

Linux全访问控制模型方案设计

2013-11-05 09:55:37

2011-08-16 16:20:33

Linuxkconfigmakefile

2011-01-10 16:45:45

2009-12-25 10:02:39

2012-01-10 10:05:47

文件目录访问控制UGO

2017-03-15 15:15:08

2020-06-18 07:11:40

物联网安全物联网IOT

2021-03-11 12:19:39

Linux运维Linux系统

2010-08-17 09:55:29

2020-06-02 14:27:48

物联网访问控制网络安全

2021-01-05 18:36:39

物联网安全

2011-01-13 12:46:13

2024-01-31 10:16:57

2014-06-10 16:51:44

云数据应用访问安全控制

2019-09-02 00:10:37

2023-04-03 00:10:49

点赞
收藏

51CTO技术栈公众号