简单讲述Linux内核系统应用

运维 系统运维
提高Linux内核应对短连接的负载 能力在存在大量短连接的情况下,Linux内核的TCP栈一般都会生成大量的 TIME_WAIT 状态的socket。你可以用下

在向大家详细介绍Linux内核之前,首先让大家了解下系统的pdflush进程,然后全面介绍Linux内核,希望对大家有用。与磁盘IO子系统有关Linux内核的编辑◆ /proc/sys/vm/dirty_ratio这个参数控制文件系统的文件系统写缓冲区的大小,单位是百分比,表示系统内存的百分比,表示当写缓冲使用到系统内存多少的时候,开始向磁盘写出数据 。

增大之会使用更多系统内存用于磁盘写缓冲,也可以极大提高系统的写性能 。但是,当你需要持续、恒定的写入场合时,应该降低其数值,一般启动上缺省是10。下面是增大的方法:
echo '40' > /proc/sys/vm/dirty_ratio

◆ /proc/sys/vm/dirty_background_ratio这个参数控制文件系统的pdflush进程,在何时刷新磁盘。单位是百分比,表示系统内存的百分比,意思是当写缓冲使用到系统内存多少的时候,pdflush开始向磁盘写出数据。增大之会使用更多系统内存用于磁盘写缓冲,也可以极大提高系统的写性能。但是,当你需要持续、恒定的写入场合时,应该降低其数值,一般启动上缺省是 5。下面是增大的方法:
echo '20' > /proc/sys/vm/dirty_background_ratio
◆ /proc/sys/vm/dirty_writeback_centisecs这个参数控制内核 的脏数据刷新进程pdflush的运行 间隔。单位是 1/100 秒。缺省数值是500,也就是 5 秒。如果你的系统是持续地写入动作,那么实际上还是降低这个数值比较好,这样可以把尖峰的写操作削平成多次写操作。设置 方法如下:

echo "200" > /proc/sys/vm/dirty_writeback_centisecs
如果你的系统是短期地尖峰式的写操作,并且写入数据不大(几十M/次)且内存有比较多富裕,那么应该增大此数值:
echo "1000" > /proc/sys/vm/dirty_writeback_centisecs
◆ /proc/sys/vm/dirty_expire_centisecs这个参数声明Linux内核写缓冲区里面的数据多“旧”了之后,pdflush 进程就开始考虑写到磁盘中去。单位是 1/100秒。缺省是30000,也就是 30秒的数据就算旧了,将会刷新磁盘。对于特别重载的写操作来说,这个值适当缩小也是好的,但也不能缩小太多,因为缩小太多也会导致IO提高太快。建议设置为1500,也就是15秒算旧。
echo "1500" > /proc/sys/vm/dirty_expire_centisecs

当然,如果你的系统内存比较大,并且写入模式是间歇式的,并且每次写入的数据不大(比如几十M),那么这个值还是大些的好。
◆ 与网络 IO子系统有关的编辑/proc/sys/net/ipv4/tcp_retrans_collapse这个参数控制TCP双方Window协商出现错误的时候的一些重传的行为。但是在老的2.6的核(<2.6.18)里头,这个重传会导致kernel oops,kernel panic,所以,如果出现有tcp_retrans_*样子的kernel panic,可以把这个参数给设置成0:
echo '0' > /proc/sys/net/ipv4/tcp_retrans_collapse

◆ 提高Linux内核应对短连接的负载 能力在存在大量短连接的情况下,Linux内核的TCP栈一般都会生成大量的 TIME_WAIT 状态的socket。你可以用下
面的命令 看到:
netstat -ant| grep -i time_wait
有时候,这个数目是惊人的:
netstat -ant|grep -i time_wait |wc -l
可能会超过三四万。这个时候,我们需要修改 linux kernel 的 tcp time wait的时间,缩短之,有个 sysctl参数貌似可以使用,它是 /proc/sys/net/ipv4/tcp_fin_timeout,缺省值是60,也就是60秒,很多网上的资料都说将这个数值设置低一些就可以减少netstat里面的TIME_WAIT状态,但是这个说法是错误的。经过认真阅读Linux的内核源代码,我们发现这个数值其实是输出用的,修改之后并没有真正的读回内核中进行使用,而内核中真正管用的是一个宏定义,在 $KERNEL/include/net/tcp.h里面,有下面的行:
#define TCP_TIMEWAIT_LEN (60*HZ) /* how long to wait to destroy TIME-WAIT

* state, about 60 seconds     */
而这个宏是真正控制 TCP  TIME_WAIT 状态的超时时间的。如果我们希望减少 TIME_WAIT 状态的数目(从而节省一点点内核操作时间),那么可以把这个数值设置低一些,根据我们的测试,设置为 10 秒比较合适,也就是把上面的修改为:
#define TCP_TIMEWAIT_LEN (10*HZ) /* how long to wait to destroy TIME-WAIT
* state, about 60 seconds     */
然后重新编译 内核,重启系统即可发现短连接造成的TIME_WAIT状态大大减少:
netstat -ant | grep -i time_wait |wc -l
一般情况都可以至少减少2/3。也能相应提高系统应对短连接的速度。
/proc/irq/{number}/smp_affinity在多 CPU 的环境中,还有一个中断平衡的问题,比如,网卡中断会教给哪个 CPU 处理,这个参数控制哪些 CPU 可以绑定 IRQ 中断。其中的 {number} 是对应设备的中断编号,可以用下面的命令找出:
cat /proc/interrupt
比如,一般 eth0 的 IRQ 编号是 16,所以控制 eth0 中断绑定的 /proc 文件名是 /proc/irq/16/smp_affinity。上面这个命令还可以看到某些中断对应的CPU处理的次数,缺省的时候肯定是不平衡的。
设置其值的方法很简单,smp_affinity 自身是一个位掩码(bitmask),特定的位对应特定的 CPU,这样,01 就意味着只有***个 CPU 可以处理对应的中断,而 0f(0x1111)意味着四个 CPU 都会参与中断处理。
Linux内核几乎所有外设都有这个参数设置,可以关注一下。
这个数值的推荐设置,其实在很大程度上,让专门的CPU处理专门的中断是效率***的,比如,给磁盘IO一个CPU,给网卡一个CPU,这样是比较合理的。

【编辑推荐】

  1. 阐述Linux内核里面的APIC编程
  2. 分析linux内核的idle的知识
  3. 透明了解Linux内核结构
  4. 详解linux内核配置
  5. linux内核对S3C2410睡眠模式的支持
责任编辑:佚名 来源: CSDN
相关推荐

2009-12-18 17:53:45

Linux Apach

2009-12-28 12:48:35

Linux内核

2009-12-18 18:53:18

2010-03-08 15:10:57

2010-03-16 15:47:06

Ubuntu Linu

2012-04-11 09:26:13

内核Linux 开发

2010-03-18 17:29:21

2009-09-25 10:00:47

Hibernate映射

2009-12-24 09:47:17

Linux之父

2009-04-11 15:22:24

Linux 2.6内核应用

2009-09-24 10:06:42

Hibernate实例

2009-09-28 10:14:08

Hibernate基础

2012-07-30 14:13:11

Linux 2.6内核嵌入式

2009-12-24 14:19:53

LINUX MAC驱动

2009-10-10 09:57:58

使用RHEL合法

2009-12-17 17:19:45

Linux系统

2009-09-25 13:39:40

Hibernate属性

2010-04-20 10:12:05

2009-12-22 13:15:59

Linux ueven

2009-10-15 15:31:49

网络布线系统
点赞
收藏

51CTO技术栈公众号