作者个人研发的在高并发场景下,提供的简单、稳定、可扩展的延迟消息队列框架,具有精准的定时任务和延迟队列处理功能。自开源半年多以来,已成功为十几家中小型企业提供了精准定时调度方案,经受住了生产环境的考验。为使更多童鞋受益,现给出开源框架地址:https://github.com/sunshinelyz/mykit-delay
写在前面
最近不少小伙伴们都在问我:高并发专题我学了不少文章了,但是如何设计一个高并发的系统我还是一脸懵逼!这个问题怎么解决呢?其实,相信不只是问我的这些小伙伴有这个困惑,就连工作(入坑)了好几年的开发人员也都有这样的困惑:我学习了很多的高并发课程,也看了不少的高大上的文章,可就是不知道怎么去设计一个支撑高并发大流量的系统。针对小伙伴们的疑惑,这里,我就把一些设计高并发大流量的常规思路分享给大家,不一定完全正确,设计高并发大流量系统本来就是一个仁者见仁、智者见智的事情,只要是符合自身业务场景的架构思路,都是好的架构思路,架构本身来说就是没有一个完全正确的架构,而是尽量符合当时自身的业务场景,并且能够良好的支撑业务的负载。
高并发架构相关概念
什么是并发?
并发是指并发的访问,也就是某个时间点,有多少个访问同时到来;
通常如果一个系统的日PV在千万以上,有可能是一个高并发的系统,这里需要注意的是:只是有可能是一个高并发的系统,不一定是一个高并发的系统。
并发数和QPS是不同的概念,一般说QPS会说多少并发用户下QPS,当QPS相同时,并发用户数越大,网站并发处理能力越好。当并发用户数过大时,会造成进程(线程)频繁切换,反正真正用于处理请求的时间变少,每秒能够处理的请求数反而变少,同时用户的请求等待时间也会变大。找到最佳线程数能够让web系统更稳定,效率更高。
并发数 = QPS*平均响应时间
高并发具体关心什么?
QPS: 每秒请求或查询的数量,在互联网领域,指每秒响应请求数;
吞吐量: 单位时间内处理的请求量(通常由QPS与并发数决定);
响应时间: 从请求发出到收到响应花费的时间,例如一个系统处理一个HTTP请求需要100ms,这个100ms就是系统的响应时间;
PV: 综合浏览量,即页面浏览量或者点击量,一个访客在24小时内访问的页面数量;
UV: 独立访客 ,即一定时间范围内相同访客多次访问网站,只计算为一个独立的访客;
带宽: 计算带宽大小需要关注两个指标,峰值流量和页面的平均大小 ;
日网站带宽可以使用下面的公式来粗略计算:
- 日网站带宽=pv/统计时间(换算到秒)*平均页面大小(单位kB)*8
峰值一般是平均值的倍数;
QPS不等于并发连接数,QPS是每秒HTTP请求数量,并发连接数是系统同时处理的请求数量;
- 峰值每秒请求数(QPS) = (总PV数 * 80%) /(6小时秒数 * 20%)
压力测试: 测试能承受的最大并发,测试最大承受的QPS值。
测试工具(ab):目标是URL,可以创建多个访问线程对同一个URL进行访问(Nginx);
ab的使用: 模拟并发请求100次(100个人),总共请求5000次(每个人请求5000次)
- ab -c 100 -n 5000 待测试网站(内存和网络不超过最高限度的75%)
QPS达到50:一般的服务器就可以应付;
QPS达到100: 假设关系型数据库的每次请求在0.01秒完成(理想),假设单页面只有一个SQL查询,那么100QPS意味着1秒中完成100次请求,但此时我们不能保证数据库查询能完成100次;
方案:数据库缓存层、数据库的负载均衡;
QPS达到800: 假设我们使用 百兆宽带,意味着网站出口的实际带宽是8M左右,假设每个页面是有10k,在这个并发的条件下,百兆带宽已经被吃完;
方案:CDN加速、负载均衡
QPS达到1000: 假设使用Redis缓存数据库查询数据,每个页面对Redis请求远大于直接对DB的请求;
Redis的悲观并发数在5W左右,但有可能之前内网带宽已经被吃光,表现出不稳定;
方案:静态HTML缓存
QPS达到2000: 文件系统访问锁都成为了灾难;
方案:做业务分离,分布式存储;
高并发解决方案案例
流量优化: 防盗链处理(把一些恶意的请求拒之门外)
前端优化: 减少HTTP请求、添加异步请求、启用浏览器的缓存和文件压缩、CDN加速、建立独立的图片服务器;
服务端优化: 页面静态化处理、并发处理、队列处理;
数据库优化: 数据库的缓存、分库分表、分区操作、读写分离、负载均衡
Web服务器优化: 负载均衡
高并发下的经验公式
通过QPS和PV计算部署服务器的台数
单台服务器每天PV计算
- 公式1:每天总PV = QPS * 3600 * 6
- 公式2:每天总PV = QPS * 3600 * 8
服务器计算
- 服务器数量 = ceil( 每天总PV / 单台服务器每天总PV )
峰值QPS和机器计算公式
原理: 每天80%的访问集中在20%的时间里,这20%时间叫做峰值时间
公式: ( 总PV数 * 80% ) / ( 每天秒数 * 20% ) = 峰值时间每秒请求数(QPS)
机器: 峰值时间每秒QPS / 单台机器的QPS = 需要的机器。
本文转载自微信公众号「冰河技术」,可以通过以下二维码关注。转载本文请联系冰河技术公众号。