“今天你网购了么?”这已经不再是一句广告语,而成了普普通通的人每天都在做的一件事;网购也已经不是时尚,而是真真切切的融入到了每个人的生活中去。当人们热衷于网购的时候,电子商务网站背后的IT系统架构是怎样支撑着每天不计其数的订单?在“双十一”那些特殊的购物期间,IT系统如何面临来自不可预测的海量用户因高并发访问带来的巨大考验?怎样去防止那些不可预知、突发性的高并发访问而导致服务器过载、在线交易系统反应迟滞甚至瘫痪等问题?带着一系列的问题记者对一号店CTO韩军进行了采访。
亲手打造一号店IT系统
韩军,曾任51job.com网站主要负责人,开创了中国招聘网站系统先河。后加入一号店,自2007年开始,韩军先生从零开始打造1号店网站系统、供应链系统等等,最终促使一号店突出重围,成为行业黑马。
对于网站建设初期的问题,和大多数初创企业一样,资金成了首要问题。对此韩军直言不讳:“一开始还是有一些压力的,这些压力不是规划不到位,而是因为资金不够。所以不能一开始做高规模的架构。”设计初始,韩军并没有想到一号店的发展如此迅速。在建站初始,从应用层面的考虑,韩军就已经设计了底层架构是支撑***访问量的基础架构,这一数字在如今看着并不稀奇,但是在当时,已经非常超前了。
电子商务的系统比较复杂,韩军提到一号店最初在数据中心方面花的钱相对较高。而在最初比较大的挑战还是来自于应用层面。他用了一个很有意思的比喻,他认为在当时自己就是一个“拆迁队长”,因此一号店的整个IT系统也从最初的各位数子系统演变成了现在四百多个。
“破茧成蝶”的一号店
“宕机”对于一个电商企业来说,是非常严重的事故,也是诸多企业避而不谈的问题。在采访中,韩军对此却并不避忌。“我们在最初规划的时候走了一些捷径。捷径的好处是开发很快,也能保证功能的实现,但是会有隐患,这一点,我们在2009年的时候充分体验到了。”韩军说。
提到这次宕机,也是当时一号店在一个节目中的广告所致。一个大红大紫的节目,一段一号店的广告,结果交易量让韩军并没有预估到。
我们很难说一次“宕机”事故是好是坏,但是就目前一号店整个IT架构的从峰值压力来说,也只需要加机器,稍微调整一下就可以了。而这样的系统,也是从那次事故之后,韩军带领他的团队做的一个整体规划。
韩军表示:到目前为止,整个系统架构已经没有什么太大的变化。据悉,目前一号店也有自己的私有云系统,在需求量增大的时候,可以自动安装分布系统。韩军说: “现在已经不像以前你看着它淹没时毫无办法,没有办法我就重启。当时做系统管理员就是重启,没有别的办法,现在很简单,私有云说的算。”
2014年网络安全问题备受重视,有统计称大约有四分之一的电商网站存在高危漏洞。而2014年我们也看到了大规模的网站漏洞爆发、大量隐私泄露等重大安全事件的发生。对此韩军提到,目前一号店采用“立体式安全管理体系”,对于一号店来说,他们并不认为安全只是一个简单的防黑客的概念。此外韩军还提到,目前在中国很少电子商务企业在做RCR认真,但是目前一号店在做PCR认证,对此,我们也能看出一号店对安全问题的重视程度。
借力第三方 让系统更完善
就目前来看,由于电商整个行业的特殊性,大多数电商的IT系统都采取自建的方式。尽管如此,为了化解自己所面临的数据流量压力,一号店还是采用了A10 Networks作为合作伙伴。并利用A10 Networks采用全新多核架构搭载ACOS的ADC解决方案,为整个系统提供更高的处理性能,并通过DDoS防护、HA高可用性和会话同步等4层功能保证网络核心应用的可靠性。韩军对与A10 Networks的合作非常满意,他表示:A10的产品整体来说非常稳定,对高并发的处理能力也非常好。
据了解,目前A10 Networks进驻一号店的解决方案中,重点在以下几点有着突出的表现:
设备优异的性能表现:平滑过度高峰时段的巨大业务处理压力;
节省成本:单台A10设备可同时实现链路与服务器负载均衡;
使用A10的aFleX自定义脚本,可灵活适应后台应用的特殊需求,实现无缝割接;
智能选路:引导不同运营商用户从最快的链路访问服务;
链路容灾:即使链路异常也能及时切换,保证业务不中断;
TCP连接复用:A10设备启用连接复用功能可减轻服务器来自客户端的新建连接数的压力,提升服务器性能。
此外,一号店在集群部署线性扩展处理能力上采用了A10 VCS集群技术,弹性扩展,实现了实现N+M多重冗余,并提供aFleX定制化脚本功能,满足了自己对个性化的需求。
后记:我们很感谢韩军此次在采访中的坦诚。他没有避讳一号店最初的窘境,没有避开最初系统的薄弱性,没有隐瞒曾经遭遇的安全问题……然而我们也看到韩军带领其技术团队打造出了“网上超市”的先河,我们并不知道从几个人的技术团队到上千人的技术团队中间的艰辛,但是我们却从这位卓越的CTO身上,看到了一号店的未来。