调查:中国互联网公司数据库访问层现状

数据库
解决数据库访问和写入的瓶颈,需要从数据库访问层入手。本文将分析目前中国互联网公司数据库访问层的现状,供大家参考。

【51CTO综合报道】在WEB开发中,数据库的数据读写和传输一向是瓶颈,在此基础上的解决方案基本都是数据库连接层的设计,一个公司数据库连接层的强弱与否可以标识这个公司的全局规划的“工艺水平”到达一个什么程度了。下面的内容来自明查暗访,决无侵犯之意,旨在提供给需要统一规划整体架构的架构师一个帮助。

[[16362]]

1.人人网

参考:http://ugc.renren.com/2009/12/28/renren-ice-problem/

关键词:ice中间层,统一配置数据源,开发者不关心分库分表

与很多大型的网站一样,人人网的系统全部是由开源软件构建的。使用Nginx做前端接入,resin做容器,Memcached做通用 cache,MySQL做数据库,使用Linux操作系统。
除了上述的部分外,人人网还有一个与众不同的中间层。中间层以服务的形式存在,位于MySQL和resin中间,提供高并发低成本的数据访问层。

51CTO曾对人人网的技术高级总监黄晶进行过专访,详情请看《专访人人网黄晶:SNS网站后台架构探秘》和《51CTO专访人人网黄晶:WEB开发需要随需应变》。

在专访中,黄晶先生曾提到“我们的数据库用到了部分自身缓存机制,比如尽可能利用innodb的pool和MySQL的Query Cache。在中间用到Memcached,以及基于ICE通讯框架由我们自己编写的包含业务逻辑处理能力的缓存服务,在我们自行开发的分布式KV系统中也会充分利用内存Cache加速。”

2.百度

参考:http://wenku.baidu.com/view/9daa2b8102d276a200292e9c.html

关键词:dbproxy,服务器都是flash卡,DBA与开发者都不关心分裤分表(半自动)

百度的dbproxy利器,将MySQL的管理半自动化,HA等功能一应俱全,再加上SSD等硬件支持,性能相当不一般。dbproxy的作用是合理地分配数据库请求给所有的DB Server, 使得在请求的数量等于或者小于所有DB Server的计算能力总和时, 服务能够正常运行。

第一种方式的dbproxy: Web Server上的数据库客户端(如PHP脚本)拥有选择DB Server的智能。

这种方式实现简单, 完全用Web脚本实现, 脚本自己判断应该连接其中的一台或者几台DB Server, 请决定把SQL请求发给谁. 这种方式因为性能问题, 所以应用不是很广。

第二种方式的dbproxy: SQL代理进程

类似HTTP代理服务器, 这种方式的dbproxy独立运行, 所以客户端请求将不再直接和DB Server连接, 而是通过它中转。这样的dbproxy, 首先要拥有解析协议(也即SQL)的能力, 这也带来一个特点, dbproxy可以与后端的MySQL连接, 但却接收前端(如PHP脚本)发来的Oracle数据库的SQL请求。

当然, dbproxy的主要功能还是在SQL分发方面. 另外, 还可以在dbproxy上面做与业务更接近的缓存, 相比数据库的底层缓存很多时候更有效。

3.盛大-技术保障中心

参考:网友

关键词:无中间件,每个系统一个数据库,开发者严重关心分库分表

4.新浪

参考:网友

关键词:无中间件 分表要开发者自己做

5.金山

参考:网友

关键词:无中间件 分表要开发者自己做

6.腾讯

参考:腾讯大讲堂45-解剖TTC

关键词:Tencent Table Cache

TTC是提供高速数据访问服务的通用cache server。特点是采用epoll和异步状态机模式提高并发能力。TTC看上去是一个数据库缓冲层,由于资料有限,只能如此分析。

7.淘宝、支付宝

参考:http://wenku.baidu.com/view/f36d620c844769eae009edba.html

关键词:JBoss作为中间件,有数据路由层,数据库Oracle 与 MySQL

在网络上许多文档里都有提到阿里内部是有一数据路由层的,另外JBoss的使用也使得他们轻便不少(可惜当年哥在淘宝时只搞的是搜索,不使用DB)

目前淘宝和支付宝使用的Oracle数据库为Oracle 11g。借助Oracle 11g新增的PL/SQL 相关的某些新特性如网络日志分析工具,为客户和内部技术人员带来了更加快速简便的全新体验;利用Oracle Advanced Compression技术,不仅节省大量存储空间,而且提升了查询性能。

延伸阅读

豆瓣网:BeansDB与NoSQL的应用与发展

51CTO采访过豆瓣网首席架构师洪强宁先生,在专访中我们专门探讨了关于BeansDB在豆瓣的应用问题。

BeansDB主要由Server端和Client端两个部分组成。Server端用C编写,使用Memcached的通讯协议,任何支持Memcached的Client端都可以与BeansDB的Server端同步来获取和存储数据。在Client端方面的主要差别是分布式的逻辑实现方面。目前,BeansDB的Client端主要是豆瓣自己用Python语言的实现。Client端的运作方式是写数据时写入多份,读的时候只读一份,用其他任何语言实现也和简单。

BeansDB开放在Google Code上,在采访中,洪强宁先生谈到,豆瓣开放BeansDB,希望能看到其他语言的Client端实现,让这个BeansDB的使用更加方便,能让更多人用到这个产品。

目前,BeansDB在豆瓣主要部署了两个集群:一个集群用于存储数据库中的大文本数据,比如日记、帖子一类;另外一个豆瓣FS集群,主要用于存储媒体文件,比如用户上传的图片、豆瓣电台上的音乐等。

 

责任编辑:彭凡 来源: 54chen
相关推荐

2011-03-10 12:31:40

生存现状移动开发者

2013-01-25 10:31:02

互联网公司移动互联网船票

2013-01-15 14:36:45

CNNIC中国互联网调查报告

2009-09-22 13:43:11

2013-01-22 11:31:19

互联网手机安卓小米

2018-05-16 14:24:53

2022-12-27 09:31:01

2018-09-29 14:59:06

互联网数据BAT

2016-07-13 18:00:05

2019-08-26 13:11:15

互联网后厂村中关村

2018-05-23 15:44:49

2015-09-24 09:07:44

2013-12-18 16:21:32

未来互联网移动互联网

2014-12-10 10:03:14

2013-02-28 09:54:20

2017-10-09 14:44:30

互联网扫一扫网络

2015-08-25 10:52:37

2022-06-28 10:12:02

互联网裁员

2018-08-13 21:03:31

互联网苹果网易

2020-11-24 14:49:06

网络安全数据技术
点赞
收藏

51CTO技术栈公众号