从OtterTune的倒下说起

数据库 其他数据库
OtterTune的成功崛起当年给了我们带来了相当大的鼓舞,原来在这个领域不仅仅是我们一批人在干,在大洋彼岸也有一批和我们有类似想法的人在干类似的事情。

昨天看到天舟发了一篇文章,提到OtterTune死了。我马上到OtterTune官网上去看,发现确实如此。

这个在2022年才获得1200万美金A轮融资的企业居然就这么倒下了,确实让我感到有些意外。这个不缺技术,不缺钱的优秀团队,做的又是十分有前途的数据库优化,商业模式又是互联网化的SAAS服务,为什么会在拿到一笔巨额投资后不到两年就关门歇业了呢?

DJ OT因违反假释规定而入狱这句话不知道是否暗示了某种原因,不过我不大看得懂这种美国人的幽默。DJ OT是他们的吉祥物,画面里是被关进了囚牢,而并不是死去了。这画面是不是暗示了某种不甘和无奈呢?

图片图片

上面是他们的核心团队,中间C位的是卡内基美隆的教授Andy,右边的 应该是一个华裔。我是在搜索MySQL优化资料的时候发现他们的,因为他们所做的工作和我们有些类似,而且他们的主营业务与我脑子里未来想干的事情十分类似。

图片图片

从上面的图上可以看出,OtterTUNE的商业模式还是相当牛的,通过下载一个DOCKER镜像或者在GitHub上下载开源的客户端完成部署,从数据库中采集数据,通过AGENT上传到AWS的服务端,通过机器学习训练模型,并存储到中央资料库。然后通过计算引擎分析配置建议,并进行自动化巡检,找到优化建议,推送给用户。

上面的模式几乎和我前些年对D-SMART SAAS服务的设计如出一辙。唯一不同的是,我们的自动化能力是基于运维知识图谱+专家模型,在一些AI算法的辅助下完成分析,当问题无法明确定位时,还有专家的人工介入。而且我们的内容不仅限于优化推荐,在客户端已经提供了日常监控、告警和一些简单的分析工具。只有遇到复杂的问题的时候才需要通过收费的云服务或者远程专家服务来获取解决方案。

图片图片

OtterTune也为数据库建立了健康评分,只不过他们评判健康的维度与我们的健康模型相比简单了一些。数据库总体、资源、表、索引、查询这几个维度比较简明,针对中小型数据库系统来说,应该还是比较有效的。

不管怎样,OtterTune的倒下为数据库服务提供了一个可参考的反面教材,无论是做SAAS服务、AIOPS还是传统的DBA,都可以从这个失败的案例中得到启示。

图片图片

在Reddit上我看到了一个讨论帖子,其观点是“这是一个一次性工具,你无法在上面构建付费的服务”。当一个数据库在进行初始化的优化后,你只需要管理好其容量,那么这个数据库将会稳定地运行10年。如果出现问题,大部分可以通过应用侧的修改和优化来解决,就不再需要使用OtterTune的服务了。而且对于MySQL、PG这样的数据库,在一个数据库上活动的配置优化经验,大部分可以不做太多调整就可以用于其他数据库 实例。因此OtterTune能够提供的服务真的就成为一次性服务了。如此看来,他们作为SAAS服务的业务模式本身就是不成立的。

图片图片

分析OtterTune的功能,最核心的能力是通过AI算法,依托各种历史模板为用户提供数据库参数的最佳配置方案。这些确实都是一次性的功能,一旦调整到位后,无需经常调整了。

图片图片

除此之外,表和索引推荐、SQL审计规则是OtterTune的另外一个技术亮点。不过用户对此的付费意愿也并不强烈,这些技能在开发人员侧也很容易构建,并非刚需。

前几天正好有一个原来的Oracle DBA来电向我咨询如果他改行去做PG的数据库服务有没有前途。我说如果是年轻人,转行去干PG可能还行,对于一个40多岁,在Oracle领域干了20多年的DBA来说,似乎比较难找到与现在价值相匹配的工作。PG的用户所需要的服务,以及能够支付的费用无法与Oracle服务相比,今后运维PG数据库的方式也与运维Oracle完全不同。你现在去转行干PG,可能还干不过那些20多岁的小年轻,你的盈利模式在什么地方呢?

回过头来反思我们目前正在做的智能化运维产品D-SMART,实际上我们在一些MySQL、PG类数据库为主的客户侧的使用情况也有与OtterTune类似的地方,在系统刚刚部署的时候,往往能帮助用户发现很多问题。在建议的调整下,很快这些问题就都解决了。之后这套系统最主要的作用就是监控和巡检了。系统中的一些屠龙绝技往往因为找不到龙来屠而变得没有那么大的价值了。

昨天下午我也就这个问题和我们团队的同学们在讨论,我们如何才不会走上OtterTune的死路。那就是真正从数据库运维的痛点入手,而不要总是看不起那些能够解决技术含量不高,但是实用性很高的功能。

图片图片

最近我们正在V2.7中开发两个日常运维常用的工具,其中一个是杀会话的工具。当某个数据库出现一些性能等方面的问题的时候,杀会话可能是一个常用的运维动作。不过有些时候当你需要杀会话的时候突然发现数据库已经无法登录了,你无法有效地杀掉所需要杀的会话,这时候D-SMART就可以帮助你轻松地帮你分析系统中会话的情况,找到所需要杀的会话,并立即无风险地杀掉。

图片图片

另外一个是批量运维工具,当你需要在上百个类似的数据库中做一个相同的查询或者运维操作的时候,批量运维工具就十分有用了。开发运维工具不能仅有技术含量的屠龙刀,每天离不开的切菜刀才是最重要的工具。

OtterTune的成功崛起当年给了我们带来了相当大的鼓舞,原来在这个领域不仅仅是我们一批人在干,在大洋彼岸也有一批和我们有类似想法的人在干类似的事情。OtterTune的倒下也给了我们警示,仅仅在技术上有一套是不行的,技术与市场必须找到契合点,在市场的推动下,产品和服务才能做好。

责任编辑:武晓燕 来源: 白鳝的洞穴
相关推荐

2022-11-02 08:36:35

ArgoAIOPS

2009-04-28 18:32:54

2010-09-16 10:46:47

2012-03-19 21:06:52

Android

2018-02-27 12:41:21

Serverless边缘计算存储

2011-12-15 22:13:30

手机平板电脑移动互联

2010-05-05 09:52:06

Unix BSD

2010-05-24 17:23:41

Linux SNMP

2021-03-17 09:51:31

网络编程TCP网络协议

2018-11-30 11:19:02

DNS根服务器网络

2010-11-24 11:15:40

Qualcomm实施云计算

2009-02-12 16:31:39

Windows7贝塔版本号

2022-09-28 08:23:56

AI人工智能工具

2012-06-26 12:14:05

容错服务器stratus

2009-07-27 14:28:46

2015-12-15 15:27:37

NginxHTTP网络协议

2018-10-07 23:20:17

物联网LPWANIOT

2010-08-17 17:01:14

华为认证

2009-08-28 11:03:21

C#快速排序

2017-11-20 11:53:38

CDN406错误故障
点赞
收藏

51CTO技术栈公众号