七牛许式伟:数据重构未来

原创
云计算
大家都认识到了数据的价值,但是如何利用好数据、什么是数据利用的有效手段?8月29日,七牛在上海举办D·Future数据时代峰会,在会上对这些问题从产业和技术的角度展开了分析。

大家都认识到了数据的价值,但是如何利用好数据、什么是数据利用的有效手段?8月29日,七牛在上海举办D·Future数据时代峰会,在会上对这些问题从产业和技术的角度展开了分析。

七牛CEO许式伟表示,互联网的前面十几年很精彩,而如今互联网不仅仅是一个产业,已经变成了新兴的生产力,和所有的实体经济和各行各业都息息相关。互联网被认为是一个行业时,他只影响了一小部分人;而如今,几乎每一个人都已经联网,它对我们影响是巨大的。所以我们要抓住机会,不要被浪潮拍死在岸上。互联网的世界,我们正在用一个词来涵盖它,那就是数据。那么,数据如何重构未来?

许式伟在他的主题演讲“数据重构未来”中做了如下分享:

基于互联网的业务的不同层次

首先我们来看一看业务本身:互联网化最基础的一个层面的诉求,就是业务要上网。如果我们想象一下,或者我们对比一下传统的商业和新兴的商业形态,它***的一个不同是什么?或者我们用一个词去概括旧的商业形态是什么东西。我想到的一个词就是一手交钱一手交货,这就是旧的商业形态最基本的商业特色。但是互联网改变了这一切,互联网让远程交易成为了可能。但是远程产生一个服务,这个影响是非常巨大的。因为我们的业务的场景比以前开阔很多,我们以前也许只能影响我们周围非常一小群人,或者最多我的公司做大了之后,我在不同的地方开不同的分部,但是你影响的人群仍然只是你公司能到达的范畴。但是互联网改变了这一切,它让商业可以让你人不用过去,和世界某一角落的人就可以做生意,这个影响非常巨大。我们来看如何达到的,其实我们分析一下商业在互联网上之后,业务有什么样的特征,我概括了一个词,非结构化数据是人的自然沟通的方式。所以在上网之后,我们发现大量的数据被映射,或者被影像到现实生活当中,这也是数据化生活洪流的根本化的原因。我们要表达我们的意愿,就是非结构化数据,什么叫非结构化数据呢?就是自然表达的语言的文本,以及图片、音频、视频等等这些媒介,都是非结构化数据。那么这些数据天然是人非常容易理解的。但是其实计算机很难理解。刚刚我讲了,计算机有非常强大的逻辑能力,但是计算机在语意的理解上是非常原始的,可能连三岁婴儿的水平都达不到。在这样的情况下人怎么样沟通呢?就是非结构化数据。非结构化数据就是传递人的意愿。比如我拿起电话说几段语音,告诉我的客户或者是告诉我想要交易的人,告诉他我想要表达的东西。或者是通过图片,表达你的商品,你的商品长什么样,你的商品怎么使用的。所以我们可以看到非结构化数据自然而然会成为交互的一个中介。而这个也是原子世界映射到比特世界一个根本原因,因为业务要上网。

第二个层次,当业务上网之后,我们会发现,旧的商业过程当中我们也会谈运营。但是旧的商业过程当中,我们如何运营,大部分的企业就是做调查问卷,我们会找一些样本的客户去问他们,你对我们的服务有什么样的看法,你希望我们做什么样的一个新的服务来去为你提供,但是今天我们会发现,其实有了互联网,有了计算机之后,这一切也发生了变化,首先业务上网之后,天然你可以记录每一次的交易过程,可以把所有用户的行为都能够记录下来,所以今天我们会发现,运营的基因的分析的背景,不是取样数据,而是全量的用户的行为记录。所以我们每天都在产生,对于任何一个互联网公司来说,每天都在产生上千万上亿的调查问卷。而这些调查问卷,如何去对你的商业去进行改进,这个是一个非常重要的课题。也是我们今天为什么会谈大数据,会谈精益的运营的原因。#p#

数据爆炸  如何挖掘信息是重要课题

现在世界上正以每三年翻一番的数据的增长速度,而这其中95%以上,都是非结构化数据,而且这个95%的比例还在不断的提升,而不是下降。也就是说我们会有越来越多的非结构化数据在其中。所以这个数据的存储量是非常非常惊人的,如此惊人的数据,应该如何存储,如何让它不丢失,如何进行分析和挖掘,这其实是个很重要的课题。刚才我也讲了,非结构化数据,其实今天主要的用途是用来做交互,但是我们刚才也讲了,今天计算机对于语意的理解是非常原始的,可能连三岁小孩都不如。所以在交互上,我们发现它仍然有非常巨大的提升空间。我们有自然语言,NLP什么的,技术数据来讲,这样的一些技术,但是它今天仍然很原始。我们也会知道有语音的识别,有视频或者图片里面对于场景对于动作的识别等等,但是这些新的分析方法都还非常的早期,我们把这些新的分析方法,如果能够往前走的话,那么我们可以想象,其实这个数据时代会有更大的想象空间在里面。正因为我们的分析能力还很原始,所以今天几乎所有的非结构化数据都没有二次分析。所谓的二次分析,就是我们除了直接的业务交易过程,比如说我想表达我的一个意愿。但是二次分析是可能的。因为用户每一次沟通,每一次交互过程当中,沉淀了大量的信息,这些信息如何挖掘,也是很重要的课题。

用户日志是更高含金量的金矿

接下来谈一谈用户行为的记录,我认为这个是远未充分挖掘的金矿。因为今天很多企业没有用户行为记录。因为他们大部分业务连商网还没有。所以他们今天想得更多的是让我的业务上网。但是其实哪怕是互联网公司,今天日志的处理能力,或者是我今天能处理多少的数据量,以及我的分析方法,能产生对于我经营有效的指导数据,这方面的能力还是很不足。大部分的公司停留在比如说日活跃用户的分析等等基础的过程。第三点是绝大部分企业日志会定期的删除,因为他们不能理解用活分析之后还能干什么。因为日志是计算机生成的,所以它天然可以很容易被计算机所去理解,这个理解是全面的,不会损失什么信息。所以日志本身是一个更高含金量的金矿,但是大部分的企业其实并没有意识到这一点。所以今天日志的使用量,我认为远远处于一个非常原生的一个状态。#p#

七牛营造数据生态

那么今天谈这些对于我们来说有什么样的意义呢?这个就涉及到七牛对于自己的定位。如果用一句话来描述七牛对于自己的定位,我们会这么解释。七牛是最开放最完备的数据服务供应商,最开放的含义是什么呢?我们希望不是七牛把所有的数据服务给提供了,我们希望搭建一个平台,能让所有对于数据,因为我们刚刚分析了非结构化数据,分析了日志相关的一些挑战,这些挑战绝对不是七牛一家公司所能解决的,我们希望有志于去提升这个数据的应用价值的企业,都能够和七牛一起,共同开拓这个世界,而不是七牛单独一家去做这样的事情。

最完备的含义是,我们希望能够分析这一些数据的使用场景,去触及它的方方面面,去构建一个最完整的基础战,七牛完整的构建一个商业。这个是七牛对于一个数据服务商的一个定位。

今天七牛做了一些什么,大家都知道七牛现在叫七牛云存储,所以七牛如何定义云存储,其实七牛之前已经有很多的云存储的供应商,最典型的是亚马逊。但是七牛,我们认为我们重新定义了云存储这样一个概念,为什么呢?因为在AW上的S3,我们认为它是一个零件,什么零件呢?就是云主机的复数品。因为S3主要的能力是一个数据仓库的能力,它可以放东西,可以取东西。但是七牛认为云存储不应该仅仅局限于我是一个数据的存储的空间。首先它是一个数据存储的空间,所以我们有数据存储这样一个基础服务。这个基础服务,它的核心价值很简单,就是可靠,然后便宜。然后高可用,这个是它最基础的几个能力,第二个能力是什么呢?第二个能力是加速。七牛可能是***个提出存储加速和数据处理这样三个词来描述云存储这样一个服务的一个公司。当然后面我们看到业界也逐渐的大家认同了这样一个模式,所以我们看到,几乎所有的云存储都在往这个方向在走。

那么加速是什么呢?七牛的加速,我们是用一个相对比较独特的方式,因为大家听到加速这个词,都会想到CDN,而CDN是存在了十几年的一个服务形态。七牛的加速到底和他们有什么不同呢?这个跟七牛的做事方式很有关系。我们认为不差一个新增的CDN公司。所以七牛从加速角度来讲,我们定位成我们是CDN融合的公司。我们希望协助客户管理CDN,让这些CDN融合在一起,能够提供更高品质的,或者是更高可用性。因为任何一家CDN,很可能会出现区域性的故障,这样的情况下,我们可以协助自动的去解决。然后有一些CDN可能在比如在上海快一点,有的CDN在广州快一点,我们可以融合,可以形成更高速的访问。第三个层次是数据处理,数据处理这个词比较抽象,我们如果去展开来讲,它的就呼应我刚才讲的那个非结构化数据的挑战里面最重要的一点,就是我们对于非结构化数据,计算机对于非结构化数据的理解其实是非常原始的阶段,所以七牛成为一个真正的开放的云存储,最重要的点在于我们的数据处理是开放式的平台,我们知道七牛最近接入了非常多的数据处理的服务,比如说图片的建网,比如我们正在接入的人脸识别等等。数据处理的业务是做不完的。七牛最开始提供的一些基础的数据处理,比如音视频的打码、打水印等等。这个是个开放的平台,待会我们的团队会讲,这个我不讲了。

还有什么呢?还有一点就是直播!因为视频或者是音频,它是一个非常特殊的介质,因为它有一个值,就是在线沟通的需求,这是传统的存储所没有的。当然因为视频和音频它本身有流媒体的属性,所以它天然有点播的需求。七牛的霹雳云可以把直播和点播融合的平台。我们可以在霹雳云上完成用户的沟通,以及事后的点播,以及不同的网络下不同码率的转换。

今天七牛的注册企业有28万,我们直接覆盖网民每月月活有3.7亿,我们的平台上产生了1600万亿的文件,每天我们有750亿的请求。我们数据处理,数据处理本身可以被加速的,也就是同一个文件,哪怕它多次访问,它只会处理一次,所以它的量会相对少一点。今天七牛的平台上每天有12亿的数据的处理量。总结一下七牛干了什么,我们认为我们重新定义了云存储,重新定义如何服务商业。很多人会问七牛未来会做一些什么,七牛到底会往什么方向发展。我们七牛首先,我认为在这个时代,要符合这个时代的主题思想,就是创新和创造,今天和数据相关的几个词有云计算,有大数据。这些词七牛是如何看待的,如何重新定义这些词。我觉得2016年可以期待,这就是我今天的演讲内容,谢谢大家。

责任编辑:老门 来源: 51CTO
相关推荐

2015-09-01 13:50:29

七牛许式伟

2015-11-09 17:51:12

服务器端开发

2016-01-27 15:09:52

七牛许式伟

2015-10-26 13:14:43

七牛许式伟创业

2016-01-13 17:40:24

七牛

2012-10-15 17:15:34

2012年度IT博客大许式伟

2013-10-31 10:49:31

2013年度IT博客大许式伟

2015-10-28 17:37:16

七牛

2015-08-07 14:01:22

CIO时代网

2021-03-10 08:55:42

Go数据语言

2016-01-15 14:30:27

七牛

2014-11-13 12:41:46

环信

2015-09-01 13:52:12

七牛数据处理DORA

2014-10-29 14:52:41

七牛云存储

2015-09-08 10:42:07

七牛大数据

2015-12-10 21:31:19

七牛数据处理架构变迁

2015-01-12 09:35:21

2015-01-22 15:25:20

2018-08-28 07:02:26

网络重构SDNNFV

2015-09-10 13:11:20

七牛
点赞
收藏

51CTO技术栈公众号