阿里巴巴首席架构师谈海量数据分析平台

运维 数据库运维
姜迅详细的介绍了阿里巴巴B2B业务的海量数据的信息抽取,数据挖掘以及通过分布式框架进行的具体实现等。

4月16日,2011数据库技术大会在京召开,来自在2011数据库技术大会的商业智能、数据分析专场上来自阿里巴巴数据仓库部首席架构师 姜迅 就阿里巴巴 海量数据分析平台作为了精彩的主题发言。

姜迅详细的介绍了阿里巴巴B2B业务的海量数据的信息抽取,数据挖掘以及通过分布式框架进行的具体实现等。

[[24623]] 
▲阿里巴巴数据仓库部首席架构师 姜迅

姜迅称,阿里巴巴2007年到现在,数据量翻了150倍。

 
▲数据分析1

WAL

(用户研究与用户信息服务)

基于用户信息与行为的挖掘分析实现对用户偏好及特性。

PKL

(文本挖掘与产品知识库)

基于产品信息、产品交易的挖掘分析实现对产品属性及产品关系的解析与标识

RE

(个性化推荐算法与服务)

基于用户及产品的特征、相关性及BT、内容匹配等推荐算法的个性化推荐系统。

 
▲数据分析1

 
▲数据分析2

  
▲数据分析3

 
▲计算两两频频繁相集

 
▲模型优化

演讲嘉宾:姜迅:阿里巴巴B2B 数据仓库部首席架构师

阿里巴巴B2B 数据仓库部首席架构师,资深专家

阿里巴巴B2B 大数据部技术委员会主席

阿里巴巴数据仓库首席架构师,负责阿里巴巴数据仓库系统架构,解决方案的相关工作;数据库、分布式数据库、分布式计算模式/框架的专家;互联网数据模型专家;多年大型数据仓库架构,模型设计以及系统调优的实践经验;关注于互联网海量数据的信息抽取,数据挖掘以及通过分布式框架进行的具体实现。

【编辑推荐】

  1. 数据库标准化与范式
  2. 数据库设计三大范式应用实例剖析
  3. 一步一步设计你的数据库2
  4. 一步一步设计你的数据库1
责任编辑:艾婧 来源: IT168
相关推荐

2018-01-02 09:23:38

数据分析算法阿里巴巴

2014-05-16 10:13:34

WOT架构师WOT2014朱金清

2012-07-06 16:19:23

华为服务器

2021-08-18 17:16:10

Git分片读写分离

2011-03-11 15:38:08

Java

2014-10-28 09:56:56

Hadoop

2013-08-08 10:34:50

阿里巴巴BAT

2010-06-28 10:43:47

2015-10-15 17:58:29

阿里云大数据云栖大会

2012-04-26 10:22:27

豆瓣网洪强宁Python

2019-04-30 13:41:54

数据分析阿里数据分析师

2013-08-22 09:41:52

阿里巴巴去IOE王坚

2009-07-17 15:18:46

Windows Emb

2022-03-22 08:41:13

阿里巴巴云原生大数据

2009-07-17 15:31:18

Windows Emb

2009-07-17 15:34:13

Windows Emb

2013-03-12 09:56:10

阿里巴巴马云云OS

2013-04-15 10:14:45

阿里巴巴大数据

2024-12-05 09:12:43

2009-12-18 10:22:50

Ray Ozzie架构师
点赞
收藏

51CTO技术栈公众号