Uber、Airbnb等公司的快速崛起,彰显了大数据的商业潜力,然而,大数据项目的技术挑战,导致许多企业积累多年的数据未能发力。为了帮助企业克服大数据应用的难题,网易大数据推出了平台化的解决方案,着眼于大数据开发与管理、大数据可视化分析等层面,帮助企业一站式解决大数据落地的难题。
大数据应用的技术挑战
互联网的蓬勃发展,互联网+的快速推进,以及人工智能的创业热潮,无不得益于大数据及相关技术的运用。当前,大数据已经上升成为中国的国家战略,互联网和传统行业决策者都迫切希望通过发挥大数据价值创新其商业体系。企业对大数据的渴望,并非出于赶时髦心理,亦非其他企业跨界经营的倒逼,而是要实现科学化决策和智能化、精细化运营,这是构建更健康、更高效、更具潜力的商业模式的必然需求。
知易行难,大数据落地的挑战很大,传统企业大数据应用尤其如此。按照两点论的思想,将价值密度高的内部业务数据作为主要分析是自然的,但外部数据也是分析工作的重要补充——通过数据关联可以产生更大的价值。根据中国信息通信研究院 2015 年对国内 800 多家企业的调研,50%以上的企业把内部业务平台数据、客户数据和管理平台数据作为大数据应用最主要的数据来源,32%的企业通过外部购买所获得的数据,18%的企业使用政府开放数据。
然而,这些数据的整合、分析并指导生产、营销,并不是所有企业都擅长的。首先,企业需要一个数据开发平台,能够融合不同来源、不同格式的海量数据,并进行快速的计算,现实情况却是企业内部也存在很多数据孤岛,现有的集中式系统在性能、容量以及支持的数据类型等方面都存在短板,这与中国企业信息化进程有关。其次,从业务变化速度来说,企业需要能够快速根据分析结果不断优化业务。再次,大数据平台还要能够帮助企业快速找到并更好地服务于用户,实现企业价值与社会价值。
总而言之,企业需要一整套的大数据解决方案,能力全面,能做统一的大数据开发与管理,承载力强,处理效率高,便于业务人员理解和改进业务,并且不会影响现有的业务系统。但对于企业而言,这是一个巨大的技术挑战。
网易大数据平台助力企业一站式“挖矿”
企业信息系统的完善,社交媒体、物联网的应用,都让数据金矿更加触手可及。入宝山而空归,无疑是商业组织的一大憾事。网易公司推出的大数据平台,包括网易猛犸(大数据开发和管理平台)、网易有数(敏捷数据分析平台)和网易数据资产三大独立而关联的产品,从根本上帮助企业杜绝了这种遗憾的发生。
即将迎来20岁诞辰的网易,从互联网的繁荣与泡沫中脱颖而出成为巨头,大数据对业务的支撑发挥了重要的作用。网易杭州研究院成立以来,网易就集中大量人力进行分布式架构及数据存储、处理、传输及任务调度等技术的研发,解决性能、容量、数据类型、成本等技术挑战。当前,网易内部的大数据平台每天处理的数据量已达PB级,日运行作业数超过7万,稳定支撑金融、教育、电商、游戏、安全等各个业务。
网易大数据产品基于网易技术积累和实践经验研发,但并非技术模块堆砌,而是充满了场景化设计的印记。与传统笨重的IT架构不同,网易猛犸立足互联网逻辑,流程设计快捷灵活,包含快速传输技术,同时支持实时计算和离线计算(类似Apache Beam统一批处理和流处理的理念),让企业可以集中化管理、处理数据。网易猛犸提供大量便捷操作,如质量校验、模型反推开发任务等,并支持拖拽式可视化操作,让用户可以快速上手。
作为敏捷BI产品,网易有数提供可视化的操作方式,让用户可以灵活地构建数据模型,敏捷地进行多维分析,随时随地阅览实时报表。网易有数支持EXCEl文件、传统数据库和大数据存储系统的数据源,支持数据行列级别权限控制、亿级数据秒级响应,这让不同业务人员可以灵活地进行多维分析,快速地发现数据中的规律。
网易数据资产则全面整理网易和第三方大量分散的用户数据,汇聚、清洗、深度建模,以标签形式全方位量化用户,形成精准用户画像,可以为企业进行个性化服务、精准营销、征信/风控、客户群洞察等打下坚实的基础。