大数据是指基于社会进步、经济快速发展和技术进步,对人们生产生活中产生的大量数据信息进行有效、及时的处理和分析的技术。大数据具有四大特点:数据量大、数据种类繁多、价值密度高、处理速度快。近年来,大数据在经济领域得到广泛应用,目前已成为社会发展的重要标志(Sun Z., Zou H. & Strang K. 2015)。在电子商务服务模式的创新升级中,大数据将利用相关技术创新商业智能,更有利于电子商务的长期稳定发展。
一、大数据时代下的电子商务
在大数据背景下,电子商务的发展依托大数据高效的数据采集、处理和分析能力,将电子商务的价值创造推向了新的高峰。电子商务作为伴随经济发展和企业消费而出现的一系列新的消费形式,无论是在电商平台、移动终端、社交软件,还是其他任何第三方平台,都拥有大量的数据(Choi T.、Chan HK & Yue X. 2017)。传统方法无法处理这些数据,这些数据不仅信息量巨大、种类繁多,而且数据的分析和整理也面临新的困难。在商业智能领域,数据信息不仅包括图片和视频,还包括用户的评价和反馈。有效利用这些信息,可以为商业智能的发展提供正确的方向。电子商务相关领域可以根据数据中的用户信息、评论以及反馈,对消费者的购物趋势进行分析和梳理。根据分析结果及时调整产品的销售模式及方向,或者重新梳理消费需求,改善产品不足、促进消费增长(Larson D. & Chang V. 2016)。在大数据时代,过去被认为无用的数据垃圾往往会通过一定的处理分析并加以利用,给企业带来意想不到的好处。大数据还可为商业智能提供更准确、更实时的消费信息和消费者需求,进而更准确地制定出更适合企业的发展方向(Sun Z., Sun L. & Strang K. 2018)。
如今电子商务的商业模式发生了巨大的变化。从传统的管理运营模式到信息化的数据化运营模式,从基础物资采购到资产运营再到订单完成,电子商务和各个经济环节的管理已经数字化并贯穿整个电商流程。通过大数据专业分析技术的应用,电子商务可以分析和预测消费者的消费习惯和心理,从而为电子商务的市场供需调度提供一系列建议和指导,减少电子商务的商业生产成本(Ram J.、Zhang C. & Koronios A. 2016)。
在电商运营中,大数据时代的到来可以让整个电商行业的信息资源共享变得方便快捷。电子商务的各个环节都有效地利用了大数据的综合处理技术,实现了整个产品生产供应环节中各种数据信息的及时共享。为了更好地吸引消费者,促进产品销售,电商企业最终将实现产业结构的优化提升,过去被认为没有价值的数据资料也将成为热点资源。电商模式下产生的数据资源不仅可以自己使用,还可以在电商企业间创造相应的商业利益。各电商企业可以利用数据信息开展数据分析服务、数据可视化服务、共享数据资源服务等,拓展电商业务渠道,为企业带来效益。
二、为什么eBay需要数据分析
不论哪个行业都有自己的规则,必须熟悉并遵守行业规则。 eBay必须分析产品的选择和营销方式等因素。
首先,eBay的营销活动应该以用户和体验为基础。把用户关注的产品和问题放在首位,告诉用户为什么要买这个产品,解决需要为其解决的问题,打消用户顾虑,促进交易成功。
其次,目标消费群体也需要通过大数据解决方案进行分析。这方面主要是分析用户的年龄、性别、地区、职业、消费习惯及兴趣。 eBay需要比用户更了解产品,明白用户为什么要买这个产品,清晰地知道用户需要买什么,这样才能更好地挖掘用户市场和潜在消费者。通过分析数据,eBay知道什么样的用户购买什么样的产品,根据自己的需求,确定主打产品、产品价格定位,进行一系列产品分析。
最后,从用户喜好、产品创新、价格定位、品牌选择等方面,与同类产品进行比较,分析热销产品的原因和热销时间的长短,以及后期可以更换哪些产品。最重要的是,大数据可以降低电商企业的运营成本,提高运营效率。
传统电商平台是根据市场反馈来推荐产品。这种做法目前来看不够科学,业务变现也比较有限,浪费了大量平台流量,消费者体验也一般。如今,借用云计算下的大数据分析和总结,可以很好的提取产品优势,从而根据用户兴趣进行系统推荐。这种大数据下的定向推荐机制,可以降低电商企业的运营成本,提升消费者体验和运营效率。
三、eBay实现数据分析面临的挑战及解决方案
(一) 面临的挑战
随着信息化阶段的开始,信息服务业已成为21世纪的主导产业,电子商务也实现了爆发式的增长和发展。人类生活进入到了电子商务时代,电子商务行业的发展迎来了一个新的高峰。作为电子商务的代表,eBay也面临许多挑战。
最大的挑战是数据库集群问题。面对大数据处理,数据库集群会出现一定的缺陷。首先是可扩展性不强,系统的硬件基础设施会存在硬件复杂度高、架设安装困难等问题,限制了其可扩展性。其次是提升空间小,这种空间主要是指数据库数据集的可扩展空间。数据库集群模型在兼容性、可靠性、容错性、支持异构条件的能力等方面也存在局限性。
(二) 解决方案
解决数据库集群问题的方案是使用 MapReduce 框架。云计算架构主要是由服务器组成的大规模集群的数据处理技术。在数据存储能力和数据处理能力上具有绝对优势。MapReduce计算过程的分解可以理解为对大数据集的解构。解构的结果是形成了大量的小数据集,这些小数据集由集群节点单独处理。它得到中间结果,并将这些结果通过节点组合起来,从而得到整个大数据集的处理结果。
在经过大数据集解构处理后得到的结果,可以成为大数据分析的情报资料。按流程来看,大数据情报分析需要收集海量情报资料,然后对海量资料进行存储、预处理和分析,其中数据存储包括结构化和非结构化数据的存储。对于来自不同来源的数据进行转换,去除冗余或冲突的数据,并融合来自不同来源的数据。在完成这些流程之后,也就意味着完成了大数据智能分析。
总的来说,大数据智能分析的重点主要体现在大数据智能素材采集、大数据分布式存储、大数据并行计算平台、大数据分析算法和流程自动化等方面。大数据分布式存储、并行计算平台、分析算法、流程自动化的研发为大数据智能分析提供了坚实的技术基础。目前已经有了很多大数据技术服务商、互联网公司、研究机构和开源组织(如Apache Hadoop),他们均致力于大数据处理和分析技术的研发,并提出了大数据的新方法,例如新型存储和分析技术。他们开发了具有相应功能的大数据存储和计算工具以及完整的通用大数据开源云计算平台Hadoop,而且随着开源社区的不断发展壮大,这些开源软件的功能也在不断的完善和增加。从大数据智能分析的角度来看,主要是充分利用了开源社区的成果,针对大数据智能分析的具体需求,开发或定制相应的模块。