从奈飞到沃尔玛:开源Kafka的实战应用

译文 精选
开源
这些案例研究展示了Kafka擅长的四个关键领域:实时数据处理、消息传递、运营指标和日志聚合。

译者 | 布加迪

审校 | 重楼

从电子商务交易物联网传感器数据到安全日志,企业如今面临越来越大的实时数据洪流,这些数据对客户体验、运营和业务效率至关重要。对于许多企业来说,开源事件流平台Apache Kafka就是解决之道

想知道如何最好地使用Kafka吗?

快速入门介绍Kafak的几个特定用例来自一些最大最重要数据企业的实际案例以及运营最佳实践,以帮助尽快获得想要的结果。

Kafka能为做什么?

Kafka在四个关键的企业场景中表现出色:实时数据处理、消息传递、运营指标和日志聚合。

1. 实时数据处理

实时数据处理是Kafka真正的亮点。Kafka如同贵企业的中枢神经系统。这项开源技术可以立即处理来自多个来源的数百万个事件,同时确保没有数据丢失。

比如说,电子商务平台可以使用Kafka同时处理客户点击、库存更新和发货状态变化,实现实时个性化和库存管理。Kafka的架构以最小的延迟和最大的可靠性处理这些海量数据流,而内置的分析功能让团队可以从数据流中提取即时信息

2. 消息传递

Kafka的消息传递功能充当数字电话交换,实现应用程序和系统之间的无缝实时通信。以一家处理信用卡交易的金融服务公司为例:Kafka可以同时将交易数据发送到欺诈检测系统、客户数据库和分析平台,不会错任何信息

随着组织规模扩大消息量增加,Kafka可以一同扩展,在处理负载的同时确保没有关键通信内容丢失。

3. 运营指标

运营指标就像控制塔,Kafka用于收集和提供数据,以监控来自整个技术环境的实时指标。无论是在跟踪应用程序性能、系统健康状况还是业务关键绩效指标(KPI),Kafka都为实时监控和警报提供了单一的真相来源。

全球企业使用Kafka每秒监控数百万个指标,在潜在问题影响客户之前发现并解决它们。Kafka还与最流行的监控工具无缝集成,可以轻松地直观呈现趋势并在需要时采取行动。

4. 日志聚合

最后但并非最不重要的是,Kafka将日志管理从一个令人头疼的问题变成了一个战略性资产。团队不再需要费力地拼凑来自几十上百个系统的日志,而是可以全面实时地了解基础设施中发生的所有事情。

发生安全事件时,分析人员可以立即访问和分析来自任何系统或时间段的相关日志。大企业每天通过Kafka处理数十亿日志,使用这些全面的数据用于从威胁检测到应用程序性能优化的所有操作。不像传统的日志系统面对大负荷会垮掉,Kafka即使在日志量急剧增长的情况下也能保持其性能。

现实世界的企业如何使用Kafka?

不妨看看世界上一些著名的企业如何使用Kafka

1.奈飞(Netflix)玩转实时个性化

奈飞在全球拥有约3亿用户,每秒处理天文数字般的用户数据量。Kafka充当了奈飞的实时个性化引擎的支柱,立即处理观众的行为,即时提供内容推荐。每点击、暂停和回放决定都到奈飞的Kafka系统,使这家公司能够不断完善每位观众的体验。任何拥有数字化业务的企业都可以采用类似的方法将客户数据转化为更个性化的体验。

2.Pinterest驱动瞬间内容发现

Pinterest必须通过即时将用户与他们喜欢的内容联系起来,保持数亿用户的参与度。该公司使用Kafka和状态流处理来实时处理数据流,使其推荐引擎能够根据每个用户最近的活动提供建议。Kafka的Streams API提供了这种功能,支持需要实时处理数据,同时还维护多个数据记录的状态信息(能够利用历史记录)的用例

3.沃尔玛扩展实时商务运营

作为美国最大的零售商,沃尔玛在美国境内的大规模零售运营依赖实时数据处理,每天在其云基础设施上处理数万亿条Kafka消息。由于沃尔玛面临数据流量突然激增的情况,尤其是在假日等大客流量购物期间,沃尔玛的工程团队于是开发了一名为消息传递代理服务”(Messaging Proxy Service)的创新解决方案,从根本上改变了处理消息处理的方式。这种重新构想Kafka基础设施的明智策略使沃尔玛能够在高峰时期保持高性能,同时降低运营成本。

切实使用Kafka

处理实时数据并采取相应行动变得越来越不是优势,而是越来越有必要。在我看来,Kafka已证明了是需要从容地处理庞大数据流的企业的首选平台。

无论是在构建实时分析策略、驱动个性化体验还是更新改造安全运营,Kafka都提供所需的基础而且它的完全开源版本非常强大。

奈飞、Pinterest和沃尔玛这几个例子展示了Kafka的一小部分用处,以及一些大企业在利用该平台做些什么。借助正确的方法和最佳实践,组织也能与这些先行一样充分发掘实时数据的功效

原文标题:From Netflix to Walmart: Open Source Kafka in Action,作者:Varun Ghai

责任编辑:华轩 来源: 51CTO
相关推荐

2015-05-27 09:58:09

2009-01-19 16:44:31

数据挖掘沃尔玛应用

2023-10-23 13:03:04

2024-08-28 08:09:13

contextmetrics类型

2024-10-21 08:24:29

Florence-2视觉语言模型VLM

2021-05-12 10:06:43

开源技术 软件

2018-11-20 11:18:22

数字化零售企业

2025-02-14 00:00:20

C#C/C++语言

2023-06-06 08:18:24

Kafka架构应用场景

2020-04-23 15:59:04

SpringKafka集群

2013-06-07 17:13:58

2016-10-17 15:04:02

开源DistributedApache Kafk

2016-06-30 16:52:23

开源

2015-05-26 11:10:45

沃尔玛OpenStack

2010-06-04 10:40:22

win7水树奈奈

2019-09-09 14:52:23

开源速读应用

2020-01-09 09:43:12

Signal聊天应用开源

2020-06-03 09:37:42

人脸识别人工智能开源

2013-04-23 09:33:49

ZARA亚马逊沃尔玛
点赞
收藏

51CTO技术栈公众号