什么是好的GenAI 产品?哪些以LLM技术为支持的产品值得开发? 原创
最近几天,我参加了公司组织的几次产品讨论会,主要议题是是否值得开发以大型语言模型(LLM)技术为核心的产品。目前市场上一些基于LLM的产品未能达到预期的盈利水平,这让大家对LLM的商业潜力产生了疑虑,并在多次讨论会上探讨未来的发展方向。
不可否认的是,人工智能初创企业的竞争非常激烈,尤其是在大型语言模型的推动下,许多初创公司如雨后春笋般涌现。然而,尽管这一领域有着明显的发展趋势,只有少数生成型人工智能初创公司已经进入了发展的中期阶段,许多公司仍处于早期阶段,甚至还未获得风险投资的支持。
那么,什么样的生成型人工智能产品值得开发呢?这个问题非常广泛。虽然我不是一名创业者,也无法提供具体的市场案例作答,但基于我在行业中的经验,可以就这个话题随便聊一聊。同时,也欢迎大家在评论区或者群里分享各自公司的实践经验和观点,以丰富我们对于这一问题的理解。
具有高质量标准或昂贵的质量监测的LLM应用可能会失败
LLM 的推理结果不可预测且难以评估,即使用户最初对产品评分很高,不同的用户群(或在不同情境下的相同用户)可能会对产品评价大不相同。此外,随着知识库的扩展,结果可能会在先前足够好的情况下恶化。即使切换到所谓的“更高质量”的LLM,这种恶化也可能发生。
如果一个产品的表现需要人来监控,但我们又无法通过现有的方法来有效预防错误,那么这个产品可能会失败。尤其是大语言模型(LLM),很难找到可以被信任来监控自己输出质量的情况。
其实,这个问题归根结底是看用户能不能接受错误:
- 如果用户对错误的容忍度很高,或者说结果的质量远远超过用户能接受的最低标准,那么可以用模型自带的评估方法,甚至可以不需要监控。在这种情况下,用大语言模型来做应用是没问题的。但在一些对错误非常敏感的领域,比如1%的错误率都无法接受的地方,用大语言模型就不合适了。
- 即使在一些情况下,产品的盈利能力足够高,能覆盖修复错误所需的人力成本,那么用大语言模型也是合理的。
- 还有一种中间情况:用户对错误的容忍度和当前应用程序的性能差不多。这种情况下,还是需要人来干预,但这部分工作应该由用户来完成,而不是开发公司的员工。
总的来说,是否使用大语言模型,主要看用户对错误的容忍度以及修复错误的成本是否划算。
一个“完整”的LLM驱动产品应该是什么样子的?
想象一下,你在使用一款你特别喜欢的应用,比如你用来记录生活点滴的日记软件,或者那个帮你管理日程的工具。现在,有一种新技术,叫做大型语言模型(LLM),它的聪明之处能够让这些应用变得更加智能,但关键是要巧妙地融合它们,让你几乎感觉不到新技术的加入。
杰弗里·摩尔在他的书《跨越鸿沟》中提到,真正能够赢得大众喜爱的产品,是那些能完全满足用户需求的“整体产品”。这意味着,而不是只提供一个基础的工具或平台,成功的应用会结合LLM等技术,提供一个无需用户自己去拼凑的完整解决方案。
以个人知识管理(PKM)工具为例,它们通常是给那些喜欢自定义和整合各种插件的技术爱好者用的。但如果这些工具能够通过整合人工智能,比如自动为你的文章或视频生成创意建议,它们就可以吸引更广泛的用户群体,比如内容创作者和博主。
目前,一些用户可能尝试通过整合如TextCortex或NotebookLM这样的通用人工智能工具到他们的PKM系统中来实现这一点,但这种方法通常比较繁琐,并不能提供一个无缝的使用体验。
真正的挑战在于,如何让这些智能功能自然融入到应用中,让用户不需要学习新的操作就能从中受益。比如,在教育应用中,学生可能只需点击一个“下一步”按钮就能接收到人工智能生成的个性化内容,而无需意识到背后的技术复杂性。
简单来说,让LLM技术无缝整合到用户熟悉的工具中,提高易用性和产品完整性,是将产品从早期采用者推向大众市场的关键。而那些看起来很有技术含量但用户体验不佳的AI集成,比如一个与应用几乎无关的独立聊天助手,很难成为产品选择的决定性因素。
新一代GenAI 产品更适合 B2B2C 而非B2C
在我看来,以LLM作为其核心功能推出新的B2C产品面临着重重障碍。以下是其中的两个关键原因:
- 数据和隐私:LLM需要高质量的数据才能提供有意义的结果。在B2C背景下,这带来了重大挑战。使用客户数据引发了许多B2C客户的隐私担忧。另一选项是使用开发者提供的数据,这需要一个庞大、多样的数据集来满足各种用户需求。这大大增加了产品开发成本和复杂性。
- 巨头科技公司的无法逾越的优势:像Meta、Google和Apple等科技巨头在B2C市场拥有几乎无法逾越的优势。即使它们比创业公司晚些时候以LLM为动力的产品进入某个利基市场,它们数亿的现有用户群体都提供了巨大的优势,它们的平台是用户已经花费他们数字生活的地方。即使进行了大量的营销投资,创业公司也无法与这种规模匹敌。
在B2B2C模型中,一个设计良好的应用可以大幅缓解许多挑战,尤其是为其他公司,特别是中小企业,提供快速开发端到端B2C市场产品的能力。这种模型的优势包括:
- 数据和隐私:在B2B2C模型中,高质量的数据可以来源于B2B客户,而不是直接来自个别的B2C客户。这意味着,与直接收集B2C用户数据相比,企业(B2B客户)有更强的动力和能力来解决数据隐私问题。
- 利用现有客户群:每个B2B客户通常已经拥有自己的客户群体。通过LLM驱动的产品,这些B2B企业可以提高其从现有客户群体中获利的能力,或者降低提供服务的成本。
如何克服用户对调整其习惯以适应新技术的自然抵触情绪
LLM 听起来很高大上,但我们需要面对现实:并不是每个人都能立刻从自己的舒适区迈出步伐,投入到全新的科技潮流中。
首先,谈到这些新兴的人工智能应用,它们承诺为我们带来全新的用户体验,仿佛赋予我们一把开启新世界大门的钥匙。然而,问题在于,大多数人对于改变自己的习惯,即使是微小的改变,都会感到不适,无论他们是否意识到这一点。
许多这些应用都基于所谓的“对话式用户体验设计”,听起来很高级,但实际上,这意味着用户需要花费更多时间输入文字或进行语音交流,与应用“对话”。对于习惯于简单点击几下屏幕就能完成任务的人来说,这确实是一个挑战。
此外,为了让基于LLM的应用更好地理解我们的需求,我们往往需要与它们进行多次对话,这个过程有时相当费劲。对于那些更喜欢动手操作而不愿意花时间阅读和输入的人来说,会感觉很繁琐。
因此,如果这些新的人工智能应用希望真正吸引用户,它们需要提供的不仅仅是节省一点时间。我们谈论的是一种质的飞跃,类似于让一个普通演讲者变成一个有影响力的领袖。这种级别的改变才具有足够的吸引力。
简单来说,如果一个应用只能让我们节省10%到20%的时间,对于大多数人来说,这可能还不够吸引力。毕竟,人们总是对改变现状有所抵触。我们需要的是一种能够真正让人惊艳、让我们成为更好的自己的技术革新。
总结
使用LLM的产品可能面临输出质量挑战,并不可避免地遇到质量评估方面的困难,解决或绕过这些问题的可行性与用户的错误容忍度密切相关。
对于已经成熟的产品,通过LLM集成增加产品价值,同时保持熟悉的用户体验是有益的。尽管如此,保持传统用户体验并非总是可行的,也不一定对新颖的产品有必要。由LLM驱动的应用程序可能具有“聊天界面”,挑战用户改变他们的习惯。在这种情况下:
- AI必须为用户提供变革性的好处
- 产品应该遵循B2B或B2B2C模式,而不是B2C。在这种情况下,B2B客户成为GenAI功能的主要用户,因为他们激励他们的团队提高盈利能力
本文转载自公众号AI 博物院 作者:longyunfeigu
原文链接:https://mp.weixin.qq.com/s/PL9tsIHmctdjSY1EIVPWCg