ChatGPT 自推出以来就被寄予厚望,一些人认为它会取代搜索引擎,成为「改变游戏规则的人」。
真的会有这一天吗?至少,一部分业内人士已经启动了颇具挑战性的落地试验。
今天,搜索引擎 You.com 公司 CEO Richard Socher 在推特宣布,「youChat」已经正式上线。
新的试用功能已经发布在 You.com 搜索引擎的首页:
「我们非常高兴今天推出 youChat v1。这仅仅是个开始。我们将很快发布具有更多独特功能的改进版本。」目前,youChat 以测试版的形式发布。
youChat 具有与 ChatGPT 类似的功能,用户可以在搜索引擎的「Chat」选项栏进行对话:
如果你问 youChat:谁是这个世界上最美丽的女人?答案可不是白雪公主。它会告诉你是 Yael Shelbia,而且还会解释为什么是她:
面对「谁赢得了这届世界杯」的提问,数据库比较滞后的 ChatGPT 答不上来。但 youChat 答对了,还解释了一番:
关于「梅开二度」,youChat 还能进行一次盘点:
在移动设备上,用户也可以通过 [http://you.com/chat] 聊天。当前,这个链接也可在桌面上使用,但仅显示聊天,而没有任何其他应用程序或链接。
youChat 怎么用
与一般搜索引擎不同的是,youChat 了解最近发生的事件,并可以为其答案提供引用。
比如:「谁是推特公司的 CEO?」youChat 给的答案是「马斯克」,同时也会告诉你,近来的推特都发生了什么。
ChatGPT 的数据库似乎还停留在过去的某一天。对于同样的问题,ChatGPT 的答案是:
Richard Socher 表示,通过 youChat,他们希望解决搜索中的两方面的问题:让搜索更直观、更有帮助、更快,以及让大型语言模型更可靠。
youChat 会像 AI 助手一样响应用户的提示,读取、写入和汇总信息。这颠覆了用户从搜索引擎获取结果的方式:
首先,通过易于理解的句子获得信息,而不是链接列表:
其次,理解复杂的概念:
此外,还可以获取有关圣诞礼物、论文大纲或编程之类问题的 idea:
用户测评:「差点意思」
在发布的同时 Richard Soche 还表示:「我们将在 2023 年彻底改变人们对搜索引擎的看法。」不过,youChat 即使比其他大型语言模型更经常更新和更真实,也仍然会出错。
发布之后,一些用户立刻指出了 youChat 的不足:「这是我的第一个问题。它甚至不知道今年是什么。」
特斯拉今年的最低股价是多少?
Richard Socher 的回复是:「对于此类查询,我会使用搜索引擎的主要应用程序和结果,例如参阅中心底部,这将提供准确的答案。我们很快就会合并这些类型的应用程序。」
看起来,提问的「措辞」很重要:
另一位用户则提问:「曼联下一场比赛是什么时候?」youChat 答:「2022 年 1 月 15 日。」
这位用户真诚地建议:「是时候让它停止产生幻觉了。」
问答模型爆火之后
ChatGPT 能在 2022 年底成为 AI 界顶流,是因为它掌握广泛的基本知识,特别是在编程方面,甚至有人认为 ChatGPT 将取代搜索引擎。
据外媒 VentureBeat 报道,在 Forrester 公司分析师 Rowan Curran 看来,生成式 AI 此刻面临的时机至关重要:「我唯一能够比较的是 iPhone 的发布。苹果公司的 iPhone 不是第一款智能手机,但它以其触摸屏、易用性和引入的应用程序埋葬了竞争对手,将完整的计算体验放进了人们的口袋。」
短短几天就涌入了百万数量级的用户,的确验证了 ChatGPT 的受欢迎程度。另一方面,ChatGPT 也在改变公众对可能性的认知。
作为一个问答语言模型,ChatGPT 首先以出色的回答给人以深刻的印象。比如,它可以和人们就「现代物理学的发展史」高谈阔论 20 分钟:
询问计算机相关的知识,更是对答如流,例如解释正则表达式的含义:
在编程方面,ChatGPT 还能自动写程序,找 bug:
关于 ChatGPT 是否会取代现有的搜索引擎,我们需要分析一下 ChatGPT 的能力和短板。尽管作为一个语言模型,它能够给出逻辑清晰,又不乏知识性的回答,但不是所有的回答都是完全正确的。
上线几天之后,Stack Overflow 就宣布封禁了 ChatGPT,原因是 ChatGPT 生成的答案错误率很高,并且错误不容易发现。这会给使用 Stack Overflow 查询编程问题的用户带来非常大的困扰。
我们知道,搜索引擎能被广泛接受和使用,除了它方便快速,更重要的是搜索到的信息正确率是很高的,并且一些百科网站也在不断完善知识的覆盖面和准确性,这需要大量的人工校对和专业知识。而 ChatGPT 等 AI 语言模型的现状是生成功能强大,但知识的准确性很难有保证。
知识型模型是近期学术界和业内努力探索的一个方向。人们希望未来的 AI 是掌握大量科学知识的,进而实现通用人工智能(AGI)。但从目前的工作看,构建知识型模型还差得很远。例如,前段时间 Meta 的模型 Galactica 上线仅两天就火速下架,因为该模型生成的知识性内容存在严重错误。
现在,无论是 OpenAI 强势推出的 ChatGPT,还是最新出炉的 youChat,都不满足知识准确无误这一基本要求。从这个意义上讲,大规模语言模型和搜索引擎还相距甚远。
或许 youChat 和 ChatGPT 有几分相似,但它们在回答正确性方面还有很大的提升空间。