ChatGPT的新功能对我们所有人到底意味着什么?-51CTO.COM

ChatGPT新的更新和添加的功能总是很有趣，其最新的更新尤其发人深省。

我们知道，迈向通用AI——可以做任何事情的AI——是开发者OpenAI计划的一部分。当谈到实现这个雄心勃勃的目标时，视觉以及说和听的能力是相当重要的。因此，在我们即将迎来ChatGPT向所有人开放的一周年之际，它获得了这些功能，这是有道理的。

这将如何影响我们与新的数字朋友的关系呢?它将增加它进入我们生活并帮助我们应对日常挑战的能力，它对围绕ChatGPT(以及通用AI)在社会中的地位的大问题意味着什么?

首先，通过获得从图像中分析和提取语言信息的能力，ChatGPT有效地获得了视觉能力。你可以简单地上传一张图片，让它描述显示的内容，还可以用它来执行复杂得多的任务，比如诊断如何修复自行车或割草机等损坏的机械。

这意味着，理论上，ChatGPT不仅可以分析照片，还可以分析图表和可视化、笔迹以及来自我们周围世界的各种非结构化数据。

显然，它有很多日常用途，从为你想要出售的商品创建Facebook Marketplace列表，到将白板上的涂鸦变成易于阅读的笔记。

OpenAI自己给出了如何使用它的例子，包括在冰箱里抓拍物品，问它晚餐可以做什么，以及就照片进行现场对话。

然而，根据《纽约时报》的报道，ChatGPT中部署的功能有一些局限性，其中一些是设计上的——例如，它在分析人脸方面受到限制。这样做是为了防止它被用来侵犯隐私，也符合OpenAI之前限制其产品的方式。

另一个可能产生深远影响的变化是，ChatGPT现在可以说话和听，至少如果你正在使用这款移动应用程序的话。

因此，语音革命使如今与Siri和Alexa这样的机器交谈变得非常正常。我们都很习惯这样一个事实，他们只能以有限的几种方式回应我们，一般来说，他们能做的最有用的事情就是打开和关闭其他设备。

这就是为什么与ChatGPT交谈是一个如此耐人寻味的想法。ChatGPT可能会进行更自然、更流畅的对话，很容易就会给人一种与真人交谈的错觉。

除了进行来回对话外，它还可以模拟它听到的声音，例如，可以用来为AI头像配音。以及其他一些更险恶的目的。

我之所以说有可能，是因为当我在发布后直接试用它时，不得不说它还没有完全到位。

ChatGPT有几次听不懂我说的话。更奇怪的是，它的训练数据似乎没有更新，让它知道自己会说话。当我向它寻求使用其语音功能的帮助时，它坚定地告诉我，它没有语音功能(用完美合成的人类声音)。我还看到报告说，它可能听不懂各种口音和方言。

进入一个机器不仅可以思考，还可以看、听和说话的时代，显然是一件非常重要的事情。我相信有很多人准备说，它还不能真正做好任何一件事。但很明显，事情才刚刚开始。

视觉和语音功能意味着我们很可能会看到ChatGPT技术出现在越来越多的便携技术中。我们已经有一副眼镜可以在你的眼前叠加ChatGPT，所以你永远不会被问题的解决方案所困扰。这些帮助你进行随意的闲聊。

其中一些人已经可以听和说了——尽管这些人使用第三方扩展来添加功能，而且OpenAI自己的集成技术应该(潜在地)提供更流畅的体验。

但是，无论我们身在何处，拥有实时的、由AI支持的图像分析都可以即时提供给我们，这可能会真正改变许多领域的游戏规则。

不过，这确实引发了一些伦理考量。最紧迫的是，值得记住的是，尽管ChatGPT推出了一系列行为限制，本应防止其被用于不道德目的，但这些限制很快就被绕过了，在某些情况下，甚至完全被删除了。

如果这是利用ChatGPT的视觉能力完成的，潜在的后果可能会更加严重，特别是如果不道德的演员找到了绕过面部识别障碍的方法。

在ChatGPT发布后不久，与其功能相似但没有限制的仿制版本开始出现。有时，它们的创造者专门将它们作为违反法律的工具出售。我们能在视觉或声音模仿能力上看到同样的情况吗?我认为，认为它不会发生的想法将是相当愚蠢的。

然而，有可能有一些事情应该让我们更担心。

随着最新的一系列更新，ChatGPT正变得越来越多模式。这意味着它可以理解各种形式的输入并与之互动，比如图片和声音，而不仅仅是文字。

这一点很重要，因为AI发展的目标不可避免地是通用AI(AGI)。这是一个术语，指的是只要拥有必要的数据，就可以执行任何任务的机器，就像我们人类一样。多式联运可以很容易地被描述为朝着这一目标迈出了一大步。

或许可以肯定地说，AGI还有很长的路要走。谷歌工程总监雷·库兹韦尔预计我们将在2045年左右实现这一目标，DeepMind的CEO戴米斯·哈萨比斯也相信这将在未来几十年内完成。

然而，哲学家尼克·博斯特罗姆认为，“超智能”将在下个世纪初到来。AI先驱斯图尔特·罗素教授表示，距离这一目标还有一段路要走，还有一些重大问题我们还无法解决。

当它真的到来时，AGI可能会产生相当巨大的影响。在机器创造我们所需的一切的同时，它是否会让我们过上奢侈的生活，还是会带来更黑暗的命运，对于这一问题，各方仍存在分歧。

无论是好是坏，政府或那些有能力做出决定的人似乎没有听取那些签署了暂停巨人AI实验请愿书的人的建议。

这意味着我们很可能会看到AI的发展继续并加速。像ChatGPT添加的功能将成为日常生活的一部分。它还将变得更可靠、更强大，并提供不断改进的用户体验。这意味着更多内置了该技术的应用程序和设备，以及越来越多的社交和工业使用案例。

ChatGPT现在可以看和听了，所以我认为用不了多久就会有人想出如何让它触摸、闻和尝的方法。然后，它将配备所有与我们相同的感官功能，从理论上讲，它能够完全理解我们感知环境的方式。

这将使它有可能帮助我们挖掘出大量的洞察力——关于世界的信息以及我们与世界的互动，这些信息超出了我们的有机大脑的范围。它将以它知道的方式向我们提供这些信息，由于它对我们自己的能力的理解，我们可以使用它。

有了AI，我们就踏上了一段目的地远未确定的旅程。