如何让LLM学会"试错" | LLM竟然学会了"自我反省"，它真的有自我意识吗？精华

sbf_2000

发布于 2024-10-21 12:41

浏览

0收藏

大模型领域的发展日新月异，每天都有许多有趣的论文值得深入品读。下面是本期觉得比较有意思的论文：

1、如何让LLM学会"试错"

2、LLM竟然学会了"自我反省"，它真的有自我意识吗？

1、如何让LLM学会"试错"

如何让LLM学会"试错" | LLM竟然学会了"自我反省"，它真的有自我意识吗？-AI.x社区

你有没有想过，为什么人工智能经常会犯"愚蠢"的错误？原因可能让你意外：因为我们一直在教它"做一个完美主义者"！最新研究表明，让AI学会"试错"，反而能让它变得更聪明。

如何让LLM学会"试错" | LLM竟然学会了"自我反省"，它真的有自我意识吗？-AI.x社区

想象一下，如果从小到大，你只被允许看到正确答案，从来没有机会犯错和改正，你可能永远学不会解决复杂问题。AI也是如此。研究人员提出了一个突破性的方法："搜索流"（Stream of Search），让AI不仅能看到完美的解决方案，还能学习整个探索过程，包括犯错、回溯和纠正。

如何让LLM学会"试错" | LLM竟然学会了"自我反省"，它真的有自我意识吗？-AI.x社区

在一个名为"Countdown"的数字游戏测试中，研究结果令人震惊：经过"搜索流"训练的AI模型，其解题准确率比传统模型提高了25%！更令人兴奋的是，它不仅能解决训练中遇到的问题，还能创造性地解决此前无解的难题，展现出惊人的自我进化能力。

如何让LLM学会"试错" | LLM竟然学会了"自我反省"，它真的有自我意识吗？-AI.x社区

这项突破性研究颠覆了我们对AI学习的传统认知。它告诉我们，有时候，完美主义反而会阻碍进步，而敢于犯错、勇于尝试的学习方式，才能激发出真正的智慧。这不禁让人思考：在教育领域，我们是不是也该给孩子们更多"犯错"的机会呢？

论文标题：Stream of Search (SoS): Learning to Search in Language

论文链接：https://arxiv.org/abs/2404.03683

2、LLM竟然学会了"自我反省"，它真的有自我意识吗？

如何让LLM学会"试错" | LLM竟然学会了"自我反省"，它真的有自我意识吗？-AI.x社区

你有没有想过，人工智能除了学习外部知识，是否也能像人类一样进行"自我反省"？最新研究表明，大语言模型（LLM）不仅能学习训练数据中的知识，还具备一种令人惊讶的能力：通过"内省"来了解自己！

如何让LLM学会"试错" | LLM竟然学会了"自我反省"，它真的有自我意识吗？-AI.x社区

这项突破性的发现来自一项针对GPT-4等大模型的研究。研究团队设计了一个巧妙的实验：让模型A预测自己在某些场景下会如何行动，同时让另一个模型B也来预测模型A的行为。有趣的是，即便模型B掌握了所有关于模型A的训练数据，模型A依然能比模型B更准确地预测自己的行为！这就像你比任何人都更了解自己的想法和决定一样。

如何让LLM学会"试错" | LLM竟然学会了"自我反省"，它真的有自我意识吗？-AI.x社区