最近一段时间关于大模型技术的学习及应用的心得体会原创

AI探索时代

发布于 2024-9-14 12:58

浏览

0收藏

“ 怎么把大模型的各种技术与应用场景相结合是一个值得思考的问题”

今天这篇文章应该算是对这几个月以来学习和应用大模型技术的总结，也可以说是这段时间的心得体会。

今天主要从技术与应用两个方面来讲，当然也会夹杂着一些自己的理解与想法。

关于大模型技术的学习与应用及心得体会

对任何一项技术来说，主要有两个方面，其一是技术面，其二是应用面；技术本质只是一个工具，也就是我们常说的，技术是为业务服务的。

一项新技术的出现，要么在新技术上构建新的应用，要么就用新技术去解决旧问题。

而大模型技术是最近两年爆火的一项技术，因为它使得人工智能技术得到了巨大的进步，使得人工智能不仅仅只是一个理念，而是真正成为一个有可能实现的目标。

技术面

在前面说技术的本质是工具，因此从技术的角度来说，技术的作用就是怎么把这个工具做得更好。

我们经常说大模型技术，其实大模型是人工智能技术的一个分支——机器学习技术深化后产生的深度学习技术所开发的一款产品或者说工具。

因此，关于大模型的“技术”研究的都是怎么把模型这个工具做的更好，比如说不同架构的神经网络，训练方式，微调方式；再具体的比如，Transformer架构，前向传播，反向传播，损失计算等等；再有如迁移学习，强化学习，对抗网络等无外如是。

最近一段时间关于大模型技术的学习及应用的心得体会-AI.x社区

怎么把大模型做得更好，更快，更好用，重不重要？

重要，但受限于大模型的本身的技术复杂度和成本问题，对绝大部分人和企业来说，大模型巨大的资金和技术成本都是不可接受的，也就是说大模型这个技术不是一般人和一般企业能够玩得转的。

从我的个人的角度来说，大模型技术要不要学？

要学，因为它是未来发展的方向，但学到什么程度就是一个值得思考的问题了。

如果说你就痴迷于技术无法自拔，或者说你对技术有着强烈的好奇心和驱动力，那么你可以选择深入研究大模型的技术，比如深度学习网络，反向传播算法等等。

而对大部分人来说，只需要了解大模型的基本原理，以及了解大模型的训练与微调，能够根据具体的业务场景微调出一个能够解决实际问题的模型就可以了。

工具是一个不断发展和进化的过程，因此必须要有人去研究把一个大模型做的更好的技术，只有这样才不会让大模型技术停滞不前。

从这段时间的学习来看，在之前发表的文章中基本上已经涵盖了大模型绝大部分技术理念。

总之一句话，关于大模型的技术目的只有一个，那就是把模型做得更好。

应用面

从应用的层面来说，目前大模型的主要应用有以下几个方向：

AIGC
Agent
知识库

AIGC可以说是大模型技术的主要应用方向之一，也是出现比较早的应用场景，因为现在的大模型就叫做生成式人工智能，而AIGC就是内容生成的领域。

从技术的角度来说，AIGC就是利用大模型的生成能力，来生成各种文字，图片，视频，音频，PPT等各种内容形式，而技术需要解决的问题就是让大模型在不同的领域表现更好。

最近一段时间关于大模型技术的学习及应用的心得体会-AI.x社区

而Agent的应用范围就更加宽泛，比如一些工作流，也包括自动驾驶技术，工业生成等方向。

Agent就是利用各种环境感知能力，然后利用大模型做出合理和准确的判断，然后做出正确的决策并执行，执行的过程是通过调用外部工具的方式来实现。

而Agent的核心技术就是大模型的推理和规划能力，具体来说就是利用提示词和思维链，以及外部工具，让大模型能够做到独立思考和判断，学会拆解问题和目标，并使用工具解决问题的过程。

而知识库技术是对大模型技术缺陷的补充，有了知识库就可以解决大模型知识不足的问题，并且可以大大降低大模型的缺陷——幻觉问题。

而知识库主要涉及的技术是知识库的搭建，检索，存储；也就是让大模型更好的理解外部知识，主要技术载体就是RAG——检索生成增强。

从技术的角度来说，大模型主要涉及的技术就以上几个方面；而从应用角度来说，大模型的应用更多的是靠想象力，而不是技术。

大模型的技术就那么多，而怎么利用这些技术构建更加好用与合理化的应用是一个值得思考的问题。

本文转载自公众号AI探索时代作者：DFires

原文链接：https://mp.weixin.qq.com/s/8QyPNaTLWbQ2W8zup4VJ-w

标签

人工智能

大模型

相关推荐

【创新一夏学习季】热浪升温，创新一夏，释放开发潜能

AI.x社区官方账号 • 52.8w浏览 • 39回复
学习大模型技术的方法论——从应用中学习大模型

AI探索时代 • 2445浏览 • 0回复
大模型学习方法之——大模型技术学习路线

AI探索时代 • 3596浏览 • 0回复
一文总结扩散模型（Diffusion Model）在时间序列中的应用

海因斯DK • 8876浏览 • 0回复
记一次关于人工智能应用方向的面试以及带来的思考

AI探索时代 • 1971浏览 • 0回复
不要沉迷大模型的技术与理论，学习大模型的方法——从做一个小应用开始

AI探索时代 • 2267浏览 • 0回复
一个关于学习大模型技术的方法论

AI探索时代 • 1671浏览 • 0回复
个人关于人工智能技术学习的心得与方法，还有一些常用的网站

AI探索时代 • 1997浏览 • 0回复
关于大模型在企业级应用中的选择问题疑问回复

AI探索时代 • 1576浏览 • 0回复
最近爆火的GraphRAG是什么，真的能用于商业应用吗？

AI博物院 • 1935浏览 • 0回复
PHP程序员学习AI的学习心得

庞然大悟 • 1533浏览 • 0回复
大模型技术全面解析，从大模型的概念，技术，应用和挑战多个方面介绍大模型

AI探索时代 • 1.3w浏览 • 0回复
大模型三阶段训练方法(LLaMa Factory)

一起AI技术 • 1.0w浏览 • 0回复
关于学习大模型技术的方法论——个人经验漫谈

AI探索时代 • 1512浏览 • 0回复
最近一段时间关于人工智能技术学习与应用心得

AI探索时代 • 888浏览 • 0回复
RAG只能应用于文本检索吗？关于大模型应用之RAG——检索增强的思考

AI探索时代 • 825浏览 • 0回复
大模型除了聊天还能做什么？关于大模型的分类和应用

AI探索时代 • 1238浏览 • 0回复
你了解大模型的生态体系吗？大模型从技术到应用的内容梳理

AI探索时代 • 754浏览 • 0回复
扒一扒最近较火的MCP

鲁班模锤1 • 899浏览 • 0回复

AI探索时代

这个用户很懒，还没有个人简介

帖子

声望

粉丝

关注

51CTO

51CTO博客

51CTO学堂

最近一段时间关于大模型技术的学习及应用的心得体会原创

关于大模型技术的学习与应用及心得体会

技术面

应用面

目录

51CTO

51CTO博客

51CTO学堂

最近一段时间关于大模型技术的学习及应用的心得体会 原创

关于大模型技术的学习与应用及心得体会

技术面

应用面

目录

最近一段时间关于大模型技术的学习及应用的心得体会原创