什么时候需要训练和微调属于自己的大模型——小微企业必须要明白的问题原创

AI探索时代

发布于 2024-9-18 10:51

浏览

0收藏

“ 从问题出发，先有需求再有解决方案 ”

老板和员工在思维方式上有一个很大的差别就是，作为老板他们喜欢寻找现有的解决方案，如果现有的解决方案无法满足的情况下，才会自己设计一个解决方案。

而作为员工来说特别是技术人员，大都有一种技术至上的心态，比如说很多技术人员找工作会特别在乎公司用的技术是否足够牛逼，足够高大上。

之所以产生这种现象的原因是因为，技术人员的心态是学会牛逼的技术，走到哪里都不怕。

而老板的心态是，能解决问题把业务跑起来最重要，现有的解决方案或许不是最好的，但它却是经过验证的，能够保证业务的稳定性；但如果提出新的解决方案，就要承担新方案潜在的各种风险。等以后业务稳定之后，可以慢慢的优化现有的方案。

什么时候需要训练和微调模型？

在上面的内容中，描述了一下员工与老板思维以及心态上的区别；这两种思维方式没有绝对的对错之分，区别只是两种完全不同的发展方向，一种是打工人的思维方式，一种是创业者的思维方式。

就拿大模型训练与微调来说，很多技术人员都想亲自参与或体验一下一个模型从无到有的诞生过程；但受限于各种原因，有机会参与这样工程的人还是比较少的；因此很多人都退而求其次，想做一下模型的训练与微调。

什么时候需要训练和微调属于自己的大模型——小微企业必须要明白的问题-AI.x社区

举个例子，你是某个小公司的技术人员，老板想引入大模型技术来升级现有的业务系统，然后让你做一下前期调查和简单的解决方案。

不管使用的是大模型的什么技术，比如Agent，知识库，AIGC等；很多技术人员下意识的方式就是先搞一个本地模型，试试能不能训练和微调一下，然后就陷入各种技术细节中无法自拔。

但事实上，市面上已经有很多大模型服务商，他们有专门训练和微调过的模型；根据现有的业务体系，或许随便找一个合适的模型就可以用了。

为什么不建议企业引入大模型技术时，就直接打造属于自己的大模型？

原因就是，你还不知道怎么把大模型技术与自己的业务场景相结合；虽然市面上可能有一些相似的案例，但每个企业都有其独特的运作方式，适合别人的不一定适合你。

简单来说就是，你都不知道现有业务引入大模型能解决哪些问题，以及潜藏着哪些问题；说白了就是，你都不知道要训练和微调出一个需要解决什么问题的模型，这样的模型怎么可能做的好呢？

什么时候需要训练和微调属于自己的大模型——小微企业必须要明白的问题-AI.x社区

就类似于你需求都不清楚，就直接开始开发产品了，这样的产品能有人用吗？

当然，如果说你觉得你是上帝之子，即使需求不明确也能做出符合业务场景的大模型；或者说你不差钱，训练一次不行就重新训练，那也可以。

因此，什么时候开始训练和微调模型？

最好的时机就是，在你的业务成型之后，有一些问题确实需要解决或者说需要节约成本；这时，你再去考虑训练和微调一个模型，甚至是找模型服务商帮你重新设计一个模型都可以。

什么时候需要训练和微调属于自己的大模型——小微企业必须要明白的问题-AI.x社区

一句话就是，在你的需求明确之后，也就是你知道要训练出一个什么样的模型，并且你有足够的技术和资金支持，那么你就可以训练和微调自己的模型了。

说到底还是那句话，技术是为业务服务的，技术的发展是基于业务场景的落地，而不是从技术去推动业务场景的发展，虽然技术的发展也有可能颠覆现有的业务场景，但那是技术与业务场景的深度融合的结果。

总之，不要一开始就想着训练和微调属于自己的模型，要从问题出发，而不是从结果出发。

本文转载自公众号AI探索时代作者：DFires

原文链接：https://mp.weixin.qq.com/s/Ag2thIY2-TCAX15rbugWyA

©著作权归作者所有，如需转载，请注明出处，否则将追究法律责任

标签

大模型

人工智能

已于2024-9-18 10:52:35修改

相关推荐

开源大模型可能不香了！您在微调开源大模型的时候，很可能已经泄露了您宝贵的数据！

AIGC最前线 • 2924浏览 • 0回复
大模型所谓的参数是什么？大模型为什么需要训练？大模型训练到底干了什么？

AI探索时代 • 5424浏览 • 0回复
你知道什么是微调吗？大模型为什么要微调？以及大模型微调的原理是什么？

AI探索时代 • 5381浏览 • 0回复
从做菜的角度来更形象的理解什么是大模型的参数，训练原理与过程，以及为什么要训练？

AI探索时代 • 2237浏览 • 0回复
如果老板让你基于大模型搭建一个系统，怎么选择一个适合自己任务的大模型？选择大模型需要考虑哪些问题？

AI探索时代 • 1860浏览 • 0回复
大模型的训练与调优，SFT(监督微调)和RLHF(基于人类反馈的强化学习)到底是什么？

AI探索时代 • 6136浏览 • 0回复
大模型的泡沫什么时候破灭？

51CTO技术栈 • 1479浏览 • 0回复
什么是多模态大模型？为什么需要多模态大模型？

AI探索时代 • 3778浏览 • 0回复
你真的了解预训练吗？预训练与微调的区别是什么？

AI探索时代 • 5436浏览 • 0回复
大模型的训练与调优，SFT(监督微调)和RLHF(基于人类反馈的强化学习)到底是什么？

AI探索时代 • 6425浏览 • 0回复
关于大模型在企业生产环境中的独立部署问题

AI探索时代 • 2069浏览 • 0回复
关于大模型在企业级应用中的选择问题疑问回复

AI探索时代 • 1346浏览 • 0回复
什么时候Mahalanobis距离比欧式距离更合适？

鱼虫子 • 1599浏览 • 0回复
关于大模型微调与训练的问题，大模型训练的难点在哪里？

AI探索时代 • 1724浏览 • 0回复
怎么设计一个自己的大模型？设计一个大模型需要哪些能力？

AI探索时代 • 2600浏览 • 0回复
深入理解预训练与微调，为什么需要预训练，什么是微调？

AI探索时代 • 3211浏览 • 0回复
大模型训练的本质是什么？以及大模型训练的核心要点

AI探索时代 • 1943浏览 • 0回复
DeepSeek 爆了，普通人如何3小时完全从0训练自己的大模型

玄姐聊AGI • 5126浏览 • 0回复
大模型除了聊天还能做什么？关于大模型的分类和应用

AI探索时代 • 696浏览 • 0回复

angel

LV.8

这个用户很懒，还没有个人简介

317

帖子

2927

声望

粉丝

关注

51CTO

51CTO博客

51CTO学堂

什么时候需要训练和微调属于自己的大模型——小微企业必须要明白的问题原创

什么时候需要训练和微调模型？

目录

51CTO

51CTO博客

51CTO学堂

什么时候需要训练和微调属于自己的大模型——小微企业必须要明白的问题 原创

什么时候需要训练和微调模型？

目录

什么时候需要训练和微调属于自己的大模型——小微企业必须要明白的问题原创