大模型应用开发过程中主流架构模式——大模型+多个小模型原创

AI探索时代

发布于 2024-10-14 15:04

浏览

0收藏

“ 架构是灵活多变的，切勿钻牛角尖 ”

在上一篇文章中讲到大模型的能力问题，虽然说经过这一两年时间的发展，大模型的能力已经得到巨大的提升，甚至有些模型已经超出了意料。

但大模型在工程化落地中依然面临着很多问题，比如说成本问题，技术问题，以及能力问题，毕竟大模型并不是万能的，某些模型虽然在某些方面表现较强，但并不是无所不能的。

因此，该怎么解决这个问题呢？

这时通用大模型+多个垂直小模型的解决方案就出现了。

大模型+多个小模型

大家看到大模型+多个小模型，会不会就认为大模型就是参数量庞大的模型，多个小模型就是参数量较小的模型？

其实这里说的大模型+多个小模型并不是从我们传统意义从技术角度理解的模型，而是从业务角度上的模型。

这里的大模型指的是你们公司主要业务依赖的模型，比如一家做AIGC业务的企业，它的大模型肯定是以生成业务为主；但生成式范围那么大，不可能有一家公司能维护如此多的模型，肯定是以一两个业务方向为主，其它的为辅。

大模型应用开发过程中主流架构模式——大模型+多个小模型-AI.x社区

比如说一家公司做AI音乐生成业务，但如果它还想做视频处理和文字处理的业务，这时它可能就没有那么多资金，技术和时间来维护如此多的模型。

而多个垂直小模型也并不是说一定是体量小的模型，而是那种非主要业务的模型；可能是自己维护的小模型，也可能是调用第三方的大模型服务。

大模型+小模型的配置方式细分来说还有很多适用场景，比如上面说的主业务模型+边缘业务模型；再比如，一个功能强大的视频生成模型+多个不同风格的垂下小模型，通过大+小的方式来解决不同场景的问题，以及节约企业成本。

不论是学习还是实际的企业应用，千万要明白没有人能做解决所有的问题，也没有人能完成所有的任务，因此合作才是最好的选择，而大模型+垂直小模型的方式就是最好的合作体现——合作共赢。

大模型应用开发过程中主流架构模式——大模型+多个小模型-AI.x社区

个人或企业只需要关注于自身的核心业务，而不用把时间和精力浪费在一些自己根本无力完成的任务上，这就是要做回报率最高，最有性价比的事情。

很多人都喜欢做一条龙，集研发，生产，销售为一体，但对大部分中小企业来说成为产业链条上的一环或许是更好的选择。

而在今年上半年，360CEO周鸿祎也不止一次的提过，不要过分追求大模型的能力和性能，使用多个功能强大的垂直小模型可能会比一个大模型做的更好，更强。

前面可以说是使用大模型+多个小模型的好处，那么使用这种方案有没有什么坏处呢？

凡事都有两面性，使用大模型+小模型虽然能带来很多好处但同样也面临着很多问题。

虽然很多时候由于业务的多元性导致我们不得不使用多个模型，但使用多个模型最大的问题就是要适配不同的模型，每个模型都有其不同的输入和输出，而且不同模型的能力不一而足。

我们要在兼容不同模型的基础之上，还要同时兼顾多种模型的复杂性和稳定性。

大模型应用开发过程中主流架构模式——大模型+多个小模型-AI.x社区

就类似于传统业务系统架构中，由于业务需要或其它原因导致我们不得不引入一些中间件，但有过项目经验的人应该都知道，每引入一个中间件都会给项目带来一些不确定的潜在风险。

万一中间件不稳定怎么办，万一中间件宕机了怎么办等等，怎么做容错处理等。

总之，没有一成不变的架构，也没有完美无缺的系统，我们需要根据实际情况根本不同的业务场景，选择合适的解决方案，而不是想着靠一个架构解决所有问题。

最后，最最最重要的事就是，面对问题一定要灵活多变，切记不可钻牛角尖。

本文转载自公众号AI探索时代作者：DFires

原文链接：https://mp.weixin.qq.com/s/GnsvlvYYzJH3tVTDPMuBhQ

标签

大模型

大模型架构

51CTO

51CTO博客

51CTO学堂

大模型应用开发过程中主流架构模式——大模型+多个小模型原创

大模型+多个小模型

目录

51CTO

51CTO博客

51CTO学堂

大模型应用开发过程中主流架构模式——大模型+多个小模型 原创

大模型+多个小模型

目录

大模型应用开发过程中主流架构模式——大模型+多个小模型原创