大模型上层应用本质上是一个能力整合的过程原创

AI探索时代

发布于 2024-11-22 15:56

浏览

0收藏

“ 技术的应用并不是一个孤岛，而是一个能力整合和串联的过程”

很多人喜欢把大模型当做一个独立的技术和应用，事实上各种应用场景是一个能力整合的过程，而不是独立的技术孤岛。

思考一个问题，你知道网络上一些由AI合成的视频是怎么生成的吗？它的背后隐藏着那些能力？

大模型构建上层应用

以网上爆火的AI视频类为例，一个AI视频使用到了哪些技术？

首先，视频生成和处理的能力；其次，语音合成能力；再者，音画同步的能力；最后，文字与语音转换的能力等等。

比如说，要想做一个林黛玉大战孙悟空，却导致镇关西失街亭，最后导致刘备官渡之战大败而归的视频；并配上文字和语音解说。

这样的视频应该怎么做？

首先，需要利用AI 视频工具生成以上四个部分；孙悟空大战林黛玉，镇关西失街亭，官渡大战；然后自己或使用自然语言处理工具做出解说文字；最后再用TTS或剪辑工具配上某个人的语音；这样才算完成了一个基础的视频剪辑功能。

大模型上层应用本质上是一个能力整合的过程-AI.x社区

而这也是自媒体界常说的脚本，第一步该干啥，第二步该干啥等等。

而从大模型的应用角度来说，这个功能就属于AIGC的功能；那如果从技术的角度来说，是否能够利用编程技术整合多个大模型的能力，使得以上功能只需要输入一些prompt就可以完成？

从理论上来说，这种想法是可行的；而需要的是什么？

其实需要的就是一个类似于导演和编剧的角色，而这个角色可以通过什么来实现？

以上功能可以通过Agent来实现，使用一个具备逻辑推理能力的大模型作为大脑，来指挥其它模型和调用多种工具完成以上功能。

可能每一个模型和工具的能力都不是很强，但通过一个中央大脑的整合，就可以让这些简单的工具变得强大无比；而这就是能力整合的能力。

AI技术发展了几十年，虽然很多人认为它好像没什么用；但不得不承认的是，AI可以让一个什么都不懂的人也可以做一名剪辑师。

比如说，第一步利用文生图生成多张图片，然后再利用图生视频的能力，生成一段视频；然后再用自然语言处理模型生成一段文字，最后通过剪辑工具或其它AI工具把视频，文字整合到一起并配上语音旁白；这样一个漂亮的视频剪辑成果就出来了。

而在此之前，一个人要想学视频剪辑，既要需要摄影摄像，拍照剪辑，还要学会各种构图的方式以及各种拍摄和剪辑工具的使用；为了增加视频的质量还需要绞尽脑汁地写文案，找专业声优配音等。

大模型上层应用本质上是一个能力整合的过程-AI.x社区

而这些现在都可以通过AI来解决，大大降低了人的学习和使用成本，提升生产效率。

还有一些人使用类似于豆包等AI工具，调配多种AI和其它工具，整合成一个私人助手，更有甚者，有人利用AI助手开起了一个人的公司。

这都是AI技术的应用，也是一种能力整合的能力。

大模型技术虽然发展的如火如荼，但大模型的应用严格来说还处于一个不断摸索的过程；只要你敢想敢尝试，那么就有无限的可能。

本文转载自公众号AI探索时代作者：DFires

原文链接：https://mp.weixin.qq.com/s/k7JyWGgod0CsrzbyO5ouKQ

标签

大模型

生成式模型

相关推荐

AI下一个重大飞跃是理解情感！第一个具有情商的对话型AI来了

duhorse • 1711浏览 • 0回复
什么是AI网关？你还需要一个吗？

51CTO技术栈 • 2340浏览 • 2回复
综述：大语言模型在信息抽取上的应用

xuxiangda • 3475浏览 • 0回复
ChatGPT是第一个真正意义的人工通用智能

ceesoft • 1647浏览 • 0回复
怎么在大模型之上构建应用？构建人工智能上层应用的框架——langchain

AI探索时代 • 1485浏览 • 0回复
大模型解决实际问题的能力，大模型的产品化过程

AI探索时代 • 1559浏览 • 0回复
如果老板让你基于大模型搭建一个系统，怎么选择一个适合自己任务的大模型？选择大模型需要考虑哪些问题？

AI探索时代 • 1323浏览 • 0回复
怎么评价一个模型的好坏？大模型应用重要环节之——模型评估

AI探索时代 • 2918浏览 • 0回复
大模型的“记忆”不应仅仅只依靠向量数据库，mem0是一个很好的“融合架构”实践方向

Syrupup • 2548浏览 • 0回复
不要沉迷大模型的技术与理论，学习大模型的方法——从做一个小应用开始

AI探索时代 • 1471浏览 • 0回复
一个关于学习大模型技术的方法论

AI探索时代 • 958浏览 • 0回复
情感即服务：AI的下一个市场是你的心

51CTO内容精选 • 691浏览 • 0回复
怎么设计一个自己的大模型？设计一个大模型需要哪些能力？

AI探索时代 • 1957浏览 • 0回复
对话华为云马会彬：AI原生应用变革，本质上是一场「从1到 0」的创新

51CTO技术栈 • 980浏览 • 0回复
讨论一个技术问题，大模型流式返回

AI探索时代 • 2021浏览 • 0回复
为什么多模态AI是下一个风口？深度解读新一代LLM

芝士AI吃鱼 • 2734浏览 • 0回复
我构建了一个自动生成提案的LLM，并拿到GitHub上开源了它

51CTO内容精选 • 476浏览 • 0回复
下一个AI前沿与革命：KAN 上

鲁班模锤1 • 509浏览 • 0回复
再谈什么是神经网络，透过现象看本质

AI探索时代 • 416浏览 • 0回复

AI探索时代

这个用户很懒，还没有个人简介

帖子

声望

粉丝

关注

51CTO

51CTO博客

51CTO学堂

大模型上层应用本质上是一个能力整合的过程原创

大模型构建上层应用

这样的视频应该怎么做？

从理论上来说，这种想法是可行的；而需要的是什么？

目录

51CTO

51CTO博客

51CTO学堂

大模型上层应用本质上是一个能力整合的过程 原创

大模型构建上层应用

这样的视频应该怎么做？

从理论上来说，这种想法是可行的；而需要的是什么？

目录

大模型上层应用本质上是一个能力整合的过程原创