学会区分大模型——大模型的分类，让你更清晰的认识大模型原创

AI探索时代

发布于 2024-8-14 06:34

浏览

0收藏

“ 乱花渐欲迷人眼，学会从根本上认识问题”

现在市面上大模型如百花齐放，对很多人来说一堆大模型带来的不是简单方便，而是乱七八糟以及迷茫。

因为不知道不同的大模型之间有什么区别，也不知道自己需要什么样的大模型；就拿huggingface来说，上面的模型有几十万，有几个人能弄明白它们都是干什么的？

因此，我们首先需要学会的就是大模型的分类，对大模型分门别类之后就知道哪些大模型是做什么的，自己需要的是什么了。

学会区分大模型——大模型的分类，让你更清晰的认识大模型 -AI.x社区

大模型的分类

事实上直接说大模型并不是特别准确，大模型指的是具有庞大参数的机器学习或者深度学习模型。

根据模型的参数量可以分为大/中/小三种类型，不同的模型对资源要求不同，应用的场景也不同；比如一些小模型可能会安装到移动设备之上。

按任务类型分类

根据任务类型，大模型可以分为生成式模型，判别式模型和混合模型。

生成式模型：这种模型主要用于生成内容，包括文本，图像，音视频等；典型的比如GPT模型。

判别式模型：判别式模型主要应用于分类，预测等任务；如图像分类，文本分类等；比如Bert模型。

混合模型：混合模型结合生成式和判别式模型的能力，能够在生成内容的同时进行分类或判别任务。

当然，这个按任务分类只是进行简单的分类，如果再细化还有更多的分类方式，比如情感分析等。

按数据模态分类

根据数据模态，大模型主要分为两类，一类是单模态模型，一类是多模态模型。

单模态模型：单模态就是仅支持一种模态数据的模型，比如支持文本或者图片等类型的模型；如ResNet处理图像，BERT模型处理文本。

多模态模型：能够同时处理多种类型的数据，如文本，图像，音视频等；如CLIP模型结合了文本和图像处理的功能。

学会区分大模型——大模型的分类，让你更清晰的认识大模型 -AI.x社区

按训练方法分类

按训练方法进行分类，主要有预训练模型，从零训练模型和迁移学习模型。

预训练模型：通常在大规模数据集上进行预训练，然后通过微调适应特定任务，如GPT，BERT等。

从零训练模型：从头开始训练的模型，通常在特定任务上训练，数据集要求较高。

迁移学习模型：迁移学习通常是指在一个任务中学习的知识迁移到另一个相关任务中；能够减少训练时间并提升性能。

学会区分大模型——大模型的分类，让你更清晰的认识大模型 -AI.x社区

按应用领域分类

按照应用领域分类，主要分为自然语言处理，计算机视觉模型，以及语音处理模型等。

自然语言处理模型：专门用于处理和理解人类的语言，如文本生成，翻译，情感分析等任务。

计算机视觉模型：用于处理和理解图像或视频数据，如图像分类，目标检测，图像生成等任务。

语音处理模型：用于处理语音信号，包括语音识别，合成，情感分析等任务。

按模型架构分类

按模型架构分类，主要分为transformer架构，卷积神经网络和循环神经网络以及长短期记忆网络。

transformer架构：transformer架构应该就不用多说了，大名鼎鼎的GPT就是基于Transformer架构，广泛应用于自然语言处理和多模态任务中。

卷积神经网络：主要应用于计算机视觉任务中。

循环神经网络和长短期记忆网络：传统上用于处理时间序列数据或语音处理任务。

当然，大模型的分类还有多种不同的形式，以上分类方式是目前比较主流的方式而已。比如说有应用于代码开发的代码生成模型，用于数据处理的数据分析模型等。

弄清楚模型的分类，有助于加深对模型的理解；比如说有人提到GPT，你就能知道它是一个基于Transformer架构的，能够进行自然语言处理与生成的预训练模型。

本文转载自公众号AI探索时代作者：DFires

原文链接：https://mp.weixin.qq.com/s/nver-8r0MJOc1ShByjplWg

标签

模型

多模态

已于2024-8-14 06:37:17修改

相关推荐

Sam Altman：GPT-5，将会比现在的大模型更智能

Aceryt • 1003浏览 • 0回复
让大模型不再「巨无霸」，这是一份最新的大模型参数高效微调综述

轻薄滴假象 • 1018浏览 • 0回复
大模型应用的六种架构模式，你知道几种？

玄姐聊AGI • 2891浏览 • 0回复
你知道什么是微调吗？大模型为什么要微调？以及大模型微调的原理是什么？

AI探索时代 • 3146浏览 • 0回复
如果老板让你基于大模型搭建一个系统，怎么选择一个适合自己任务的大模型？选择大模型需要考虑哪些问题？

AI探索时代 • 818浏览 • 0回复
大模型的分类——生成式大模型和判别式大模型联系与区别

AI探索时代 • 1719浏览 • 0回复
你知道大模型能做哪些事情吗？——大模型的任务类型以及应用场景

AI探索时代 • 1203浏览 • 0回复
增强问答文本检索的排序（RAG）模型，你学会了吗？

AI论文解读 • 1285浏览 • 0回复
大模型的热度正在下降，大模型的未来在哪里？

AI探索时代 • 684浏览 • 0回复
突破大语言模型的逻辑瓶颈：Logic-of-Thought方法让LLM更懂"推理" | 用外部数据增强大语言模型：RAG全面解

sbf_2000 • 1531浏览 • 0回复
你对大模型认知的开始——大模型的能力问题

AI探索时代 • 642浏览 • 0回复
什么是生成式大模型？大模型与生成式大模型的区别？

AI探索时代 • 1251浏览 • 0回复
什么是大模型、特点、优势。大模型与AIGC的关系

parson2000 • 928浏览 • 0回复
更快、更强、更经济！超越GraphRAG的大模型RAG系统LightRAG开源啦！

水晶花雨_32 • 968浏览 • 0回复
大模型技术全面解析，从大模型的概念，技术，应用和挑战多个方面介绍大模型

AI探索时代 • 6015浏览 • 0回复
你知道大模型聊天补全和文本生成的区别吗？

AI探索时代 • 694浏览 • 0回复
让你的RAG应用更加智能！引入自我反思的大模型 RAG 框架(Self-RAG)

水晶花雨_32 • 576浏览 • 0回复
本地部署Qwen2.5-Coder大模型，打造你的专属编程助手

AI科技论谈 • 1869浏览 • 0回复
从RAG到RAG+：让大模型更懂业务的权威指南

芝士AI吃鱼 • 235浏览 • 0回复

AI探索时代

这个用户很懒，还没有个人简介

帖子

声望

粉丝

关注

51CTO

51CTO博客

51CTO学堂