抛开技术,从问题来串联人工智能,机器学习和大模型技术 原创
“ 技术并不是一个一蹴而就的过程,而是一个逐渐发展的过程”
大模型火了也有两年时间了,然后很多人也在不断的学习大模型技术,但很多人一直没学明白什么是大模型技术;他们所理解的大模型技术就是官方给出的大模型定义,但根本不知道为什么需要大模型技术,以及大模型为什么会是这个样子。
今天,我们就抛开技术来思考一下,什么是大模型?
什么是大模型?
如果你问一个人什么是大模型,如果是一个技术人员他肯定会告诉你,大模型是一个拥有巨大参数量,并且需要经过大量数据训练的神经网络模型。
而如果是一个非技术人员,或者不了解大模型技术的人,他可能会告诉你大模型是一个很火的技术,是一种非常牛逼的人工智能技术。
OK,抛开专业的技术力量,上面的两种说法都没有错;但如果让你来回答这个问题,什么是大模型?把你自己的理解用语言给描述出来。现在开始思考一下,什么是大模型,你会怎么回答这个问题。也可以把你的理解打在评论区。
下面我们从非技术的角度开始,从问题开始,由浅入深的理解一下什么是大模型。
想理解什么是大模型,首先要理解大模型解决了什么问题;首先,大模型属于人工智能的一个实现范畴,所以我们先从人工智能开始说起。
什么是人工智能?
人工智能简单来说就是由人类制造出来的一个具有智能的机器或系统;也就是说人工智能是由人类制造出来的一个智能体。
为什么要制造这个智能体呢?抛开对技术的执念,单从智能体的作用来思考;有句话叫,技术发展的根本原因是因为人类的惰性,人类什么事都不想干,什么事都想让机器去干。
但刚开始的机器只能由人类去操作才能完成一些事情,那么是否可以设计出一款可以自己思考,不需要人类干涉,然后就能主动去解决各种复杂问题的机器;这个机器就是人工智能。
ok现在目的已经很明确了,人类想设计出一款能够自己思考,自己干活的机器,这样就可以把人类从繁重的工作中解脱出来。
那么,怎么才能做出这样的一个机器呢 ?也就是用什么样的方案,才能达到这个目的?
科学家和一些技术人员经过多年的研究发现,想实现人工智能可能存在多种方式(人工智能有几个流派,感兴趣的可以去搜索一下);但目前最火的,也是最可能实现的人工智能技术就是——机器学习。
什么是机器学习?
既然一次性想实现一个人工智能很复杂,也很困难,那么是否可以模仿人类的成长过程一样,通过学习的方式,让机器慢慢具备智能;也就是让机器去学习。
经过一段时间的研究,科学家们也提出了一些关于机器学习的想法,并实现了一些算法;比如朴素贝叶斯,逻辑回归,决策树等。
但科学家们发现,这些方式只能实现一些很简单的“智能”,事实上根本算不上智能;那有没有更好的办法呢?
因此,经过仿生学的研究,科学家发现可以把实现人工智能与人类的脑科学结合起来;人类的思想很复杂,也很深邃,但核心部件就是我们的大脑;那能不能用一种方式去模仿人类的大脑,然后通过这种方式来实现人工智能呢?
因此,基于机器学习的深度神经网络就出现了;什么是神经网络?
所谓的神经网络就是模仿人类的大脑神经元,用一种结构或算法去模仿人类的大脑运作方式,来让机器具备自主学习的能力。
那神经网络和大模型又有什么关系呢?
事实上,大模型是一种基于神经网络架构的机器学习模型;因为人脑是一个非常复杂的系统,人脑中有几百亿神经元;因此,采用这种模仿人脑的神经网络模型,就需要大量的参数来模仿不同的神经元;而模仿出大脑神经网络之后,还要让这个模型进行学习,因此就需要大量的数据让它去理解,去学习。
因此,这种需要大规模的学习数据,基于神经网络模型实现的机器学习模型,就叫做大模型。
现在大家应该了解了什么是大模型;那这个大模型具体怎么实现呢?这里可能有人会想,你这说的不是废话吗?前面刚说了模仿人类大脑神经元,现在又问怎么实现。
其实有这种问题也不奇怪,虽然说是模仿大脑神经元,那具体怎么模仿?这就类似于让你模仿鸟类的飞行,来制造一个飞机出来;而飞机怎么制造?
制造飞机设计到动力系统,流体力学,材料学,控制系统等等多种学科;同样,大模型也是如此;大模型设计到计算机科学,哲学,社会学,数学,物理学等等多种学科。
而且用机器去模仿人类的大脑,总要有一种结构吧;毕竟人脑也是有结构的;那么,怎么用一种结构或者说数学模型来模仿人类的大脑结构呢?
这时,让chatGPT大放异彩的Transformer模型就出现了;当然,大模型并不只有Transformer这一种模型结构;还有其它多种模型结构,感兴趣的也可以自己去搜索一下。
ok现在我们知道什么是大模型了,也知道了大模型的基础结构之一的Transformer模型;那么,人类可以进行读,写,绘画创作和逻辑推理等操作;那么怎么才能让大模型也具备这种能力呢?
因此,这时就需要把大模型技术与自然语言处理技术相结合,这样就可以让大模型具备读和写的能力;而再把大模型与计算机视觉技术相结合,这样大模型就具备了图像和视频处理的能力。
而逻辑推理是人类大脑最复杂也是最强大的一项能力,大模型无法直接实现类似人类思考推理的过程,但可以通过一种方式,那就是步骤拆解;让大模型慢慢具备对简单逻辑进行拆解的能力,然后使用这种方式,让大模型把复杂的问题简单化,让好大模型就可以对简单的问题进行处理;最后组合成一个能解决复杂问题的系统。
当然,大模型的技术目前还处于初级阶段,它还处在一个不断发展与完善的过程。但我们需要考虑的是,一是怎么把大模型做的更好,更强大;二是怎么让大模型解决我们生活和工作中的问题;通过理论研究和实际应用的过程来不断的提升和发展大模型的能力。
本文转载自公众号AI探索时代 作者:DFires