前几天微软中国的创新技术总经理崔宏禹在上海的未来技术峰会上提出,GPT-4后不建议在模型上微调,而是采用把知识库映射为低维向量嵌入到大模型里就可以了。我以前猜测NEWBING的较为精准的回答模式就是采用这种方式实现的,从崔总的观点上看,还是很可能的。
实际上崔总的观点主要是依据于GPT-4的基础能力已经比较强了。利用GPT-4的能力获取到提问的关键要素,然后利用对低维向量的精准搜索找到确定的知识,然后再用GPT-4去推理,获得更为完善的知识,反馈给用户,一般情况下可以获得很好的效果。从这段时间我使用NEWBING的体验来说,这一点我是比较认可的,自从拥有了NEWBING以后,我已经没有了再开一个OPENAI的账号,替代那个被封掉的老账号的想法了。不过NEWBING在一些十分专业领域的知识方面依然不尽如人意,回答专业知识的准确性也存在很大问题。有些时候我不得不从GOOGLE上获得更专业的知识,有些专业性比较强的知识也需要到GOOGLE上进行确认。
这些体验都说明了GPT-4还不够完美,针对领域专业知识的微调训练似乎还是不可避免的。不知道是我对大语言模型的理解还比较肤浅,还是微软在NEWBING的工具链上有我所不知道的技术,能够解决基础大语言模型在专业知识领域的能力不足的问题,亦或是崔总的观点本身在某些专业领域并不准确,以我目前在这方面的能力而言,是无法判断的,还需要多向这方面的专家学习。
奇怪的是,最近这些天崔总的观点被大量的国产大语言模型的拥有者反复的复述,这几天关于这方面的话题,发文者大多数讲述了和崔总类似的观点,这又让我感到我是不是遇到了某种知障,没能理解专业知识自动化方面的一条正确的途径。因为在我最近这方面的事件来看,基础模型如果对某个专业知识领域的知识过于肤浅,哪怕利用LANGCHAIN整合低维向量化的本地知识库,其性能也是不太理想的,因此我们目前还在努力提高预训练模型在某专业领域知识上的性能。
上周也和一家从事智能化解决方案的企业领导交流过关于大语言模型在运维智能化方面的应用,他说他们前几年就已经开发了完善的应用平台,可以直接通过专业书籍自动生成应答,从而简化预训练。我想如果他所说的事情真的做到了,那么将会是十分有价值的,他们在这个领域应该可以很快构建出大量有价值的应用。不过事后我在他们的官网上并没有看到相关的应用案例,他也没有和我探讨如何在数据库运维领域方面构建这方面能力的问题。
最近和几个在从事大语言模型辅助智能运维的团队做了几次不是很深的交流,感觉大家做的事情都差不多,选择一款可离线私有化部署的模型,做微调训练,整合工具链和向量化本地知识库。不过大家做得都还比较浅,没有看到特别激动人心的成果。
而在与做智能化算法或者工程方面的朋友交流的时候,他们关注的往往是模型本身,对行业知识库往往兴趣不足。以我目前的认知而言,高性能的模型➕专业知识库才是解决问题的关键。但是我目前还没找到专业知识库与高性能模型之间完美结合的方法。也希望在做这方面工作或者对这方面工作有心得的朋友多交流交流。
周末的时候做了一个测试性的微调训练,跑了四十多个小时后我中断了训练,测试了效果,大体上还是满意的,于是我用一个近三万样本的训练集重新做了训练,大约再过70个小时应该有结果了。装备太差,做这方面工作真的很闹心。等有了结果再和大家交流吧。