当你研究过了900个开源大模型项目后，你能学到什么？原创

鱼虫子

发布于 2024-9-19 14:02

浏览

0收藏

国外一美女程序员，在Github上通过检索gpt, llm, 和generative ai等关键字，从数十万检索结果中得到900个500+ star大模型开源项目。

她将统计结果放到了网站上，并定期更新star数等信息，同时提供了排序，分组，过滤等工具，我们也可以拿她的统计结果来进行分析。

https://huyenchip.com/llama-police

当你研究过了900个开源大模型项目后，你能学到什么？-AI.x社区

接下来让我们看看她通过分析这些开源项目学到了什么。

新的AI堆栈

当你研究过了900个开源大模型项目后，你能学到什么？-AI.x社区

基础设施包括训练大模型的硬件资源，训练大模型需要大量的显卡，一些企业考虑到数据安全，以及从长远成本考虑，选择搭建自己的计算中心。NVIDIA这几年靠着卖显卡可谓赚的盆满钵满，显卡价格一路飙升，即使这样仍是一卡难求。

模型开发工具包括像TensorFlow、PyTorch等AI框架，框架本身是开源免费的，但可以通过附加的云服务和硬件资源来赚钱。

应用软件指的是基于大模型的工具，一般通过闭源大模型有偿向用户提供访问接口，例如，openAI每个月都会向Plus用户收取会员费以及API调用费用。

随时间变化

当你研究过了900个开源大模型项目后，你能学到什么？-AI.x社区

图表显示，当chatGPT发布后，大模型的相关项目数量开始呈指数级增长。

这说明当一项颠覆性技术出现后，围绕此技术的各项发明会迅速增加。

就像当年的电力。

但大家会有疑问，大模型也就能画个图，写写小作文，说它是颠覆性技术，有点过了吧？

当年电力取代蒸汽机时，一开始人们对于电机也是持怀疑态度，因为它并没有提高生产效率。

后来人们才发现，是使用方法不当。

在传统工厂的中间会有一个蒸汽机，然后通过传动装置驱动各个模块，有了电机后只是简单的将蒸汽机替换成了电机。

本质上还是个集中式系统，依据木桶原理，整体效率仍然受限于最差的那个。

后来，工厂将电机应用于各个模块，这就是现代工厂流水线的雏形，这样的分布式系统大大提升了效率

电开始普及开来。

当你研究过了900个开源大模型项目后，你能学到什么？-AI.x社区

在应用层领域，项目最多的是code和bots。

code：当大模型在自然语言上取得成效后，人们开始将大模型应用于人造语言上，代码就是其中之一。

bots：相对被动式的一问一答，人们希望大模型能够自主思考，会使用工具，并且嫩进行决策。

information aggregation：科技的进步只是将人类从繁重的体力劳动中解放出来，人们要学的东西日益增多，大模型的概括能力让人具有一目十行的超能力。

当你研究过了900个开源大模型项目后，你能学到什么？-AI.x社区

专注Prompt工程的人，我认为是最聪明的人，因为它是性价比最高的提升大模型性能的方法。

前面我也通过两个例子证明了Prompt工程的超能力，仅仅通过在Prompt前面加个think step by step，就让大模型答对了9.11和9.3哪个大的问题，以及strawberry有多少个r的问题。

本文转载自公众号人工智能大讲堂

原文链接：https://mp.weixin.qq.com/s/QWGyhYHonybE2F6iomJb8w

©著作权归作者所有，如需转载，请注明出处，否则将追究法律责任

标签

开源大模型

开源

大模型

相关推荐

Google开源大模型新成员CodeGemma、RecurrentGemma，继Transformer后新架构Griffin诞生

AIGC最前线 • 3122浏览 • 0回复
什么是AI网关？你还需要一个吗？

51CTO技术栈 • 3071浏览 • 2回复
爆火的本地知识库项目是什么？什么是RAG？本地知识库与大模型的关系

AI探索时代 • 4049浏览 • 0回复
LazyLLM：低代码构建多Agent大模型应用的开源项目

PaperAgent • 2833浏览 • 0回复
你知道什么是微调吗？大模型为什么要微调？以及大模型微调的原理是什么？

AI探索时代 • 5604浏览 • 0回复
xLAM: 一个赋能AI agent系统的动作大模型家族

sbf_2000 • 2158浏览 • 0回复
爆火的本地知识库项目是什么？什么是RAG？本地知识库与大模型的关系

AI探索时代 • 2551浏览 • 0回复
为什么你会觉得大模型很难学？甚至学了好久还不知道大模型到底是个什么玩意？

AI探索时代 • 1584浏览 • 0回复
五个超级容易上手的AI项目

小虎哦哦 • 1994浏览 • 0回复
适用于TTS语音处理项目的召回模型：词袋模型究竟是个啥？和语义召回相比有什么优劣？

AI博物院 • 1680浏览 • 0回复
AI赋能教育：人工智能在教育中的八大应用实例

风云2002_1 • 9181浏览 • 0回复
我从 2024 年的 LLM 应用开发实践中学到了什么？Part 1

Baihai_IDP • 1782浏览 • 0回复
当ChatGPT爆火后，大语言模型LLM的完整修炼之路 | 为什么说AI Agent还不够？

sbf_2000 • 1540浏览 • 0回复
4090单卡跑满血版DeepSeek-R1，清华团队开源项目再破大模型推理门槛

Crystalcxt • 1693浏览 • 0回复
DeepSeek一口气开源3个项目，还有梁文锋亲自参与，昨晚API大降价

轻薄滴假象 • 1821浏览 • 0回复
你为什么要用GraphGAG？

熵减AI • 1200浏览 • 0回复
五大开源 Manus 复刻项目全景解析

玄姐聊AGI • 1779浏览 • 0回复
DeepSeek爆火后的新Scaling Law究竟是什么？

51CTO技术栈 • 1188浏览 • 0回复
刚刚，OpenAI 开源了两个 Agent 项目，手搓 Manus 时代来袭

玄姐聊AGI • 1403浏览 • 0回复

鱼虫子

LV.3

这个用户很懒，还没有个人简介

觉得TA不错？点个关注精彩不错过

帖子

260

声望

粉丝

关注

51CTO

51CTO博客

51CTO学堂

当你研究过了900个开源大模型项目后，你能学到什么？原创

新的AI堆栈

随时间变化

目录

51CTO

51CTO博客

51CTO学堂

当你研究过了900个开源大模型项目后，你能学到什么？ 原创

新的AI堆栈

随时间变化

目录

当你研究过了900个开源大模型项目后，你能学到什么？原创