Hugging Face最受欢迎15大AI机构出炉!清华第五,OpenAI第十,冠军竟是它?

人工智能
Hugging Face作为开源AI社区的代表,总结了社区最欢迎的前15个公司和机构。让我们看看在开源社区眼里,哪些机构对于开源AI贡献最大。

Hugging Face上最受欢迎的15个AI公司出炉了!

目前的冠军,是Stability AI。

开源英雄Meta AI,取得亚军之位。

而我们熟知的微软、谷歌、OpenAI,分别名列第八、九、十的位置。

图片图片

15个最受AI开源社区欢迎的公司

截止23年11月24日,榜单如下——

1. Stability AI,20000个赞

图片图片

2022年AI大爆炸的两个标志性事件,一个是ChatGPT,一个就是Stable Diffusion。

作为开源的图像生成模型,可以说,Stable Diffusion的发布将AI生图提高到了全新的高度,影响不亚于Open AI发布ChatGPT。

Stability AI,就是大名鼎鼎的Stable Diffusion背后的公司之一,掌门人和联合创始人是Emad Mostaque。

不过,他此前有一些不好的传言。

图片图片

另外,Stability AI也开源了自己的大语言模型——StableLM。

2. Meta AI,20000个赞

图片图片

实至名归,Llama模型的开源鼻祖,如今大模型领域开源和闭源模型能够分庭抗礼,没有全被OpenAI、谷歌等明星初创公司和大科技公司垄断,Meta AI功不可没。

也因此,小扎被公认为「开源英雄」,而图灵三巨头之一的Yann LeCun,在Meta也起着定海神针的作用。

图片图片

虽然排名第二,但是赞数和第一完全没有差距。可以说Meta AI就是最受开源社区欢迎的AI公司。

正所谓,「开源AI社区共一石,Meta独占八斗」。如果没有Meta和LeCun对于AI开源社区的贡献,整个AI行业的格局都会完全改变。

整个AI行业和开源AI的未来的发展,某种程度上都要倚仗LeCun和小扎继续真金白银的投入,以及不断地摇旗呐喊。

3. Runway,11000个赞

视频生成工具Gen-2,已经成为生成式AI视频领域的标杆,每次一发布更新,都能引起业内不小的震撼。

图片图片

从三无青年到15亿美元独角兽CEO,Runway CEO的故事,不过是又一个「平平无奇」的硅谷神话。

2018年,Cris Valenzuela(CEO)、Anastasis Germanidis和Alejandro Matamala-Ortiz 在纽约创办Runway, 今年5月,Runway已完成了1.41亿美元的C轮融资,估值达到15 亿美元。

图片图片

4. CompVis,10000个赞

Stable Diffusion,是Stability AI、RunwayML、LMU Munich、EleutherAI 和LAION的研究人员合作的结果。

在CompVis领导下的Stable Diffusion V1,改变了开源AI模型的性质,在全球范围内催生出了数百个其他模型和创新。

Runway的Patrick Esser和LMU 慕尼黑的Robin Rombach领导了这个项目,他们在海德堡大学CompVis小组的研究奠定了这个项目的基础。

在海德堡大学,他们创建了广泛使用的VQGAN和Latent Diffusion。这两个模型再加上OpenAI和Google Brain的成果,使Stable Diffusion得以实现。

5. 清华KEG,7,000个赞

清华KEG实验室,一直是国内AI技术的领头羊。

中国顶尖开源大模型ChatGLM2-6B,可以说是清华系的ChatGPT,由清华知识工程研究室和智谱AI训练。

图片图片

ChatGLM2-6B允许免费商用后,我国的开源大模型也开启了「安卓时刻」。

而清华系17人,则直接撑起了中国大模型创业的半壁江山。

图片图片

6. BigScience,7,000个赞

BigScience Research Workshop,不是正式成立的实体,而是由HuggingFace、GENCI和IDRIS发起的开放式协作组织,以及一个同名的LLM研讨会,汇聚了全球1000+研究人员。

这1000多名志愿研究者,在BigScience项目中创建了拥有1760亿参数的模型BLOOM。

图片图片

BLOOM是BigScience Large Open-science Open-access Mul-tilingual Language Model首字母的缩写,全名代表着大科学、大型、开放科学、开源的多语言大模型。

7. 阿联酋技术创新研究所,7000个赞

阿联酋技术创新研究所隶属于阿布扎比政府先进技术研究委员会 (ATRC) ,负责监督酋长国的技术研究。

图片图片

2023年9月6日,阿联酋(UAE)技术创新研究所(TII)推出Falcon180B,再次突破生成式AI的界限。

Falcon 180B拥有惊人的1800亿参数,经过3.5万亿个token的训练,在预训练LLM的HuggingFace排行榜上名列前茅。甚至,它在各种基准测试中,都胜过了Meta的LaMA 2这种级别的竞争对手,包括推理、编码、熟练程度和知识测试。

图片图片

而且作为第一个有影响力的不限制商用的开源模型,Falcon用中东金主爸爸的豪气,把开源模型的限制彻底打下来了。

这就不奇怪为什么开源社区对他们好感爆棚。

8. 微软,6500个赞

在ChatGPT大爆发之后,突然化身「创业公司」的微软,成为了硅谷大厂中今年最亮的一颗星。

微软快速跟进,利用大模型能力改造了Bing,加班加点推出Copilot,并把他们塞进了自家的拳头产品Office和Windows之中,给科技圈秀了一把这家「年近50」科技巨头的「狼性」。

图片图片

另一边,微软Azure作为云计算行业的头部玩家,无缝驶入了AI算力需求的快车道。

他们和Meta合作,对Llama 2等开源模型提供的良好支持,也进一步刷了一波在开源社区的好感度和存在感。

在最近的OpenAI惊天宫斗系列剧中,微软差点通过「OpenAI 0元购」,成为了AI赛道的「终极寡头」。

图片图片

9. Google AI,6000个赞

作为对于AI技术投入最早也最大的科技巨头,谷歌在AI社区中的影响力不用怀疑。

图片图片

从AI基础研究到AI产品,谷歌早已浑身上下都流淌着AI的血液。

DeepMind在强人工智能领域不断地取得令人瞩目的突破,谷歌云作为AI算力提供商是AI行业的基础设计建设中最重要的一环。

虽然谷歌Bard和Palm大模型暂时在竞争之中不占优势,但传说中的Gemini似乎迟早要将谷歌拉回AI行业舞台的最中心。

图片图片

而对于开源社区的发展,谷歌的贡献同样功不可没,无数的开源项目已经成为AI开源社区的基石。

图片图片

10. OpenAI,4000个赞

作为AI行业今年大爆发的直接引领者,OpenAI的地位是毋庸置疑的。

虽然被调侃为「ClosedAI」,但是OpenAI对于AI开源社区的贡献也是有目共睹的。

Whisper作为开源且性能最好的语音识别模型,几乎所有相关的从业人员都能从中受益。

图片图片

希望刚刚结束了「权游」的OpenAI,能继续瞄准AGI,为整个AI行业开拓上限。

11. BigCode Project,4,000个赞

BigCode是一个开放的科学合作组织,致力于为编码应用程序进行负责任的LLM训练。

他们的主要工作有——

StarCoder,一种最先进的代码语言模型。

BigCode项目中的StarCoder,是一个160亿参数的模型,它使用了80多种编程语言、GitHub问题、Git提交和Jupiter 笔记本的一万亿个token。

StarCoder可以通过聊天进行微调,创建一个性化的编码助手StarChat。

另外还有OctoPack,用于指令调优大型代码模型的工件;The Stack,最大的可用预训练数据集,具有外围代码;SantaCoder,一个1.1B参数的代码模型。

12. MosaicML,4000个赞

在今年6月被DataBrick斥资13亿刀收购的独角兽MosaicML,非常引人瞩目。

从此,MosaicML的生成式AI平台和Databricks的数据管理能力结合,将形成双赢。

图片图片

这家公司创立于21年,仅有62人。

创始人Naveen Rao是创办的第一家公司Nervana Syatems,被英特尔收购。另一位创始人Hanlin Tan,是一位连续创业者,曾创立云计算公司,以及在谷歌、微软和英特尔担任职位。

MosaicML提供了一些开源、可商用的LLM,比如MPT模型。

MPT-7B和MPT-30B两个模型,是目前最先进的开源、可商用的LLM之一。

图片图片

13. UKP Lab,3000个赞

UKP Lab(无处不在的知识处理实验室)由Iryna Gurevych教授于2009年创立,是达姆施塔特工业大学计算机科学系的一部分。

图片图片

UKP Lab在自然语言处理(NLP)方面开展前沿研究,重点关注大型语言模型、对话式人工智能、问答、跨文档NLP以及新颖的数据集和问题定义。

图片图片

14. EleutherAI,3000个赞

EleutherAI成立于2020年7月,由Connor Leahy、Sid Black和Leo Gao创立,从一个讨论GPT-3的Discord服务器,发展成为一个专注于大规模人工智能研究的非营利性研究机构。

图片图片

现在,它是是一个开源的社区人工智能项目,旨在创建一个完全去中心化的、具有自治文明的单例人工智能。任何能连接互联网且有GitHub帐户的人都可以参与。

2021年,EleutherAI发布了The Pile,是一个825GB的多样化文本数据集。

2021年6月,EleutherAI公布了GPT-J,它是一个60亿参数的模型,在Pile上训练。发布时,它是世界上最大的公开GPT-3风格的语言模型。

随着GPT-NeoX的出现,EleutherAI计划将参数一直提高到1750亿,发起了争夺最大GPT-3模型的挑战赛。

2023年4月,它发布了Pythia系列大模型。

15. Salesforce,3000个赞

Salesforce,是创建于1999年3月的一家客户关系管理(CRM) 软件服务提供商,总部设于美国旧金山,可提供随需应用的客户关系管理平台。

创始人是Marc Benioff。27岁时,他就成为Oracle历史上最年轻的高级副总裁。

图片图片

正是因为预见到,会有越来越多的企业通过互联网得到软件服务,他才选择离开Oracle,在37岁时创立Slesforce。

他提出了云计算和SaaS的理念,被誉为「软件终结者」。

当下Salesforce正在推出AI功能,试图将人工智能整合到办公空间即时通讯应用Slack等产品中,并为销售人员等推出了一款名为Einstein GPT的生成式人工智能产品。

图片图片

Benioff称,「我们非常渴望确保Salesforce成为第一大人工智能CRM。」

参考资料:

https://twitter.com/osanseviero/status/1727260746289905920

责任编辑:武晓燕 来源: 新智元
相关推荐

2023-01-07 12:23:58

JavaScriptNode.js模块

2014-02-21 09:18:18

2010-08-02 16:48:10

职场

2017-07-25 09:53:37

Python机器学习

2017-07-26 12:31:19

Python核心库数据科学

2009-02-04 10:49:08

IT求职揭秘技能

2013-08-22 10:06:17

开源软件

2023-01-09 17:10:54

2013-01-06 10:30:36

数据中心技巧ups

2015-09-08 09:58:32

Docker Hub镜像仓库最受欢迎

2021-01-20 11:23:23

TensorFlow数据机器学习

2015-04-28 13:51:52

开源云项目IaaSPaaS

2009-09-02 09:56:00

Android Mar

2022-05-10 09:37:18

微软GitHub开源软件

2018-05-03 06:49:51

2018-04-06 09:25:10

GitHub Java测试工具

2018-07-02 10:46:18

2017-10-10 13:29:54

AI工具 库 平台

2024-07-30 11:55:15

2010-02-06 15:41:08

ibmdwJava
点赞
收藏

51CTO技术栈公众号