鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程软考华为认证厂商认证 IT技术 PMP项目管理免费题库

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

如何正确看待GPT4.5

发布于 2025-3-12 00:22

501浏览

0收藏

总结，模型门户留给GPT5去做了，4.5还是像Altman之前说的就是最后一代纯预训练。

1- 一个超巨大的模型，grok3级别（10万卡），AK说每个0.5要提升10倍预训练算力，那对比GPT4的1.8T, 也就说4.5是一个18T(18000B) 级别的模型，所以必须跨多campus, 异步梯度下降的训练方式(要求太高，这个目前只有grok, oai,gemini,3家真正严格实践过，anthropic都不行)。

2-拥有更多的知识(o3和人类比如博士生做题的合成数据)，比4o能力提升百分之50（其实有些指标翻好几翻，比如奥数）简单问答有明显更少的幻觉，但是复杂问答比如AIME奥数和coding，是无法和o3mini这种模型相比的。更多知识的另一个产物是情商(学习了更多会话场景和话术的识别)，会某些角度更人类化，这个能力增强的是写作和指令跟随范式理解等能力。当然我个人认为想做成4.5演示 demo中的那样光靠知识堆是不够的，RLHF去和人类对齐才是关键，但是由于这模型太大了，SFT和RL都变得很痛苦(后训练是不费算力，但是也得看基座模型有多大🤪)。

3-关于未来: 下一代推理模型o的基石(上一代是4o)，然后，其实本来也是给合成数据用的，内部人用，可是战况太激烈，不得已出来接客了。推理成本过高，即使用speculating decoding, 也很贵，而且draft model估计还在优化中，所以第一期web只给200刀用户使用，下周或者下下周20刀才配，api day1就有，但是，是现在api价格的20倍以上(一般的榜单是测不起了)🐵各种烟雾弹，o3mini也没开源

如何正确看待GPT4.5-AI.x社区

如何正确看待GPT4.5-AI.x社区

如何正确看待GPT4.5-AI.x社区

如何正确看待GPT4.5-AI.x社区

如何正确看待GPT4.5-AI.x社区

本文转载自熵减AI，作者：周博洋

标签

赞

收藏

回复

举报

回复

相关推荐

GPT-4推理能力为0？开发者悬赏1万美金被打脸，神秘提示正确率直冲100%

duhorse • 2256浏览 • 0回复
OpenAI神秘搞事，GPT-4.5默默上线？推理碾压GPT-4网友震惊，奥特曼笑而不语

duhorse • 2142浏览 • 1回复
如何正确使用Stable Diffusion？文本到图像扩散模型中记忆化实用分析（浙大）

angel • 2250浏览 • 0回复
如何通过压缩提示降低GPT-4的成本

51CTO内容精选 • 1566浏览 • 0回复
最强GPT-4o正确率仅55.8%，开源模型不如瞎蒙

duhorse • 1668浏览 • 0回复
理性看待、正确理解AI中的 Scaling “laws”

Baihai_IDP • 1309浏览 • 0回复
国内大模型厂商是如何看待突然的OpenAI o1？跟不跟是个问题！

Syrupup • 1268浏览 • 0回复
VLM训练成本降4.5倍！8B参数媲美GPT-4o mini | 英伟达&MIT等发布NVILA：前沿高效

angel • 1445浏览 • 0回复
如何正确看待 AI 的推理能力？走出人类中心主义

Baihai_IDP • 1391浏览 • 0回复
一文揭秘GPT：AI是如何彻底改变我们的？

唐克 • 621浏览 • 0回复
OpenAI发布GPT-4.5：功能非常特殊，推理很贵

Aceryt • 1856浏览 • 0回复
OpenAI自爆：GPT-4.5 并非前沿模型！奥特曼称OpenAI的GPU已用光，还透露了一个“转型”思路？

51CTO技术栈 • 649浏览 • 0回复
OpenAI GPT-4.5 系统卡片

AIRoobt • 999浏览 • 0回复
GPT‑4.5发布：一款迄今为止最大、最贵的模型

Halo咯咯 • 621浏览 • 0回复
OpenAI 发布GPT-4.5：更大规模、更知识渊博的模型，预训练的巅峰之作，COT升级为COD

Syrupup • 1064浏览 • 0回复
GPT-4.5发布了，参数规模可能在3-5万亿之间，宣称是最好的聊天模型，但有“强弩之末”的感觉

后向传播 • 378浏览 • 0回复
五分钟读懂Manus平替：深度解析OpenManus 如何重新定义Multi Agent?

AI博物院 • 1340浏览 • 0回复
文心一言4.5和X1免费，马上安排实测，来看看效果如何！

NLP工作站 • 219浏览 • 0回复
闲得没事，猜猜GPT-4o如何对图像编码

鲁班模锤1 • 165浏览 • 0回复

这个用户很懒，还没有个人简介

觉得TA不错？点个关注精彩不错过

帖子

声望

粉丝

关注

最近发布

你为什么要用GraphGAG？ 2025-02-27 13:11:25发布
纯研究O1的论文都发出来了，让我想起来研究红楼梦的红学 2025-02-19 09:11:43发布

热门推荐

4090单卡部署满血 671B DeepSeek，本地部署“成本骤降32倍”！！！ 0回复

从推理到编程，详细比较DeepSeek 32B、70B、R1实践性能 0回复

综述：DeepSeek Infra/V1/MoE/V2/V3/R1 & 开源关键技术 0回复

DeepSeek R1 全系列模型部署指南 0回复

解锁Transformer核心！一文吃透自注意力机制 0回复

上一篇：你为什么要用GraphGAG？

社区精华内容

Copyright © 2005-2025 51CTO.COM 京ICP证060544版权所有未经许可请勿转载