整理伊风出品51CTO技术栈(微信号:blog51cto)3月1日,马斯克再次做客《TheJoeRoganExperience》播客节目,语出惊人!“还有一个更高级的阶段——当AI比所有人类加在一起还要聪明。坦白说,我觉得这个节点可能会出现在2029或2030年,基本上刚好赶上《终结者》的时间线。”而到那时候,我们有80%的概率会获得好的结局。而20%的概率,AI会像《终结者》中的“天网”终结人类文明。上图:马斯克说AI将“走向极端”,它要么会超级好...
编辑言征出品51CTO技术栈(微信号:blog51cto)最近DeepSeek开源周带来了很多惊喜与热议。但小编发现大家对于马斯克的Grok3的讨论却远远不够充分。作为“大模型球赛”的最不可捉摸的强大力量,马斯克的xAI最新模型已经上线,便迅速登顶了iPhone的下载排行榜,引起的轰动同样不可小觑。此外,进入2025之后,大模型的五六个主流玩家都怎么样了?要想突破OpenAI的绝对领先的日活数据,都有哪些突破口?3月2日,硅谷知名投资人BillG...
编辑|言征出品51CTO技术栈(微信号:blog51cto)现代企业中有一个无名英雄:工作流程。它有时被称为规则引擎、流程流、单状态机或软件定义的工作流程。在用户界面(UI)中,它是一个“向导”。开发者通常(有些轻蔑地)称它为“业务逻辑”。各位这里不妨花点时间来欣赏这个无名英雄的独特威严,因为我们即将把硅谷炙手可热的关注之光投向它的门槛:AI代理。关于AI、大型语言模型(LLMs)和代理应用程序已经有很多的讨论,很难...
编辑伊风出品51CTO技术栈(微信号:blog51cto)"GPT4.5并非前沿模型,但它是OpenAI最大的LLM,比GPT4的计算效率提高了10倍以上"。图片这句话就这么水灵灵地出现在GPT4.5官方给的SystemCard(系统卡)中。https:cdn.openai.comgpt45systemcard.pdf从2023年3月14日的GPT4,等了两年,竟然等来一句“不是前沿模型”这么让人失望的话。大了10倍的GPT4.5确实不是卷榜单排名的学霸:编码方面,GPT4.5在编码问题上的得分率为79%...
出品51CTO技术栈(微信号:blog51cto)DeepSeek“开源周”第五天,依旧保持了一如既往地“务实”风,满满的诚意。先来回忆下前四天,源神的慷慨发布——第一天,2月24日,最为外界称道的MLA技术率先开源,这项解码加速器FlashMLA技术能够让英伟达Hopper架构GPU跑得更快,效果更好!紧接着,25日,直接亮出首个面向MoE模型的开源专家并行通信库DeepEP,实现了MoE训练推理的全栈优化;第三天,则进一步祭出一项跨时代的发布:FP8...
好家伙!DeepSeek是真的OpenAI啊!在第四天的开源日中,竟然一口气放出三个重磅的优化并行策略代码库,而且又是V3R1模型中的干货:DualPipe:一种优化的双向流水线并行算法,旨在优化V3R1模型训练中的计算和通信重叠。稍微解释一下,通常在分布式训练中,计算和通信要有两次耗时,而DualPipe通过设计并行算法来处理这两者之间的重叠,可谓是训练界的时间管理大师!https:github.comdeepseekaiDualPipeEPLB(ExpertParall...
DeepSeek今天有两个大新闻:一个是开源了自家用于助力V3R1模型训练与推理的一个FP8通用矩阵乘法(GEMM)加速库,这一块相信不少业内人士会感兴趣,据悉性能高达1350+TFLOPS,进一步揭秘了为什么现在的DeepSeek可以吐字这么流畅,训练和计算成本为什么如此低廉。不过更为让人震惊的,相信还是第二个:DeepSeek原定于要5月初发布的DeepSeekR2,现在正在争取提前甚至尽可能早的发布!这一提前发布R2的消息,是路透社当地时间周二发布...
千呼万唤,特斯拉FSD真的来了!特斯拉已开始在中国向车主分批次推送FSD的软件更新了,版本号2024.45.32.12,与北美版一致。不过,马斯克急急慌慌入华的FSD,槽点好像真的有点多。首先,这波国内FSD的推送需要配备HW4.0硬件的汽车,大概是去年买到国产ModelY和Model3的新车主可以尝鲜。至于其他车主,可能要继续等待一段时间(特斯拉表示会进行车型的扩展)……其次,不是有了车就能体验特斯拉的FSD,还需要再氪金才行!特斯拉所...
整理星璇出品51CTO技术栈(微信号:blog51cto)就在OpenAI还在吊胃口之际,最强竞对Anthropic深夜开大了!Anthropic直接把自家的“通用+推理”二合一的模型发布了,并把自家内部在用的AI编程工具也上线,直接可以终端执行任务的那种!这就带大家看看这家公司在大模型以及AI产品上的不同打法!用户不用再选择模型了,业界首个混合AI模型Anthropic正在发布一款名为Claude3.7Sonnet的新型前沿AI模型,该模型被设计为能够根据用户的...
编辑伊风出品51CTO技术栈(微信号:blog51cto)吴泳铭亲自预告过的,阿里旗舰推理模型,新消息来了。刚刚,它的预览版正式发布和上线体验——就是这个QwQMaxPreview!一眼看去,我愿称之为最萌的推理模型,看blog主页的名称,感觉思维链中的模型正在很努力的思考中……图片QwenChat中已经可以体验预览版模型:https:chat.qwen.ai点进模型的blog,发现这里有一个隐藏彩蛋,内容是由QwQMaxPreview自己写的,我们可以看到A...
黄仁勋首度回应DeepSeek?其实不准确!在采访中黄仁勋主动提及的DeepSeek,亲自下场灭火,并称赞到“(R1是)世界上第一个开源推理模型,这太令人兴奋了,全球对我们开源的反响不可思议”!黄仁勋大胆总结说:(有人说R1出现后)我们不再需要进行任何计算了。实际上,情况正好相反!为啥呢?在老黄看来,未来的AI仍然需要三方面的Scaling:预训练“仍然需要严谨,数据量要大,(还要有)多模态数据”后训练的相关学习范式有很多...
编辑伊风出品51CTO技术栈(微信号:blog51cto)上周五,DeepSeek刚刚预告了重磅开源周!周一一早,DeepSeek就履行承诺,开源了针对HopperGPU的高效MLA解码内核——FlashMLA!图片根据DeepSeek介绍,FlashMLA内核针对变长序列进行了优化,是已投入生产的核心技术。从DeepSeekV2开始,MLA出现在的所有的DeepSeek大模型里面,是DeepSeek大模型提升效果的非常重要的机制。MLA(MatrixLessAttention)多头潜在注意力,通过数学变换避...
编辑伊风出品51CTO技术栈(微信号:blog51cto)年初,DeepSeekR1模型的开源让这个低调的技术品牌一炮打响。随着DeepSeek应用的飞速增长,AI巨头正在集体重新审视开源模式的商业价值——这不再只是“赔本赚吆喝”的事情,而是可能带来实实在在的商业回报。DeepSeek带来的竞争压力肉眼可见,连OpenAI的Altman都罕见地改口反思,承认OpenAI在开闭源问题上“站在了历史错误的一端”。Altman甚至在X上发起了投票,询问大家OpenAI的下...
出品51CTO技术栈(微信号:blog51cto)编辑伊风昨晚,阿里2025财年Q3财报新鲜出炉,同比增长8%,可以说成绩相当亮眼!淘天增收继续加快,阿里云增速重回加速状态,多项核心业务增速达到年内最佳。财报显示:阿里第三季度营收增速创逾一年以来最快,资本开支大增,核心业务加速增长,淘天收入增长加快,阿里云收入重回双位数增长(13%),增幅创约两年以来最大,AI相关产品收入连续六季度保持三位数增长。图片阿里绩后美股盘前拉...
2025-02-21 13:51:35 431浏览 0点赞 0回复 0收藏
梁文锋到底有多低调?你问DeepSeek官网,连自家的产品都整不会“DeepSeek的创始人是谁”这个问题。事情是这样的。小编一位朋友所在的公司近日内部接入了DeepSeek。昨天这位朋友突然找到小编反映:DeepSeek怎么回事,效果这么不好用?紧接着就发了这样两张截图——图片图片朋友问DeepSeek:DeepSeek的创始人是谁?这对话框弹出来的结果真的让人惊掉下巴:第一张截图中,DeepSeek的答案:这是一个虚构的公司或组织!所以更不用提...
2025-02-20 14:54:50 387浏览 0点赞 0回复 0收藏
编辑言征出品51CTO技术栈(微信号:blog51cto)开年,各大科技巨头都被DeepSeek狠狠冲击已经近三周。本周将会迎来各大公司的2024的Q4财报会议。百度率先公开了过去三个月取得的成绩。2月18日晚,李彦宏在百度2024年Q4及全年财报电话会上,一股脑将百度的近况、转型产品、行业判断、未来模型开源、股票回购、利润率等重要事项的看法,全盘托出,信息密度非常之高。大家不妨来看看百度透露了哪些大动作,以及接下来的AI布局和打法...
2025-02-19 15:08:20 391浏览 0点赞 0回复 0收藏
出品51CTO技术栈(微信号:blog51cto)最近,民营企业家座谈会成为关注的焦点。对科技圈来说,科技大佬们是此次座谈会的“主力军”,领域覆盖了AI、新能源、半导体芯片、新能源汽车、机器人等代表新质生产力。座谈会后,雷军在采访中宣布,已经在思考AI技术的终端落地问题了。“我们小米在创业的15年来,一直聚焦在手机、汽车、智能家居、智能制造这些领域。我们要下决心把AI这样的技术怎么能够落地到我们各个终端产品上,能够...
2025-02-19 13:59:26 398浏览 0点赞 0回复 0收藏
出品51CTO技术栈(微信号:blog51cto)编辑伊风、言征跳票多次!Grok3终于来了!此前,DeepSeek创造的破圈奇迹,把硅谷的大模型公司全部笼罩在阴影之下。在Grok3发布前,马斯克也是信心满满地放话出去:Grok3将成为地表最强AI。“我们有信心Grok3会比其他任何AI都强,而且很有可能,再也不会有比Grok(系列)更强的AI了。”上图:马斯克称Grok3是地球最聪明的AI从性能上看,Grok比起现在各家的最强基础模型,是有一定飞跃的。图...
2025-02-18 15:24:12 478浏览 0点赞 0回复 0收藏
出品51CTO技术栈(微信号:blog51cto)编辑伊风每天早上醒来,就等着看今天又可以在哪里用上R1了。昨天还在焦急等待微信“AI搜索”的灰度测试,一转眼,腾讯文档直接用上DeepSeek赋能办公了!腾讯文档的动作很快!小程序、网页版AI全屏页、移动端、桌面端全都可以体验R1的赋能。图片网页端体验地址:https:docs.qq.comdesktopopenAiAssistant1&nlc1在之前,腾讯文档已经有了AI文档助手,而这则用R1的推理能力让AI...
2025-02-17 13:05:02 942浏览 0点赞 0回复 0收藏
编辑言征2天前,就在马斯克宣布要以974亿美元收购OpenAI后,OpenAI工程副总裁斯里尼瓦斯·纳拉亚南(SrinivasNarayanan)接受了华尔街日报的一次线下对话,这次对话同样也是出于一场中美AI博弈的新语境下:DeepSeekR1低成本训练出可以对标OpenAIo1的强推理模型,甚至登顶了应用排行榜,美国现在已经封禁了DeepSeek应用的下载。主持人当然没有放过斯里尼瓦斯,问了他这个非常敏感的问题。那么OpenAI内部究竟是如何看待DeepSeek的...
2025-02-17 07:08:22 323浏览 0点赞 0回复 0收藏