duhorse
LV.6
这个用户很懒,还没有个人简介
声望 1104
关注 0
粉丝 1
私信
主帖 111
回帖
最后一天,DeepSeek开源了全生命周期数据访问引擎FireFlyerFileSystem(3FS),以及基于3FS的数据处理框架Smallpond。3FS(萤火虫文件系统)是一个充分利用现代SSD和RDMA网络带宽的并行文件系统,其特点是:在180节点集群中实现了6.6TiBs的总读取吞吐量在25节点集群的GraySort基准测试中达到了3.66TiBmin的吞吐量每个客户端节点的KVCache查询峰值吞吐量超过40+GiBs采用分离式架构,确保了强一致性全面支持V3R1的训练数据预处理...
3天前 339浏览 0点赞 0回复 0收藏
刚刚,DeepSeek放出了开源第二弹——DeepEP!它拥有高效优化的alltoall通信,并具有以下特点:内部节点和节点间均支持NVLink和RDMA高吞吐量内核用于训练和推理预填充低延迟推理解码内核本地FP8调度支持可灵活控制的GPU资源,用于计算通信重叠具体来说,DeepEP是一个专为混合专家系统(MoE)和专家并行(EP)设计的通信库。它提供高吞吐量和低延迟的GPU全互联内核,也被称为MoE的「调度」和「组合」操作。该库还支持低精度运算,...
6天前 512浏览 0点赞 0回复 0收藏
Replit「Agent」正以迅猛之势,推动着编程行业的深刻变革。Masad于2016年创立了Replit,成立以来一直积极拥抱AI技术,近年来推出了一系列自动化编程产品。回顾Masad近年的言论,会发现「Agent」的实现速度远超他之前的预期。他曾断言「Agent」在2030年之前很难达成。促使这一转变发生的关键因素,是Anthropic推出的新模型:Claude3.5Sonnet。此前,Replit一直专注于构建自有模型,期望凭借专有数据形成独特优势。然而,Claude3....
2025-02-14 12:45:25 367浏览 0点赞 0回复 0收藏
Anthropic终于要开始搞点事情啦!近期的「推理模型」热潮中,Anthropic除了其CEO打了几个嘴炮外,还没有掏出一个拿得出手的产品。在这样下去,可能要退出AI一线模型玩家行列了。Anthropic自己显然不想看到这种情况发生。就在刚刚,有消息称,Anthropic会在未来几周内发布其全新的「混合AI」模型。Anthropic版「推理模型」,测试时计算完全掌控在OpenAI去年秋季发布其「推理模型」后,谷歌以及国内众多AI公司纷纷推出了自己的模...
2025-02-14 12:42:26 883浏览 0点赞 0回复 0收藏
DeepSeek的估值,被曝已达1500亿美元,达到了OpenAI的一半?最近,Bloomberg的这个数据,引起了轩然大波。图片所有人都在问:真的假的?图片此前,外媒福布斯也曾给出一个估值,当时的数字是10亿美元。图片短短几天,估值却已经涨到了150倍?外媒曝光,DeepSeek估值或高达1500亿Bloomberg是这么说的。根据七位初创公司创始人和AI专家的说法,DeepSeek的市值大约在10亿美元到超过1500亿美元不等。根据彭博亿万富翁指数(Bloomber...
2025-02-12 16:02:17 620浏览 0点赞 0回复 0收藏
近年来,随着文本属性图(TAG)在社交媒体、电子商务、推荐系统和学术引用网络等领域的广泛应用,研究人员对如何有效地从这些复杂数据结构中学习变得越来越感兴趣。TAG不仅包含了节点之间的结构关系,还包含了节点本身的文本特征,因此如何同时处理这两种信息成为研究中的一个核心问题。当前,图神经网络(GNN)在TAG学习中得到了广泛的应用,然而其训练过程通常需要大量的人工标注数据,这在实际应用中往往难以获取。大语言模...
2024-08-23 16:08:35 797浏览 0点赞 0回复 0收藏
全球玩家鏖战《黑神话·悟空》!已经有打通关的玩家了,我不羡慕,因为通关后的空虚寂寞马上就会找上你们。开启二周目、三周目的同时,网上已有人用AI让这个神话永不落幕,打开某书就发现网友已经玩得不亦乐乎。让我们的超级英雄去大战西方异形怪物——甚至有人已经提前展望《黑神话》系列的下一部了,看出取景地是祖国大好河山的哪里了吗?更有「慈母」网友让其爱子直接穿越到《黑神话》里,一跃成精——这些都可以通过AI实现...
2024-08-23 16:01:33 900浏览 1点赞 0回复 0收藏
曾经在AI图像生成领域无可匹敌的领导者Midjourney,终于听劝了,上周五推出了网页版图像编辑器。新编辑器巧妙集成了重绘、缩放等核心功能。不仅提高了操作效率,而且使整体交互逻辑更加清晰,对于高频使用Midjourney的用户来说,绝对欣喜!今天,Midjourney宣布,将升级后的新工具向所有人免费开放试用。不论是产品更新,还是发放限时免费试用券,Midjourney似乎都传递出了一种紧迫感——新兴的Flux1强势崛起,表现异常出色;最...
2024-08-23 08:59:44 746浏览 0点赞 0回复 0收藏
最近,提升多模态大模型处理高分辨率图像的能力越来越引起这个领域的关注。绝大多数方法致力于通过对图像进行切分再融合的策略,来提升多模态大模型对图像细节的理解能力。然而,由于对图像的切分操作,不可避免会对目标、联通区域带来割裂,导致MLMMs对于微小或形状不规则的目标的辨识能力。这个现象在文档理解任务中,表现极为明显,由于文字端经常被中断。针对这一挑战,华中科技大学和华南理工大学最近联合发布一个多模态大...
2024-08-13 10:44:42 810浏览 0点赞 0回复 0收藏
​​最近Flux的爆火,简直把所有人的三观都撼动了。​​不懂就问:现在网上的东西,还有什么是真的?Flux震惊全网如今,开源文生图模型Flux,俨然已经在全网掀起了一股风暴。下面这些合影,竟然全是AI生成的?简直把这位博主震惊到怀疑人生。正面特写大光圈,脸部打光、肌肉纹理、毛发,看不出丝毫破绽。注意,即使是背景板人物们,也很自然,挑不出太大毛病。镜头远一点,光线暗一点呢?也很自然。两个人物在光线明暗处的对比...
2024-08-13 09:32:53 908浏览 0点赞 0回复 0收藏
训练一个扩散模型要多少钱?之前最便宜的方法(Wuerstchen)用了28400美元,而像StableDiffusion这样的模型还要再贵一个数量级。大模型时代,一般人根本玩不起。想要各种文生小姐姐,还得靠厂商们负重前行为了降低这庞大的开销,研究者们尝试了各种方案。比如,原始的扩散模型从噪声到图像大约需要1000步,目前已经被减少到20步左右,甚至更少。当扩散模型中的基础模块逐渐由Unet(CNN)替换为DiT(Transformer)之后,一些根据...
2024-08-12 13:59:56 871浏览 0点赞 0回复 0收藏
过去的一周,OpenAI「草莓」项目被炒的热火朝天,把所有人情绪推向了兴奋最高点。在X上,爆料人iruletheworldmo每隔几小时发一次帖,次次几乎与「草莓」相关,甚至暗示这周二就是OpenAI实现第二级AGI的日子。他自称已获得内部消息,并表示全新的GPT4olarge模型将8月13日正式发布。OpenAI草莓项目真正露面还不知哪天,不过,劲敌PerplexityAI已展示了具备「草莓」能力的新模型。或者说,Q已经在PerplexityPro上实现了。今早,CEO...
2024-08-12 13:54:13 724浏览 0点赞 0回复 0收藏
昨天,AndrejKarpathy又发了长推,不过用了一句很有争议的话开头——「RLHF只是勉强的RL」。这条推特可谓「一石激起千层浪」,瞬间点燃了LLM社区的讨论热情。毕竟RLHF作为刚提出没几年的方法,又新颖又有争议。一边遭受质疑,一边又在工业界和学界迅速流行。5G冲浪的LeCun也赶来声援Karpathy,但他的话很短,只有一句——「RLHF不是真正的RL」。RLHF最早可以追溯到OpenAI安全团队2017年发表的论文:论文地址:https:arxiv.orgab...
2024-08-09 13:17:59 690浏览 0点赞 0回复 0收藏
昨天奥特曼率众人搞了一波「草莓暗示」的大阵仗,全网都在翘首以盼OpenAI的惊天大动作。结果今天大家等来的,只是一份安全报告而已……​​今年5月,GPT4o演示一出,立马技惊四座​​。然而,它却一鸽再鸽,等得用户们心都凉了。GPT4o语音功能,为何迟迟不上线?刚刚OpenAI发布的这份红队报告,给我们揭开了谜底——不够安全。在红队测试中,GPT4o的行为怪异,把OpenAI的研究者吓了一大跳。明明是一男一女在对话,GPTo的男声说...
2024-08-09 13:14:18 1142浏览 0点赞 0回复 0收藏
7月26日,智谱发布AI生视频产品「清影」,30秒将任意文图生成视频,并上线在他们的AI助手「智谱清言」上,被誉为是国内首个人人可用的Sora。就在发布6天后,「清影」生成到视频数便已突破了百万量级。今天,智谱AI宣布将与「清影」同源的视频生成模型——CogVideoX正式开源。团队表示,希望每一位开发者、每一家企业都能自由地开发属于自己的视频生成模型,从而推动整个行业的快速迭代与创新发展。打开AI助手「智谱清言」即可体...
2024-08-07 09:35:53 886浏览 0点赞 0回复 0收藏
号称OpenAI二代机器人「Figure02」,真的来了!刚刚,FigureAI终于官宣了第二代人形机器人,完全换了一身新形象——黑色的外观,更加灵活的五指。创始人BrettAdcock表示,「这是『地表最强』的人形机器人」!值得一提的是,Figure02的设计评审耗时18个月完成。据介绍,迭代后的Figure手部具有16个自由度,能够承受与人类相当的力量。现在的它,已经进入宝马车厂开始打工了,可以无休止地狂干20个小时。Figure02还可以与人类直接...
2024-08-07 09:31:40 927浏览 0点赞 0回复 0收藏
大语言模型都卷起来了,模型越做越大,token越来越多,输出越来越长。那么问题来了,如何有效地评估大语言模型的长篇大论呢?要是输出长度长了但胡言乱语输出质量差,又臭又长,岂不是白搭首先能想到的方法就是人工评估。人工评估虽然对于评价模型性能至关重要,但受到主观性、评估者之间的差异性以及广泛评估的高成本的限制。考虑到这些因素,谷歌DeepMind研究团队提出了自动评估解决方案FLAMe。论文地址:https:arxiv.orgabs2...
2024-08-02 13:28:31 812浏览 0点赞 0回复 0收藏
Midjourney几个月前画的饼终于端上来了!他们今天刚刚发布了最新版本v6.1!此次更新总结四个大字:细节狂魔。网友纷纷发推测试最新版本的Midjourney,摄影级画面先睹为快!这张图被取名为《天窗》,构图、色彩、光影、明暗,各方面都极度舒适,湖面波光粼粼细节生动,简直可以直接用来做屏保。继续看一幅风景,曙光拨开云层,远处群山连绵,积雪未消;植被茂密,松树纹理逼真,一片静谧祥和。接着看一组静物,原本需要大量人力...
2024-08-02 13:24:19 1043浏览 0点赞 0回复 0收藏
斯坦福炒虾机器人作者,又出新作了。这次,机器人不是给我们炒饭了,而是给我们做外科手术!最近,约翰霍普金斯和斯坦福大学的研究者们,进行了一项新的探索——著名的医疗机器人达芬奇,是否可以通过模仿学习,来学习外科手术的操作任务呢?经过实验后,他们成功了!组织操作、针头处理和打结这三项基本的手术任务,达芬奇都可以自己独立完成了。首先是需要医学生苦练指法的缝合打结技术,只见达芬奇「飞针走线」,很熟练地就...
2024-07-31 13:42:05 800浏览 0点赞 0回复 0收藏
大数字一向吸引眼球。千亿参数、万卡集群,——还有各大厂商一直在卷的超长上下文。从一开始的几K几十K,发展到了如今的百万token级别。Gemini的最新版本可以接收200万个token作为上下文。这大概相当于140万个单词、2小时视频或者22小时的音频。但不知诸位平时用得着这么长的上下文吗?毕竟100K已经相当于一部比较长的小说了。更重要的是,LLM真的能在这个长度上进行推理吗?近日,有两篇独立研究分别表明:长上下文水分很大!L...
2024-07-23 13:24:34 1276浏览 0点赞 0回复 0收藏
获得成就
已积累 2.9w 人气
获得 1 个点赞
获得 1 次收藏