chengganfei
LV.2
这个用户很懒,还没有个人简介
声望 143
关注 0
粉丝 0
私信
主帖 13
回帖
​标题:UBMesh:aHierarchicallyLocalizednDFullMeshDatacenterNetworkArchitecture作者:HengLiao,BingyangLiu,XianpingChen,ZhigangGuo,ChuanningCheng,JianbingWang,XiangyuChen,PengDong,RuiMeng,WenjieLiu,ZheZhou,ZiyangZhang,YuhangGai,CunleQian,YiXiong,ZhongwuCheng,JingXia,YuliMa,XiChen,WenhuaDu,ShizhongXiao,ChungangLi,YongQin,LiudongXiong,ZhouYu,LvChen,LeiChen,BuyunWang,PeiWu,JunenGao,XiaochuLi,JianHe,...
3天前 878浏览 0点赞 0回复 0收藏
​题目:FrontiersofAIandComputing:AConversationWithYannLeCunandBillDally谈话人:BillDally,ChiefScientistandSVPofResearch,NVIDIAYannLeCun,ChiefAIScientistatMeta,ProfessoratNewYorkUniversity时间:March2025(GTC2025)核心观点1.AI发展方向BillDallyAI在过去十年取得显著进展,尤其得益于计算能力的提升,如GPU性能从Kepler到Blackwell增长5000至10000倍。AI未来需关注训练与推理的权衡,强大模型需更多训练资源,较...
3天前 420浏览 0点赞 0回复 0收藏
​核心观点1.HPCAI市场的快速增长与不确定性并存2024年HPCAI市场展现出强劲增长势头,超大规模AI基础设施投资翻倍,ElCapitan等超算项目的突破标志技术进步。然而,AI热潮可能对传统HPC构成挤压风险,同时存在泡沫破裂的担忧。2.超大规模AI主导市场,传统HPC面临转型压力超大规模AI市场预计从2022年的约5万单位增长至2028年的25万单位,远超本地部署HPCAI(2028年约5万单位),显示其主导地位。云化趋势可能压缩本地HPCAI市场,...
2025-03-18 08:48:31 610浏览 0点赞 0回复 0收藏
预计到2028年,AI的应用将促使企业数据存储需求呈现指数级增长态势。根据我们于2024年11月开展的一项调查显示,在主要依赖云存储管理AI数据的基础设施采购决策者中,61%的受访者预计其存储需求到2028年将至少实现翻番。驱动这一需求增长的关键因素包括:数据保留周期的显著延长(从6个月延长至永久保存);73%的受访者表示,他们采用了每日或每周一次的大型语言模型(LLM)检查点机制80%的受访者认为数据多副本对于AI数据管理“...
2025-03-06 09:58:57 943浏览 0点赞 0回复 0收藏
人们——此处特指“华尔街”及个人投资者——时常怀有非理性的预期。这一现象正发生在仍被我们称为Google的公司身上,毕竟Alphabet仅为一家控股公司,主要持有Google的股份。昨晚市场收盘后,Google携手AMD公布了2024年第四季度的财务业绩,但华尔街对这两家公司合理增长及盈利状况并不买账。并非所有公司都能如NVIDIA在过去一年半中所享有的那般财务表现,即便身为NVIDIA的强大合作伙伴,Google亦是如此。(Google有自研的TPU...
2025-02-08 14:08:54 1377浏览 0点赞 0回复 0收藏
​随着各行业企业为2025年的AI投资和战略布局做准备,我们总结了企业在未来一年的核心关注点:基础设施将成为最紧迫的投资领域,企业将重点构建AI代理(AIagents)和AI系统。企业将聚焦于数据优势(dataadvantage),以通过AI获取竞争优势。AI培训将致力于推动员工行为变革,促进AI的广泛采用,并构建“人类参与”流程(humanintheloopprocesses)。AI将继续成为2025年每位业务领导者战略计划的核心。根据最新调查显示,70%的企...
2025-01-15 12:04:53 1257浏览 0点赞 0回复 0收藏
​数据驱动的AI变革:AI的普及推动了存储系统从单纯追求性能向企业级综合能力(包括数据管理、效率、韧性等)转变,并凸显了高质量数据和有效数据治理对AI战略成功至关重要的作用。高性能对象存储崛起:对象存储正通过技术创新,突破传统应用边界,向高性能计算领域(尤其是AI和数据分析)拓展,并有望挑战并行文件系统的主导地位。AI驱动混合云智能化升级:企业级AI工作负载的需求推动混合云从资源整合向更智能的集成和优化演...
2025-01-07 11:34:39 1695浏览 0点赞 0回复 0收藏
​关键洞察AI驱动存储转型:AI的需求推动了对象存储成为企业存储的主导技术,尤其是对于大规模数据处理和并行计算工作负载,尤其是在AI模型训练、推理及数据湖仓存储中。对象存储的普及:超过70%的云原生数据已存储在对象存储中,预计两年内这一比例将增至75%。对象存储因其性能、扩展性、安全性等特点,成为支持AI工作负载的首选技术。AI工作负载对存储的需求:AI(尤其是生成式AI)对存储性能和规模提出更高要求,对象存储能...
2024-12-27 13:51:29 1487浏览 0点赞 0回复 0收藏
会议:NeurIPS2024时间:December14,2024发言人:IlyaSutskever主题:SequencetoSequenceLearningwithNeuralNetworks:WhataDecade​IlyaSutskever是论文《基于神经网络的序列到序列学习》(SequencetoSequenceLearningwithNeuralNetworks)的第一作者。该论文荣获了NeurIPS2024的“TestofTime”论文奖。该奖项旨在表彰在2014年NeurIPS会议上发表、对研究领域产生了重大影响并经得起时间考验的论文。自发布以来,该论文已被引用...
2024-12-18 12:08:04 2092浏览 0点赞 0回复 0收藏
TeslaDojoTesla自研的D1芯片采用7纳米制程,包含354个核心,每个核心拥有1.25MBSRAM,支持多种数据格式。单芯片计算能力达362TFLOPS,专为自动驾驶AI并行计算优化。DojoV1系统包含6个训练模块,共5.31万个核心,运算能力为1exaflops;完整ExaPod系统扩展至120个模块,106.2万个核心,目标运算能力为20exaflops。每个训练模块提供9petaflops计算能力,配备高带宽内存,单模块功耗15千瓦。采用水冷设计,内存带宽达400GBs(读取)...
2024-11-29 15:04:03 1455浏览 0点赞 0回复 0收藏
生成式AI的挑战数据准备和管理:生成式AI的训练需要整合分散在多个系统中的数据,数据格式复杂,常包含缺失值和噪声,影响模型的训练效果。企业需高效收集、清洗、转换这些数据,并且要满足大规模数据处理和高速存储需求。同时,必须确保数据的安全和隐私合规。模型训练和部署:训练生成式AI模型需要大量计算资源和长时间的训练,硬件成本高且训练周期长。选择合适的模型架构和超参数至关重要,并且需要有效的版本控制来管理多...
2024-11-22 11:57:57 1408浏览 0点赞 0回复 0收藏
数据加载过程与性能优化数据加载的复杂性数据加载并不仅限于从存储读取数据,它涵盖了解码、格式转换及数据增强等预处理环节。这些步骤通常在CPU上执行,目的是将原始数据转换为GPU可处理的张量格式。数据加载的步骤数据加载流程可以概括为:​从存储系统读取数据到系统内存。解码原始数据。应用数据变换和增强操作(如裁剪、尺寸调整)。将处理后的数据传输至GPU。​预取器的作用预取器显著提升数据加载效率,它在模型训练需要...
2024-11-15 16:34:05 3176浏览 0点赞 0回复 0收藏
FASTFLOW:FlexibleAdaptiveCongestionControlforHighPerformanceDatacentersFASTFLOW:针对高性能数据中心的灵活自适应拥塞控制​​https:arxiv.orgabs2404.01630​​发表时间:2024年9月20日一、问题背景现代数据中心,特别是运行大规模AI训练和HPC应用的数据中心,对网络性能的要求越来越高。这些工作负载通常会产生突发性的、同步的流量,对传统的拥塞控制算法提出了挑战。现有拥塞控制算法的不足:基于延迟的算法:如Swift...
2024-11-11 17:01:38 2156浏览 0点赞 0回复 0收藏
获得成就
已积累 4083 人气
获得 0 个点赞
获得 0 次收藏