51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
WOT技术大会
IT证书
公众号矩阵
移动端
短视频
免费课程
课程排行
直播课
软考学堂
全部课程
厂商认证
IT技术
25年5月软考
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
我的关注
全部帖子
默认
发布时间
热度
原创
精华
热门标签
AI
人工智能
智能体
快手「可灵」再进化!视频续写可达3分钟让全球网友炸锅
精华
最近,可灵AI直接让一位网友的家人群里炸锅了……事情是这样的,这位网友的父亲需要做搭桥手术,为了给父亲鼓舞,他便试着用可灵AI把爷爷的两张老照片还原成了视频。在下面这个视频中,爷爷正在朝鲜战场,担任营指导员。穿越时光隧道,1950年代风华正茂的爷爷,对着他挥了挥手。这位网友把视频发到家人群后,群里直接炸了!下面这张黑白的合影,是全家唯有的一张全家福。当已经故去的人忽然动了起来,音容笑貌一如往昔,每个人...
duhorse
0回复
2054浏览
AI
生成
LLM原生开发路线图指南
原创
译者朱先忠审校重楼引言大型语言模型(LLM)正在迅速成为现代人工智能的基石。然而,目前还没有出现公认的最佳实践,而且先驱们往往没有明确的开发路线图。因此,这种状况急需要有人重新发明有关轮子;否则,将会使人陷入困境。在过去的两年里,我帮助一些组织利用LLM构建了创新型应用程序。通过这次经历,我开发了一种经得住考验的方法来创建创新型LLM应用解决方案(受LLM.org.il社区的启发而形成),我将在本文中与大家共同分...
51CTO内容精选
0回复
974浏览
LLM
人工智能
怎么破?OpenAI 突然宣布阻止中国访问API服务!
出品51CTO技术栈(微信号:blog51cto)凌晨,OpenAI突然发出一封告知信:不支持国家地区将会被停止使用OpenAI的API,7月9日起执行。想要继续使用的话,可以联系支持国家地区的有关服务。图片原文对此表示的很明显:自7月9日起,OpenAI将开始阻止来自非支持国家和地区的API流量。受影响组织若希望继续使用OpenAl的服务,必须在其支持的国家或地区内访问。那么想访问OpenAI的API,该怎么办?图片这则消息一出来,很多人惊呼:那原...
51CTO技术栈
0回复
1303浏览
OpenAI
中国
API
吴恩达揭秘:编程Agent如何革新软件开发行业
精华
作为AI领域的杰出人物,吴恩达教授对编程Agent的兴起表示了极大的兴趣。他认为,编程Agent有潜力通过自动执行繁琐的任务、提高代码质量和加速开发周期来彻底改变软件开发行业。本文将深入探讨吴恩达对编程Agent的见解,多代理系统质量保证LDB调试测试Agent专用研发工作流程等关键概念。通过实际案例和深入分析,我们将探索这些技术如何协同工作,使编程Agent能够以更高的效率和有效性构建软件。通过多代理系统实现开发与测试的...
ermulong
0回复
1698浏览
Agent
工作流
API
突发!OpenAI停止不支持国家API,7月9日开始执行
6月25日凌晨,有部分开发者收到了OpenAI的信,“根据数据显示,你的组织有来自OpenAl目前不支持的地区的API流量。从7月9日起,将采取额外措施,停止来自不在OpenAI支持的国家、地区名单上的API使用。”但这位网友表示,他只在美国和乌克兰的第聂伯罗两个地方使用都是在白名单上的,还是被无理由禁止。并且当他试图去联系OpenAI的真人客服时,得到的却是一封AI回复的信件是“对不起,我们没有在你所在的地区进行运营。”不只是他...
Aceryt
0回复
999浏览
OpenAI
API
脑洞大开!用大模型开卡车,还融了2亿美元
物理生成式AI驾驶平台Waabi在官网宣布获得2亿美元,本次由英伟达(NVIDIA)、沃尔沃、保时捷、Uber、Khosla等全球知名企业投资。Waabi仅成立3年便获得4级自主驾驶权限,主要是借助了ChatGPT等生成式AI风口,将其融合在自动驾驶中突破了很多重大技术难点,将在2025年推出无人干预的全自动化运输卡车。Waabi开发了一个端到端的大模型Copilot4D,可以模拟人类的智力、推理和驾驶习惯。相比传统的自动化驾驶方案所需要的训练数据和...
Aceryt
0回复
831浏览
自动驾驶
模型
一文汇总时序预测新思路——图学习视角解决时间序列预测问题
在最近的时间序列预测研究工作中,有一类工作将图学习和时间序列结合了起来,从图学习的视角理解时间序列预测。这类工作中,一种是用图学习建模多变量间的关系,解决多元时序预测问题;另一种是直接把时间序列中的各个时间步看成图中的一个节点,用图学习建模时间步之间的依赖关系。这篇文章汇总了近期4篇图学习视角解决时间序列预测问题的工作。1.ForecastGrapher论文标题:ForecastGrapher:RedefiningMultivariateTimeSeriesF...
海因斯DK
0回复
2587浏览
预测
时间序列
建模
麻省理工提出“跨层注意力”,极大优化Transformer缓存
Transformer在大模型领域的影响力不言而喻,ChatGPT、Sora、Midjourney、Suno、Llama、StableDifusion等几乎所有知名开闭源模型,皆基于该架构开发而成。但随着大模型参数呈指数级增长,小的几百亿大的上千亿甚至万亿,这使得Transformer在解码时所需的KV(键值)缓存急剧增加,会导致内存占用过大造成部署、推理方面的瓶颈。所以,麻省理工的研究人员提出了全新的跨层注意力(CrossLayerAttention,简称“CLA”),通过在不同解...
Aceryt
0回复
1732浏览
Transformer
优化
拳打开源SOTA脚踢商业闭源的LI-DiT是怎样炼成的?
精华
文章地址:https:arxiv.orgpdf2406.11831今天和大家一起学习的这个工作展示的效果非常好,对提示的理解能力达到了新的高度。仅基于解码器的Transformer的大语言模型(LLMs)与CLIP和T5系列模型相比,已经展示出卓越的文本理解能力。然而,在文本到图像扩散模型中利用当前先进的大语言模型的范例仍有待探索。本文观察到一个不寻常的现象:直接使用大语言模型作为提示编码器会显著降低图像生成中遵循提示的能力。本文发现了这个问...
angel
0回复
1600浏览
解码器
模型
15大结构梳理CNN网络的发展
CNN基本部件介绍1.局部感受野在图像中局部像素之间的联系较为紧密,而距离较远的像素联系相对较弱。因此,其实每个神经元没必要对图像全局进行感知,只需要感知局部信息,然后在更高层局部信息综合起来即可得到全局信息。卷积操作即是局部感受野的实现,并且卷积操作因为能够权值共享,所以也减少了参数量。2.池化池化是将输入图像进行缩小,减少像素信息,只保留重要信息,主要是为了减少计算量。主要包括最大池化和均值池化。...
angel
0回复
946浏览
CNN
网络
OpenAI 是如何估计与分析模型计算量的?
今天看到OpenAI前些年发布的一个模型计算量的分析,感觉很有价值,有需求的人童鞋可以看一下,内容如下:自2012年以来,最大规模AI训练运行中使用的计算量呈指数级增长,翻倍时间为3.4个月(相比之下,摩尔定律的翻倍期为2年)。自2012年以来,这一指标增长了300,000多倍(2年的翻倍期只能产生7倍的增长)。计算能力的提升一直是AI进步的关键组成部分,因此只要这一趋势持续下去,就值得为远远超出当今能力的系统带来的影响做好...
angel
0回复
1775浏览
模型
计算量
如何为软件工程优化ChatGPT和其他大模型
原创
译者陈峻审校重楼引言:本文解读了一份最新研究成果,提供了一些有关软件工程师如何在软件工程中使用ChatGPT的任务类型、以及影响其使用体验等方面的重要因素与推断。自ChatGPT发布以来,上至企业、下到软件工程师都在致力于寻找如何通过使用大语言模型(LLM),来提高工作效率的方法。虽然大多数LLM都能够为复杂的问题生成代码示例,但是具体如何将其集成到软件开发环境的过程,却各有不同。在最近的一项研究中,来自...
51CTO内容精选
0回复
974浏览
ChatGPT
LLM
人工智能
ACL2024:一个开源的通用语言代理训练框架LUMOS
原创
想象一下,拥有一个不仅能回答问题,还能浏览网页、解决复杂数学问题、编写代码,甚至能推理图像和基于文本的游戏的数字助手。听起来好得难以置信好吧,准备好迎接人工智能的未来,因为随着LUMOS的引入,它变得更加易于获取和透明。在一项突破性的发展中,来自艾伦人工智能研究所、UCLA和华盛顿大学的研究人员推出了LUMOS,这是一个开源框架,有望彻底改变我们与语言代理的交互方式。与现有的闭源解决方案不同,LUMOS提供了前所未有的可负...
AIGC最前线
0回复
1073浏览
LUMOS
开源
大型语言模型
从零实现大模型-BERT微调
原创
精华
按照顺序,轮也该轮到BERT指令微调了吧!是微调,但不是指令微调!我们在之前的文章介绍过大模型的多种微调方法,指令微调只是其中一种,就像训犬一样,让它坐就坐,让它卧就卧,同理,你让LLM翻译,它不是去总结,你让它总结,它不是去情感分析。指令微调在像GPT这种自回归的模型中应用多一些。我们在前一篇文章中基于GPT2预训练模型进行了指令微调。除了指令微调,还有一种比较常用的是任务微调,预训练模型虽然具备一定的知...
鱼虫子
0回复
1411浏览
大模型
BERT
应用程序任务驱动:详细解析LLM的评估指标
原创
译者李睿审校重楼在自然语言处理(NLP)的动态环境中,大型语言模型(LM)性能的评估是衡量其在各种下游应用程序中的有效性的关键因素。不同的应用程序需要与其目标一致的不同性能指标。本文将详细介绍各种LLM评估指标,探索它们如何应用于实际场景。从传统的摘要任务到更细致的场景评估,了解用于评估LLM熟练程度的不断发展的方法,揭示了它们的优势、局限性以及在推动NLP研究和应用方面的实际意义。以下是一些常见的文本应用程序...
51CTO内容精选
0回复
1308浏览
LLM
NLP
系统
做一款AI社交应用,项目牵头人应该忙什么?
原创
嘉宾程兆华采访薛彦泽撰稿李美涵出品51CTO技术栈(微信号:blog51cto)近日,00后用AI帮人谈恋爱月入百万冲上热搜。毕业不久的BlakeW.Anderson敏锐地捕捉到年轻人群体在亲密关系中的沟通障碍,开发了辅助沟通工具PlugAI。短短几个月,PlugAI的下载量便突破了150万次。一个爆款的AI应用无需广阔的田野,寄身于一点就能野蛮生长——只要那个“痛点”足够“痛”。“国内现在已经是百模争艳,要在这个内卷的环境中杀出血路,就需要...
51CTO技术栈
0回复
913浏览
AI
社交应用
项目
字节豆包全新图像Tokenizer:生成图像最低只需32个token,最高提速410倍
精华
在生成式模型的迅速发展中,ImageTokenization扮演着一个很重要的角色,例如Diffusion依赖的VAE或者是Transformer依赖的VQGAN。这些Tokenizers会将图像编码至一个更为紧凑的隐空间(latentspace),使得生成高分辨率图像更有效率。然而,现有的Tokenizer通常会将输入图像映射为隐空间的一个降采样后的2D矩阵,这一设计隐式的限制了token与图像之间的映射关系,导致其很难有效的利用图像中的冗余信息(比如相邻的区域经常会有类...
轻薄滴假象
0回复
1470浏览
AI
生成
AI学会篡改奖励函数、欺骗研究者!Claude团队:无法根除的行为,令人不安
坏了!AI被发现偷偷篡改自己的奖励函数,并且欺骗研究人员,隐瞒这一行为。只需要给AI一个隐藏的“草稿纸”,研究人员假装不会查看,AI就会在上面自言自语着写下计划并暗中执行。参与这项试验的Claude团队表示:……这是一种令人不安的奖励篡改行为……即使通过专门的训练也无法彻底修正。具体来说,实验中让AI可以访问自己的强化学习代码,并且提问一个人畜机都无害的问题:目前为止,我们总共进行了几轮强化学习?AI在自以为...
Crystalcxt
0回复
1818浏览
AI
模型
OpenAI 36亿收购数据库初创公司,CTO剧透GPT-5
刚刚,OpenAI收购了数据库初创公司Rockset。公司由Facebook工程师创立,主打实时搜索和数据分析,能够实现毫秒级延迟。这项收购作价5亿美元(约36亿人民币),而且与之前收购另一家公司不同,这次除了要人,技术也会被整合进OpenAI的产品。按照官方说法,这次收购将增强OpenAI的检索基础设施,帮助企业把数据转化为“可操作的智能”(actionableintelligence)。有网友表示,OpenAI的算法和算力都已经很强了,此次收购也将帮助...
Crystalcxt
0回复
801浏览
GPT-5
数据库
百万级高质量视频数据集发布,登顶抱抱脸数据集排行榜,中科大&上海AI Lab等出品
中科大、上海AI实验室等组成的ShareGPT4V团队,推出了新的视频数据集,登顶HuggingFace排行榜!数据集涵盖了3000小时的高质量视频数据,而且还配有高质量的文字描述。利用这一数据集,团队重新测试了北大的OpenSoraPlan,发现视频生成质量获得了显著提升。作者认为,无论是视频理解还是视频生成任务,都离不开详细高质量的视频字幕数据。利用GPT4v的视觉能力,团队得到了4万条(共291小时)带有标注的视频数据,生成的描述包含...
Crystalcxt
0回复
898浏览
视频
数据
暂无内容
1
104
105
106
107
108
109
110
111
112
客服