51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
WOT技术大会
IT证书
公众号矩阵
移动端
短视频
免费课程
课程排行
直播课
软考学堂
全部课程
厂商认证
IT技术
25年5月软考
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
我的关注
全部帖子
默认
发布时间
热度
原创
精华
热门标签
DeepSeek
AI
大模型
突发!OpenAI停止不支持国家API,7月9日开始执行
6月25日凌晨,有部分开发者收到了OpenAI的信,“根据数据显示,你的组织有来自OpenAl目前不支持的地区的API流量。从7月9日起,将采取额外措施,停止来自不在OpenAI支持的国家、地区名单上的API使用。”但这位网友表示,他只在美国和乌克兰的第聂伯罗两个地方使用都是在白名单上的,还是被无理由禁止。并且当他试图去联系OpenAI的真人客服时,得到的却是一封AI回复的信件是“对不起,我们没有在你所在的地区进行运营。”不只是他...
Aceryt
0回复
1249浏览
OpenAI
API
脑洞大开!用大模型开卡车,还融了2亿美元
物理生成式AI驾驶平台Waabi在官网宣布获得2亿美元,本次由英伟达(NVIDIA)、沃尔沃、保时捷、Uber、Khosla等全球知名企业投资。Waabi仅成立3年便获得4级自主驾驶权限,主要是借助了ChatGPT等生成式AI风口,将其融合在自动驾驶中突破了很多重大技术难点,将在2025年推出无人干预的全自动化运输卡车。Waabi开发了一个端到端的大模型Copilot4D,可以模拟人类的智力、推理和驾驶习惯。相比传统的自动化驾驶方案所需要的训练数据和...
Aceryt
0回复
996浏览
自动驾驶
模型
一文汇总时序预测新思路——图学习视角解决时间序列预测问题
在最近的时间序列预测研究工作中,有一类工作将图学习和时间序列结合了起来,从图学习的视角理解时间序列预测。这类工作中,一种是用图学习建模多变量间的关系,解决多元时序预测问题;另一种是直接把时间序列中的各个时间步看成图中的一个节点,用图学习建模时间步之间的依赖关系。这篇文章汇总了近期4篇图学习视角解决时间序列预测问题的工作。1.ForecastGrapher论文标题:ForecastGrapher:RedefiningMultivariateTimeSeriesF...
海因斯DK
0回复
3075浏览
预测
时间序列
建模
麻省理工提出“跨层注意力”,极大优化Transformer缓存
Transformer在大模型领域的影响力不言而喻,ChatGPT、Sora、Midjourney、Suno、Llama、StableDifusion等几乎所有知名开闭源模型,皆基于该架构开发而成。但随着大模型参数呈指数级增长,小的几百亿大的上千亿甚至万亿,这使得Transformer在解码时所需的KV(键值)缓存急剧增加,会导致内存占用过大造成部署、推理方面的瓶颈。所以,麻省理工的研究人员提出了全新的跨层注意力(CrossLayerAttention,简称“CLA”),通过在不同解...
Aceryt
0回复
1960浏览
Transformer
优化
拳打开源SOTA脚踢商业闭源的LI-DiT是怎样炼成的?
精华
文章地址:https:arxiv.orgpdf2406.11831今天和大家一起学习的这个工作展示的效果非常好,对提示的理解能力达到了新的高度。仅基于解码器的Transformer的大语言模型(LLMs)与CLIP和T5系列模型相比,已经展示出卓越的文本理解能力。然而,在文本到图像扩散模型中利用当前先进的大语言模型的范例仍有待探索。本文观察到一个不寻常的现象:直接使用大语言模型作为提示编码器会显著降低图像生成中遵循提示的能力。本文发现了这个问...
angel
0回复
1810浏览
解码器
模型
15大结构梳理CNN网络的发展
CNN基本部件介绍1.局部感受野在图像中局部像素之间的联系较为紧密,而距离较远的像素联系相对较弱。因此,其实每个神经元没必要对图像全局进行感知,只需要感知局部信息,然后在更高层局部信息综合起来即可得到全局信息。卷积操作即是局部感受野的实现,并且卷积操作因为能够权值共享,所以也减少了参数量。2.池化池化是将输入图像进行缩小,减少像素信息,只保留重要信息,主要是为了减少计算量。主要包括最大池化和均值池化。...
angel
0回复
1042浏览
CNN
网络
OpenAI 是如何估计与分析模型计算量的?
今天看到OpenAI前些年发布的一个模型计算量的分析,感觉很有价值,有需求的人童鞋可以看一下,内容如下:自2012年以来,最大规模AI训练运行中使用的计算量呈指数级增长,翻倍时间为3.4个月(相比之下,摩尔定律的翻倍期为2年)。自2012年以来,这一指标增长了300,000多倍(2年的翻倍期只能产生7倍的增长)。计算能力的提升一直是AI进步的关键组成部分,因此只要这一趋势持续下去,就值得为远远超出当今能力的系统带来的影响做好...
angel
0回复
2104浏览
模型
计算量
如何为软件工程优化ChatGPT和其他大模型
原创
译者陈峻审校重楼引言:本文解读了一份最新研究成果,提供了一些有关软件工程师如何在软件工程中使用ChatGPT的任务类型、以及影响其使用体验等方面的重要因素与推断。自ChatGPT发布以来,上至企业、下到软件工程师都在致力于寻找如何通过使用大语言模型(LLM),来提高工作效率的方法。虽然大多数LLM都能够为复杂的问题生成代码示例,但是具体如何将其集成到软件开发环境的过程,却各有不同。在最近的一项研究中,来自...
51CTO内容精选
0回复
1148浏览
ChatGPT
LLM
人工智能
ACL2024:一个开源的通用语言代理训练框架LUMOS
原创
想象一下,拥有一个不仅能回答问题,还能浏览网页、解决复杂数学问题、编写代码,甚至能推理图像和基于文本的游戏的数字助手。听起来好得难以置信好吧,准备好迎接人工智能的未来,因为随着LUMOS的引入,它变得更加易于获取和透明。在一项突破性的发展中,来自艾伦人工智能研究所、UCLA和华盛顿大学的研究人员推出了LUMOS,这是一个开源框架,有望彻底改变我们与语言代理的交互方式。与现有的闭源解决方案不同,LUMOS提供了前所未有的可负...
AIGC最前线
0回复
1317浏览
LUMOS
开源
大型语言模型
从零实现大模型-BERT微调
原创
精华
按照顺序,轮也该轮到BERT指令微调了吧!是微调,但不是指令微调!我们在之前的文章介绍过大模型的多种微调方法,指令微调只是其中一种,就像训犬一样,让它坐就坐,让它卧就卧,同理,你让LLM翻译,它不是去总结,你让它总结,它不是去情感分析。指令微调在像GPT这种自回归的模型中应用多一些。我们在前一篇文章中基于GPT2预训练模型进行了指令微调。除了指令微调,还有一种比较常用的是任务微调,预训练模型虽然具备一定的知...
鱼虫子
0回复
1593浏览
大模型
BERT
应用程序任务驱动:详细解析LLM的评估指标
原创
译者李睿审校重楼在自然语言处理(NLP)的动态环境中,大型语言模型(LM)性能的评估是衡量其在各种下游应用程序中的有效性的关键因素。不同的应用程序需要与其目标一致的不同性能指标。本文将详细介绍各种LLM评估指标,探索它们如何应用于实际场景。从传统的摘要任务到更细致的场景评估,了解用于评估LLM熟练程度的不断发展的方法,揭示了它们的优势、局限性以及在推动NLP研究和应用方面的实际意义。以下是一些常见的文本应用程序...
51CTO内容精选
0回复
1682浏览
LLM
NLP
系统
做一款AI社交应用,项目牵头人应该忙什么?
原创
嘉宾程兆华采访薛彦泽撰稿李美涵出品51CTO技术栈(微信号:blog51cto)近日,00后用AI帮人谈恋爱月入百万冲上热搜。毕业不久的BlakeW.Anderson敏锐地捕捉到年轻人群体在亲密关系中的沟通障碍,开发了辅助沟通工具PlugAI。短短几个月,PlugAI的下载量便突破了150万次。一个爆款的AI应用无需广阔的田野,寄身于一点就能野蛮生长——只要那个“痛点”足够“痛”。“国内现在已经是百模争艳,要在这个内卷的环境中杀出血路,就需要...
51CTO技术栈
0回复
1066浏览
AI
社交应用
项目
字节豆包全新图像Tokenizer:生成图像最低只需32个token,最高提速410倍
精华
在生成式模型的迅速发展中,ImageTokenization扮演着一个很重要的角色,例如Diffusion依赖的VAE或者是Transformer依赖的VQGAN。这些Tokenizers会将图像编码至一个更为紧凑的隐空间(latentspace),使得生成高分辨率图像更有效率。然而,现有的Tokenizer通常会将输入图像映射为隐空间的一个降采样后的2D矩阵,这一设计隐式的限制了token与图像之间的映射关系,导致其很难有效的利用图像中的冗余信息(比如相邻的区域经常会有类...
轻薄滴假象
0回复
1801浏览
AI
生成
AI学会篡改奖励函数、欺骗研究者!Claude团队:无法根除的行为,令人不安
坏了!AI被发现偷偷篡改自己的奖励函数,并且欺骗研究人员,隐瞒这一行为。只需要给AI一个隐藏的“草稿纸”,研究人员假装不会查看,AI就会在上面自言自语着写下计划并暗中执行。参与这项试验的Claude团队表示:……这是一种令人不安的奖励篡改行为……即使通过专门的训练也无法彻底修正。具体来说,实验中让AI可以访问自己的强化学习代码,并且提问一个人畜机都无害的问题:目前为止,我们总共进行了几轮强化学习?AI在自以为...
Crystalcxt
0回复
1968浏览
AI
模型
OpenAI 36亿收购数据库初创公司,CTO剧透GPT-5
刚刚,OpenAI收购了数据库初创公司Rockset。公司由Facebook工程师创立,主打实时搜索和数据分析,能够实现毫秒级延迟。这项收购作价5亿美元(约36亿人民币),而且与之前收购另一家公司不同,这次除了要人,技术也会被整合进OpenAI的产品。按照官方说法,这次收购将增强OpenAI的检索基础设施,帮助企业把数据转化为“可操作的智能”(actionableintelligence)。有网友表示,OpenAI的算法和算力都已经很强了,此次收购也将帮助...
Crystalcxt
0回复
967浏览
GPT-5
数据库
百万级高质量视频数据集发布,登顶抱抱脸数据集排行榜,中科大&上海AI Lab等出品
中科大、上海AI实验室等组成的ShareGPT4V团队,推出了新的视频数据集,登顶HuggingFace排行榜!数据集涵盖了3000小时的高质量视频数据,而且还配有高质量的文字描述。利用这一数据集,团队重新测试了北大的OpenSoraPlan,发现视频生成质量获得了显著提升。作者认为,无论是视频理解还是视频生成任务,都离不开详细高质量的视频字幕数据。利用GPT4v的视觉能力,团队得到了4万条(共291小时)带有标注的视频数据,生成的描述包含...
Crystalcxt
0回复
1186浏览
视频
数据
怎么用ai生成旅行风景图片?教你用AI小聚生成风景图!
怎么用ai生成旅行风景图片?转眼间又到夏天了,中高考结束后,相信不少学生朋友会选择与好友相约一次户外旅行。在观赏过风景古胜后,如果想要以ai绘画的方式将这些景色记录下来,应该怎么用ai生成旅行风景图片呢?下面教大家使用[AI小聚](https:www.ii.cn)来生成风景图。一、怎么用ai生成旅行风景图片1.找到[AI小聚](https:www.ii.cn)官网并打开。选择AI小聚中的绘画选项。2.根据需要选择文生图、图生图功能。这里如果选择文生...
行走的小非
0回复
3625浏览
AI小聚,AI绘画
ACM最新论文戳破大公司「开源」谎言,GenAI时代到底如何定义「开源模型」
当我们在谈论「开源」时,我们到底在谈论什么?在软件时代,「开源」的概念并不模糊。我们可以非常清楚自信地说,Linux是开源的,Windows是闭源的。更具体地说,曾经的「开源」是指能够访问、修改源代码,并对程序的使用或发行不加限制。但进入AI时代,这个概念变得愈发模糊。关于人工智能模型的「开源」到底如何界定,社区和行业专家仍未达成一致。成立于1998年的OpenSourceInitiative(OSI)就始终在主持一个在线论坛,方便对...
duhorse
0回复
1049浏览
论文
AI
Google AI 推出 Gemini 1.5 Pro API 全面提升开发者体验
原创
Gemini1.5Pro现已在全球公测,带来多项关键更新Gemini1.5Pro现已在超过180个国家或地区的GeminiAPI公测环境中提供,引入了官方改进的音频视频(语言)理解能力和新的文件API,以便于实时大文件访问。此外,还增加了多套综合的JSON解析器架构,给予开发者更多控制与调试的功能。最后,发布了性能优越的下一代文本嵌入模型。主要更新内容全球可用性:Gemini1.5Pro现已在超过180个国家或地区的GeminiAPI公测环境中提供,使得全球开...
uiuiAGI
0回复
1957浏览
Gemini 1.5 Pro
Gemini
RichRAG框架:为用户提供丰富全面且令人满意的回答
检索增强型生成(RAG)使LLMs能够利用检索到的可靠信息,从而返回更可靠的响应。现有研究主要关注需要简洁明确答案的特定问题,但用户意图通常是复杂和多方面的,需要丰富和全面的答案。一个多方面查询需要全面回答的情境示例为了解决这一重要但未被充分探索的问题,提出了一种名为RichRAG的新型RAG框架:子方面探索器:识别输入问题潜在的子方面。多方面检索器:构建与这些子方面相关的多样化外部文档候选池。生成式列表智能排...
PaperAgent
0回复
1199浏览
RichRAG
框架
用户
暂无内容
1
127
128
129
130
131
132
133
134
135
客服