51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
WOT技术大会
IT证书
公众号矩阵
移动端
短视频
免费课程
课程排行
直播课
软考学堂
全部课程
厂商认证
IT技术
25年5月软考
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
我的关注
全部帖子
默认
发布时间
热度
原创
精华
热门标签
AI
模型
人工智能
视觉任务大一统!图像生成,编辑,翻译三合一!全能视觉助手PixWizard来袭!
精华
文章链接:https:arxiv.orgpdf2409.15278github链接:https:github.comAFengxPixWizard亮点直击任务统一:针对视觉任务的多样性,本项目基于生成框架将多种任务转化为图像到图像的翻译问题,并通过后处理将生成的可视化效果转化为所需格式,从而简化表示形式的挑战。数据构建:构建了一个包含3000万条数据的全面训练集,主要支持图像生成、编辑、修复、定位和密集预测等五大功能,旨在整合视觉领域的任务和数据多样性。架构设计...
angel
0回复
1050浏览
模型
架构
#AIGC创新先锋者征文大赛# 部署 LLMs 前如何计算与优化 GPU 内存需求?
原创
精华
【本文正在参与AI.x社区AIGC创新先锋者征文大赛】https:www.51cto.comaigc2223.html编者按:想要部署大语言模型(LLMs),却不知该如何估算所需的GPU内存?在项目预算有限的情况下,是否曾因为GPU内存估算不准而导致资源浪费或性能不足?这些问题不仅影响项目进度,还可能直接导致成本超支或服务质量下降。本文作者凭借丰富的LLM部署经验,深入剖析了GPU内存需求的计算方法。从模型参数到KV缓存,从激活值到系...
Baihai_IDP
0回复
830浏览
AI
LLMs
GPU
从秒级到小时级:TikTok等发布首篇面向长视频理解的多模态大语言模型全面综述
精华
文章链接:https:arxiv.orgpdf2409.18938亮点直击追踪并总结从图像理解到长视频理解的MMLLMs的进展;回顾了各种视觉理解任务之间的差异,并强调了长视频理解中的挑战,包括更细粒度的时空细节、动态事件和长期依赖性;详细总结了MMLLMs在理解长视频方面的模型设计和训练方法的进展;比较了现有MMLLMs在不同长度视频理解基准上的表现,并讨论了MMLLMs在长视频理解中的潜在未来方向。将大语言模型(LLMs)与视觉编码器的集成最近在视...
angel
0回复
1982浏览
模型
训练
学习大模型开发,需要具备人工智能或深度学习理论基础吗?
原创
“学以致用,问题才是学习的真正驱动力”最近发表了几篇关于学习人工智能技术的文章,然后就有人问没有深度学习的基础可以学习人工智能吗?答案是肯定的,学习人工智能技术并不一定非要懂得深度学习,虽然深度学习是大模型的基础。怎么学习大模型?很多人学习大模型技术,第一步就卡在了入门上,也就是说不知道应该怎么学习人工智能技术。可能在很多人的认知中,学习人工智能就要学习机器学习和深度学习,面对着复杂的机器学习...
AI探索时代
0回复
546浏览
大模型
人工智能的三个阶段计算智能,感知智能和认知智能
原创
“人工智能技术的发展是一个蜿蜒曲折的道路”人工智能技术是一项复杂的系统性工程,而且更多时候它只是一个概念性的技术;没有有人知道人工智能应该是什么样,也没有人知道应该怎么才能实现人工智能。所以,人工智能技术经过几十年的发展,一直是在蜿蜒曲折的前进;所以,研究者们就根据人工智能技术发展的现状以及对其未来的期望总结了人工智能技术发展的几个阶段。而现在的人工智能技术即将要进入认知智能阶段。人工智能技术...
AI探索时代
0回复
1224浏览
人工智能
AI教父辛顿获得诺贝尔物理奖采访内幕流出:“我怎么确定这不是一个欺骗电话?”
原创
社区头条
整理言征10月8日晚间,2024年诺贝尔物理学奖得主公布,名单非常令人惊讶,两位得主JohnHopfield(约翰·霍普菲尔德)、GeoffreyHinton(杰弗里·辛顿),并非是发现了类似相对论、量子力学等惊世的物理学规律,而是因为对于AI的基础性贡献。不要说大众觉得很“诡异”,就连辛顿本人接到通知电话时也觉得是诈骗。凌晨的时候,辛顿在加利福尼亚州的一家酒店房间里接到了来自瑞典斯德哥尔摩的电话,他第一时间想到的是:我怎么确定...
51CTO技术栈
0回复
1054浏览
AI教父
诺贝尔
物理奖
神经网络与2024诺贝尔物理奖
原创
约翰·霍普菲尔德(JohnJ.Hopfield)和杰弗里·辛顿(GeoffreyE.Hinton)周二被授予诺贝尔物理学奖(NobelPhysicsPrize),以表彰他们的发现帮助计算机以人脑的方式学习更多知识,为人工智能的发展奠定了基础。该奖项是对AI在人们生活和工作方式中日益增长的重要性的认可。诺贝尔委员会表示,使用人工神经网络的机器学习能够理解大量数据,已经在科学研究中发挥了重要作用,包括在物理学领域,它被用于创造“具有特定特性的新材...
鲁班模锤1
0回复
631浏览
神经网络
诺贝尔
物理奖
优化文本嵌入,大幅提升RAG检索速度
社区头条
1简介文本嵌入技术能够将文字信息转换成高维向量表示的数字,提供了一种理解和处理文本数据的新方式,帮助我们更好地理解和处理文本数据。这些向量,也就是数字数组,能够捕捉文本的深层特征,进而支持多种应用。比如理解语义、进行文本分类、聚类、信息检索,甚至优化搜索结果排序等。传统上,嵌入向量的维度是固定的,通常取2的幂次方,大小介于64到4096之间。现在,有了套娃嵌入技术,我们可以根据不同的应用需求,灵活调整...
小虎哦哦
0回复
646浏览
RAG
检索
LLM
大语言模型评估基准数据泄露问题分析报告
1.研究背景与动机近年来,大语言模型(LargeLanguageModels,LLMs)在人工智能领域取得了巨大的进展。为了评估这些模型的能力,研究人员开发了许多评估基准。然而,随着这些基准的广泛使用,人们对其适当性和公平性产生了越来越多的担忧。本研究的主要动机包括:评估基准的重要性:评估基准是衡量LLMs能力的关键工具,对于理解模型进展至关重要。数据泄露问题:在准备预训练数据时,可能无意中包含了未来评估数据集的相关内容,...
芝士AI吃鱼
0回复
951浏览
语言模型
数据
泄露
探索阿里通义千问 Qwen2.5:新一代开源大模型的卓越力量
社区头条
在人工智能领域的快速发展进程中,阿里通义千问的Qwen2.5模型以其强大的性能和广泛的应用潜力,成为了备受关注的焦点。2024云栖大会上的发布,更是让Qwen2.5走进了更多开发者和研究者的视野。本文将深入探讨Qwen2.5的各项技术特点和优势。一、总体概述Qwen2.5全系列涵盖了多个尺寸的大语言模型、多模态模型、数学模型和代码模型。这种全面的模型体系,为不同领域的应用提供了强大的支持。无论是自然语言处理任务中的文本生成、...
穿越时空111
0回复
1965浏览
阿里
通义千问
Qwen2.5
卷疯了!开源社区离Openai o1越来越近~
小长假结束了本来打算梳理一下假期的信息的,但是内容有点多,放弃了今天这个标题对应假期的2个新闻。思科的大佬,假期发了一篇medium博客,使用2个复杂数据集,进行了一系列模型的基准测试。Blog:https:medium.comharishhacker3010canwemakeanysmalleropensourceaimodelssmarterthanhuman1ea507e644a0Prompt:https:gist.github.comphilschmid34747bf5bc8280f3a5f10f5fd8d1cd4bGithub:https:github.comharishsg993010LLMResearc...
NLP前沿1
0回复
827浏览
openai
o1
闭源
为什么将RAG扩展到生产环境如此困难?
将RAG扩展到生产环境是一项复杂的挑战,需要考虑多个方面,本文将深入探讨这些挑战,并提供解决方案。RAG如何演变?RAG(RetrievalAugmentedGeneration,检索增强生成)是一种技术,通过为大型语言模型(LLM)提供额外的上下文信息,使其能够生成更准确、更具体的响应。LLM在公开数据上进行训练,本身非常智能,但由于缺乏特定领域知识,无法回答特定问题。RAG通过提供必要的上下文信息,帮助LLM正确回答查询。RAG是向LLM注入新...
丢翅膀的鱼
0回复
536浏览
RAG
多模态
LLM
OpenAI重磅发布交互界面canvas,让ChatGPT成为编程和写作利器
原创
1、写作和编程利器canvas今晨,OpenAI推出了类似AnthropicArtifacts的应用—canvas,宣称其为“ChatGPT写作和编程的新手段”。在canvas这个界面,你可以与ChatGPT一起完成写作和编码项目,而不再局限于简单的聊天。canvas是一种新的交互方式,也是OpenAI推出ChatGPT以来的首个重大视觉界面更新。canvas会在单独的窗口中打开,方便用户与ChatGPT一起协作完成项目。canvas的Beta版本为用户提供了一种全新的合作方式:你不仅能够通...
玄姐聊AGI
0回复
670浏览
canvas
ChatGPT
Cursor 实用技巧指南
原创
1、技巧一:明确表述需求问:如何更准确地改写功能需求以适应Cursor的使用?原因:Cursor的设计旨在精确执行用户的具体指令。过多的细节可能导致执行复杂化,而过于模糊的描述则可能让Cursor在执行时缺乏必要的指导,影响项目的精准控制。操作步骤:精确阐述需求,剔除无关的细枝末节。避免在需求中使用含糊其辞的词语(比如“上传”),除非它们对功能实现至关重要。示例:不够明确:“开发一个文件处理功能,涵盖上传和下载操...
玄姐聊AGI
0回复
967浏览
Cursor
人人都是音乐家!中科大&科大讯飞重磅开源OpenMusic:音乐生成更高质量,更有乐感
精华
文章链接:https:arxiv.orgpdf2405.15863代码链接:https:github.comivcylcqamdtHuggingface链接:https:huggingface.cospacesjadechoghariOpenMusicDemo链接:https:qamdt.github.io(chatgpt30,musiccaps30)亮点直击提出了一种质量感知训练范式,使模型在训练过程中能够感知数据集的质量,从而在音乐性(美学角度)和音频质量方面实现卓越的音乐生成效果。创新性地将masked扩散Transformer引入到音乐信号中,展示了其在建模...
angel
0回复
1481浏览
音乐
生成
关于大模型在企业生产环境中的独立部署问题
原创
“大模型产品的技术复杂度远远超出你的想象”最近一段时间公司在搞AIGC领域的产品,虽然集成了很多第三方的大模型服务接口,但从节省成本的角度,公司也找了一部分具有相似效果的开源模型做独立部署。但在做模型独立部署方面面对着各种各样的问题,而且环境极不稳定,因此就引发了关于大模型企业级应用中的环境部署和运维的问题。关于大模型在企业生产中的部署问题首先抛开成本问题从技术的角度来说,小公司独立部署大模型会很...
AI探索时代
0回复
879浏览
大模型
从检索增强——RAG看检索技术的发展
原创
“检索,一种世界性的难题”检索技术或者说搜索技术(虽然检索与搜索有一定的区别)一直是一个世界级的难题,检索技术可以说从人类出现就已经开始了;只不过那时的检索不叫检索,叫找东西,只不过到二十一世纪之后,随着互联网技术的发展,数据检索成为了一个重要手段。而今天我们就来谈谈检索技术。检索为什么标题是从RAG看检索技术?RAG技术是在之前的文章中不只一次的介绍过,RAG是大模型技术的补充,大模型的表现在某种程度上...
AI探索时代
0回复
593浏览
RAG
大模型
不要上来就大模型,从训练一个小模型开始
原创
“从训练一个小模型开始,大模型太复杂小模型刚刚好”有句老话叫眼高手低,最近发现有些人就是眼高手低的现实案例,在什么都不懂的情况下就想搞大模型,小模型还看不上。但其实最好的方式是从一个小模型开始,至于原因就是因为小模型相对比较简单一点,其次就是硬件要求较低,普通人能够玩的转。从小模型开始为什么建议大家从小模型开始,特别是一些开源小模型?之所以建议大家刚开始以小模型为主,原因就是因为从技术原理来说...
AI探索时代
0回复
761浏览
大模型
小模型
什么是具身智能模型,它和普通大模型有什么区别?
原创
社区头条
“具身智能,一种把大模型应用到工业生产的技术”随着大模型技术的发展,大模型的发展方向也逐渐变得明朗,比如AIGC,AI代理等;而最近学习到了一个新的概念——具身智能,虽然并不是第一次听说这个词,但一直以为它只是大模型技术的一种实现方式,但到最近才发现具身只能和大模型是不一样的两种东西。而且,具身智能可以说是大模型的上层应用,其发展方向也更加广阔;那么我们就来一起了解一下什么是具身智能。具身智能从定义...
AI探索时代
0回复
931浏览
具身智能
大模型
微调谷歌开源Gemini Flash模型实现PII脱敏实战
原创
社区头条
本文将通过具体的实战代码示例来探索谷歌开源GeminiFlash模型的学习曲线和采样效率。在大多数常见的机器学习和自然语言处理中,实现最佳性能通常需要在用于训练的数据量和由此产生的模型准确性之间进行权衡。本文中,我们将以PII(个人识别信息)脱敏算法数据集为例,探讨使用微调谷歌GeminiFlash模型的情况下样本效率的概念。我们将研究随着样本数量的增加而进行的微调如何影响调整后的模型的功能。何谓样本效率,为什么它很重...
51CTO内容精选
0回复
723浏览
机器学习
LLM模型
Gemini Flash
暂无内容
1
52
53
54
55
56
57
58
59
60
客服