51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
WOT技术大会
IT证书
公众号矩阵
移动端
短视频
免费课程
课程排行
直播课
软考学堂
全部课程
厂商认证
IT技术
25年5月软考
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
我的关注
全部帖子
默认
发布时间
热度
原创
精华
热门标签
DeepSeek
AI
大模型
苹果Siri将迎来AI时代最强“大修”!虚拟助手将帮助用户操控每个APP,网友:我愿称之为AGI
原创
很疯狂!彭博社消息,根据知情人士透露,苹果公司计划使用更先进的人工智能对其Siri虚拟助手进行全面改革!Siri将不再局限于目前单一任务的执行,而是可以允许用户通过声音交互控制每个应用程序的单个功能。看来,在隐私方面一向保守的苹果,在数据安全与AI至上的天平中徘徊了许久,终于找到了平衡中的解决之道——新系统将首次允许Siri接管应用程序内的所有功能。这一革命性的变化需要使用LLM来重新设计Siri的基础——这是生成...
51CTO技术栈
0回复
1368浏览
苹果
Siri
AGI
值得细读的八个视觉大模型生成式预训练方法
精华
大语言模型的进展催生出了ChatGPT这样的应用,让大家对“第四次工业革命”和“AGI”的来临有了一些期待,也作为部分原因共同造就了美股2023年的繁荣。LLM和视觉的结合也越来越多:比如把LLM作为一种通用的接口,把视觉特征序列作为文本序列的PrefixToken,一起作为LLM的输入,得到图片或者视频的caption;也有把LLM和图片生成模型、视频生成模型结合的工作,以更好控制生成的内容。当然2023年比较热门的一个领域便是多模态大模...
angel
0回复
3383浏览
模型
训练
MLC-LLM: 具有ML编译的通用LLM部署引擎
原创
介绍我们正处在大型语言模型和生成式人工智能的时代,其应用场景有可能改变每个人的生活。开放式大型语言模型为提供定制化和领域特定部署带来了重大机会。我们正处在一个激动人心的开放模型开发年份。一方面,我们看到了在(云)服务器部署方面取得的令人振奋的进展,这些解决方案可以为具有多个GPU的更大模型提供同时服务的能力。同时,我们也开始看到在设备本地部署方面取得了进展,能够将性能强大的量化模型部署到笔记本电脑...
AIGC最前线
0回复
2983浏览
MLCEngine
MLC-LLM
ICML 2024:AI对齐与可变和可影响奖励函数
"当前的AI对齐技术忽视了人类偏好价值观可能会改变这一事实。如何才能考虑到这一点?🤔"人们的偏好会改变,甚至可能受到他们与AI系统的交互影响。为了研究这种情况,研究人员引入了动态奖励马尔可夫决策过程(DRMDPs),这些过程明确考虑了人类的奖励反馈可能受到AI系统影响的方式。研究人员描述了静态偏好假设如何削弱现有对齐技术的合理性,导致它们暗示性地奖励AI系统操纵人类反馈(例如,影响用户的认知状态以增加奖励)。...
AIGC最前线
0回复
1149浏览
AI对齐技术
Meta NLLB团队:将神经机器翻译扩展到200种语言,问鼎Nature!
原创
神经技术的发展为机器翻译的研究开辟了新的途径。如今,神经机器翻译(NMT)系统可以利用高度多语言能力,甚至进行零翻译,提供了有希望的语言覆盖和质量结果。然而,扩展高质量的NMT需要大量平行双语数据,而这些数据对世界上7000多种语言并不平等地可用。将重点放在改进相对较少数量的高资源语言的翻译质量上,将导致研究关注低资源语言的不足,从而加剧了数字不平等。为了打破这一模式,研究人员在这里介绍了NoLanguageLeftB...
AIGC最前线
0回复
1906浏览
神经技术
神经机器翻译
单细胞RNA测序数据的推断:双层特征传播
原创
🤔我们能否利用'基因基因'🧬和'细胞细胞'🧫关系来推断单细胞RNA测序数据?👉请查看在《BriefingsinBioinformatics》上发表的新论文,scBFP!该工作由KAIST、UNC和MIT合作完成。方法在scBFP中,研究人员采用如下的双层特征传播:对于基因基因,我们使用基因级特征传播来利用观察到的基因数值。对于细胞细胞,我们应用细胞级扩散来全局去噪观察到的和推断的数值。以上过程可以通过以下算法简单说明。实验结果通过使用推断的细胞基...
AIGC最前线
0回复
1076浏览
单细胞RNA
Clover - 通过闭环可验证的代码生成确保可信AI生成的代码
原创
尽管近年来大型语言模型(LLM)在代码生成方面取得了惊人的成功,但这种由人工智能生成的代码的可信性仍然是一个问题。为了解决这个问题,研究人员提出了Clover模式,即闭环可验证代码生成,通过检查代码、文档字符串和注释之间的一致性,强制执行AI生成的代码的正确性。在软件开发中,利用大型语言模型(LLM)进行代码生成是一个快速发展的趋势。然而,如果没有有效的方法来确保AI生成的代码的正确性,这一趋势可能导致不可取...
AIGC最前线
0回复
1257浏览
大型语言模型
LLM
Clover
MRAG:一种多头RAG,提升具有显著不同内容的多个文档复杂查询的检索准确性
现有的RAG方案没有专注于需要检索多个具有显著不同内容的文档的查询,这类查询经常出现,但挑战在于这些文档的嵌入可能在嵌入空间中距离很远,难以全部检索。因此,提出一种多头检索增强生成方法(MRAG:MultiHeadRAG),它的关键思想是利用Transformer解码器的多头注意力层的激活,而不仅仅是前馈层,来生成嵌入。不同的注意力头可以捕获数据的不同方面,因此使用这些激活产生的嵌入能更好地表示文档和查询的各个方面。MRAG使...
PaperAgent
0回复
2186浏览
RAG
检索
MRAG
如何不爬梯免费使用AI文生图?
原创
现在各种AI大模型大行其道,前有ChatGPT颠覆了我们对对话型AI的原有印象,后有Sora文生视频,让我们看到了利用AI进行创意创作的无限可能性。如今各大公司和团队都争相提出自己的大模型,各种网页端和软件应用也极大地降低了我们使用AI作为生产力的门槛。可惜很多要么需要翻墙爬梯子,要么需要付费买会员,要么生成的图片不理想。那么有没有不爬梯又比较好用的文生图工具呢?"文生图"是一个极具创新性的在线AI工具,它能够根据用...
数字化助推器
0回复
1733浏览
AI
大模型
文生图
YOLO-NAS:开启实时目标检测新纪元
在当今人工智能的浪潮中,目标检测技术已经广泛应用于各个领域,从自动驾驶到安防监控,再到智能机器人,都离不开它的身影。而YOLO(YouOnlyLookOnce)算法,凭借其高准确性和实时性,在目标检测领域独领风骚。然而,随着技术的不断进步,人们对于检测速度和准确性的要求也在不断提高。在这样的背景下,YOLONAS应运而生,它结合了神经架构搜索(NAS)技术,为实时目标检测带来了全新的突破。一、YOLONAS概述YOLONAS,全称YouOnl...
sword_hero
0回复
1855浏览
NAS
应用场景
机器人
一文搞懂大模型、RAG、函数调用、Agent、知识库、向量数据库、知识图谱、AGI的区别和联系!!
原创
一、背景我们要把AI大模型当做人的大脑,因此调用AI大模型,相当于调用一个人,把AI大模型当人看,TA懂人话、TA说人话、TA会直接给出结果,但结果不一定正确。因此在AI大模型的推理基础上,通过RAG、Agent、知识库、向量数据库、知识图谱等技术手段实现了真正的AGI(通用人工智能)。这些技术到底有哪些区别和联系,下图作了横向对比,接下来我们详细剖析下。二、大语言模型(LLM)大语言模型(LLM)是通过深度学习方法,利用庞...
玄姐聊AGI
0回复
8834浏览
大模型
RAG
Agent
GPT4技术原理:大模型的幻觉,解铃还须系铃人
阿尔伯特·爱因斯坦曾经说过:像我们这样相信物理学的人都知道,过去、现在和未来之间的区别只是一种顽固执着的幻觉。换句话说,时间是一种幻觉。笔者觉得,此种意义上说,光也是一种幻觉,你能看到可见光,却对红外光和紫外光“熟视无睹”。而这一切不过是同一种形式的波或者粒子。人类的幻觉人类的幻觉无处不在,无时不有。只是绝大多数情境下,你觉察不到而已,像红紫外光。幻觉(Hallucination)是一种在没有外部刺激的情况...
ceesoft
0回复
1284浏览
GPT4
模型
物理学
闭环的生成式AI:将LLM和GPT集成到下一代网络中
精华
随着5G的全球部署和6G标准的制定,移动网络的演进速度日益加快。在这一过程中,机器学习(ML)技术因其卓越的数据处理能力、洞察力和决策能力而成为智能移动网络的有效解决方案。但是传统的ML算法在处理复杂的网络任务时,往往受限于其算法的局限性和训练数据的质量与规模。与此同时,LLMs和GPTs在近年来展现出了在各种认知任务中接近人类水平的性能,但它们在基础任务中常常缺乏常识,因此更多地被视为人类的辅助工具。6月7日...
xuxiangda
0回复
1935浏览
AI
LLM
GPT
百万上下文RAG,Agent还能这么玩
QwenAgent的设计思路虽然与LangChain相似,但其发布几个的Agent示例却很有意思。今天本文将深入探讨如何使用QwenAgent将上下文记忆扩展到百万量级,让Agent的智能得到更广泛的应用。暴力关键字检索优于向量方案在处理大规模文本数据时,一个关键的挑战是如何快速准确地定位到最相关的信息块。QwenAgent通过一种看似“暴力”的方法——,基于LLM判断相关性AND基于关键字检索,解决了这一难题。这种方法虽然简单,但在实际操作中...
ermulong
0回复
1789浏览
RAG
Agent
AI
Self-Attention在时间序列预测中有效吗?新Transformer架构效率效果双提升
今天给大家介绍最近的一篇探索selfattention在时间序列预测有效性的文章。本文承接AreTransformersEffectiveforTimeSeriesForecasting这篇工作,进一步指出导致Transformer在时间序列问题上效果不好的核心模块是selfattention。并提出了一种新的线性模型+crossattention结构解决,提升了长周期时序预测效果。论文标题:AreSelfAttentionsEffectiveforTimeSeriesForecasting下载地址:https:arxiv.orgpdf2405.16877v11....
海因斯DK
0回复
2515浏览
预测
时间序列
架构
精打细算用好 LLMs :LLM 落地应用成本及响应延迟优化
原创
精华
编者按:LLMs被视为AI领域的一个里程碑式的突破,但要将其应用于实际生产环境,并且还能用对、用好并非易事。模型的使用成本和响应延迟是目前将大语言模型(LLMs)应用于生产环境中的核心难题之一。在本期刊载的这篇文章中,作者从自身项目的实践经验出发,分享了一系列实用技巧,帮助优化LLMPrompt,能够一定程度上降低大模型的使用成本和响应延迟。文章首先解析了导致高成本和高延迟的根源在于输入输出tokens的数量,而非任务...
Baihai_IDP
0回复
1423浏览
LLM
AI
白海科技
像俄罗斯方块一样生成视频! 北大联合快手AI团队推出新框架VideoTetris实现跟随复杂指令的文生视频!
Paper:https:arxiv.orgabs2406.04277Code:https:github.comYangLing0818VideoTetrisProject:https:videotetris.github.io扩散模型在文本到视频(T2V)生成方面取得了巨大成功,视频生成模型正以飞快的速度发展。然而,现有的文生视频模型在应对复杂、细节丰富、多物体的指令时,仍存在一定的挑战。为了生成更精确的复杂视频,北京大学与快手AI团队推出了VideoTetris,定义了复杂组合指令生成任务,并...
angel
0回复
1727浏览
AI
框架
训练大模型自动在RAG和记忆间选择
原创
本文介绍AdaptLLM技术是如何动态确定是否需要检索额外的上下文信息,以避免不必要的外部检索,进而提高LLM应用的效率。现如今,检索增强生成(Retrievalaugmentedgeneration,RAG)管道已经能够使得大语言模型(LargeLanguageModels,LLM)在其响应环节中,充分利用外部的信息源了。不过,由于RAG应用会针对发送给LLM的每个请求,都去检索外部信息,而LLM实际上已经包含了大量无需检索即可使用的知识,因此整个过程反而显得效率低下...
51CTO内容精选
0回复
1487浏览
大模型
Adapt-LLM技术
自适应检索
苹果一夜重塑iPhone!GPT-4o加持Siri,AI深入所有APP,库克:开启苹果AI下一章
精华
千呼万唤,苹果如何用AI重塑iPhone,答案终于揭晓!各种令人闻之激动的传闻,通通都是真的——确定和OpenAI达成合作,接入ChatGPT,使用GPT4o模型。Siri完成重生,iPhone人机交互模式重构,手机智能助手代劳一切近在咫尺。AppleIntelligence,就此要成为AI的全新代名词了。发布一结束,WWDC24立马冲进热搜前三。网友们都在感慨苹果这逆天的整合能力,各种AI新功能通通满足大家想象力。还有人说,这回骂早了……简单总结,这场发...
Crystalcxt
0回复
1760浏览
苹果
AI
谷歌开源TimesFM:1000亿个时间点训练,入选ICML 2024
今年2月,GoogleResearch的研究人员提出了一个时序预测基础模型TimesFM,在1000亿个「真实世界时间点」上进行预训练,仅仅用200M的参数规模就展现出了超强的零样本学习能力。论文链接:https:arxiv.orgpdf2310.10688.pdf当时权重还没有发布,就已经有人在Reddit社区中表达了难以克制的兴奋。5月8日,这篇研究又掀起了一阵波澜。官方博客宣布这篇文章被ICML2024接收,而且在GitHub和HuggingFace上公开了源代码和模型权重...
duhorse
0回复
1505浏览
谷歌
开源
暂无内容
1
134
135
136
137
138
139
140
141
142
客服