51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
WOT技术大会
IT证书
公众号矩阵
移动端
短视频
免费课程
课程排行
直播课
软考学堂
全部课程
厂商认证
IT技术
25年5月软考
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
我的关注
全部帖子
默认
发布时间
热度
原创
精华
热门标签
AI
人工智能
智能体
媲美Sora,免费使用!带物理模拟的,文生视频模型
6月13日,知名3D建模平台LumaAI发布最新文生视频模型DreamMachine,向所有用户免费开放使用。DreamMachine除了支持文本之外,还可使用图片作为引导来生成视频,其生成的视频质量、动作一致性、色彩、光影、饱和度、运镜等方面,可以媲美OpenAI的Sora。DreamMachine的另外一个技术特点是支持物理模拟,这意味着生成的视频更能体现出物理世界的特点,包括重力下落、碰撞、光影变化等。DreamMachine生成的视频为什么物理模拟,对文...
Aceryt
0回复
1812浏览
视频
生成
快手「可灵」爆火:海外AI圈巨震,中国版Sora一号难求
短短一年后,AI生成的「吃面条」已经如此自然流畅?这让全球网友都感受到了亿点点震撼。图源:https:x.comCharaspowerAIstatus1799494388462063632右侧的这些生成视频,都来自快手刚刚推出的文生视频大模型「可灵」(Kling)。不是预发布、不是纯Demo合集,而是直接开放测试的产品级应用,人人都能申请。而且,可灵支持生成最长2分钟、30fps的1080P视频,主打从头脑风暴到可发布作品的「一键转化」。(官网地址:https:kling.ku...
轻薄滴假象
0回复
1592浏览
AI
生成视频
即插即用!CVD:第一个生成具有相机控制的多视图一致视频方案!(斯坦福&港中文)
精华
论文链接:https:arxiv.orgabs2405.17414项目链接:https:collaborativevideodiffusion.github.io最近对视频生成的研究取得了巨大进展,使得可以从文本提示或图像生成高质量的视频。在视频生成过程中添加控制是未来的重要目标,而最近一些将视频生成模型与摄像机轨迹联系起来的方法正在朝着这个目标迈进。然而,从多个不同的摄像机轨迹生成同一场景的视频仍然具有挑战性。解决这个多视频生成问题可以实现大规模的3D场景生成,其...
angel
0回复
1071浏览
视频
合成
机器学习之特征工程深度解析
原创
机器学习不仅要求算法找出优质模式,提供算法所真正需要的数据类型也非常重要。本文将探索机器学习中的特征工程相关算法,借助这些算法可以创建新的特征并对其进行处理,以优化机器学习模型。引言你一定听说过“garbagein,garbageout(输入的垃圾数据会导致输出的垃圾结果)”这句谚语,这句话在训练机器学习模型时确实适用。如果我们使用不相关的数据来训练机器学习模型,那么即使是最好的机器学习算法也无济于事。相反,即使使...
51CTO内容精选
0回复
1202浏览
机器学习
算法
大模型
苹果Siri将迎来AI时代最强“大修”!虚拟助手将帮助用户操控每个APP,网友:我愿称之为AGI
原创
很疯狂!彭博社消息,根据知情人士透露,苹果公司计划使用更先进的人工智能对其Siri虚拟助手进行全面改革!Siri将不再局限于目前单一任务的执行,而是可以允许用户通过声音交互控制每个应用程序的单个功能。看来,在隐私方面一向保守的苹果,在数据安全与AI至上的天平中徘徊了许久,终于找到了平衡中的解决之道——新系统将首次允许Siri接管应用程序内的所有功能。这一革命性的变化需要使用LLM来重新设计Siri的基础——这是生成...
51CTO技术栈
0回复
1089浏览
苹果
Siri
AGI
值得细读的八个视觉大模型生成式预训练方法
精华
大语言模型的进展催生出了ChatGPT这样的应用,让大家对“第四次工业革命”和“AGI”的来临有了一些期待,也作为部分原因共同造就了美股2023年的繁荣。LLM和视觉的结合也越来越多:比如把LLM作为一种通用的接口,把视觉特征序列作为文本序列的PrefixToken,一起作为LLM的输入,得到图片或者视频的caption;也有把LLM和图片生成模型、视频生成模型结合的工作,以更好控制生成的内容。当然2023年比较热门的一个领域便是多模态大模...
angel
0回复
2823浏览
模型
训练
MLC-LLM: 具有ML编译的通用LLM部署引擎
原创
介绍我们正处在大型语言模型和生成式人工智能的时代,其应用场景有可能改变每个人的生活。开放式大型语言模型为提供定制化和领域特定部署带来了重大机会。我们正处在一个激动人心的开放模型开发年份。一方面,我们看到了在(云)服务器部署方面取得的令人振奋的进展,这些解决方案可以为具有多个GPU的更大模型提供同时服务的能力。同时,我们也开始看到在设备本地部署方面取得了进展,能够将性能强大的量化模型部署到笔记本电脑...
AIGC最前线
0回复
2526浏览
MLCEngine
MLC-LLM
ICML 2024:AI对齐与可变和可影响奖励函数
"当前的AI对齐技术忽视了人类偏好价值观可能会改变这一事实。如何才能考虑到这一点?🤔"人们的偏好会改变,甚至可能受到他们与AI系统的交互影响。为了研究这种情况,研究人员引入了动态奖励马尔可夫决策过程(DRMDPs),这些过程明确考虑了人类的奖励反馈可能受到AI系统影响的方式。研究人员描述了静态偏好假设如何削弱现有对齐技术的合理性,导致它们暗示性地奖励AI系统操纵人类反馈(例如,影响用户的认知状态以增加奖励)。...
AIGC最前线
0回复
1041浏览
AI对齐技术
Meta NLLB团队:将神经机器翻译扩展到200种语言,问鼎Nature!
原创
神经技术的发展为机器翻译的研究开辟了新的途径。如今,神经机器翻译(NMT)系统可以利用高度多语言能力,甚至进行零翻译,提供了有希望的语言覆盖和质量结果。然而,扩展高质量的NMT需要大量平行双语数据,而这些数据对世界上7000多种语言并不平等地可用。将重点放在改进相对较少数量的高资源语言的翻译质量上,将导致研究关注低资源语言的不足,从而加剧了数字不平等。为了打破这一模式,研究人员在这里介绍了NoLanguageLeftB...
AIGC最前线
0回复
1550浏览
神经技术
神经机器翻译
单细胞RNA测序数据的推断:双层特征传播
原创
🤔我们能否利用'基因基因'🧬和'细胞细胞'🧫关系来推断单细胞RNA测序数据?👉请查看在《BriefingsinBioinformatics》上发表的新论文,scBFP!该工作由KAIST、UNC和MIT合作完成。方法在scBFP中,研究人员采用如下的双层特征传播:对于基因基因,我们使用基因级特征传播来利用观察到的基因数值。对于细胞细胞,我们应用细胞级扩散来全局去噪观察到的和推断的数值。以上过程可以通过以下算法简单说明。实验结果通过使用推断的细胞基...
AIGC最前线
0回复
923浏览
单细胞RNA
Clover - 通过闭环可验证的代码生成确保可信AI生成的代码
原创
尽管近年来大型语言模型(LLM)在代码生成方面取得了惊人的成功,但这种由人工智能生成的代码的可信性仍然是一个问题。为了解决这个问题,研究人员提出了Clover模式,即闭环可验证代码生成,通过检查代码、文档字符串和注释之间的一致性,强制执行AI生成的代码的正确性。在软件开发中,利用大型语言模型(LLM)进行代码生成是一个快速发展的趋势。然而,如果没有有效的方法来确保AI生成的代码的正确性,这一趋势可能导致不可取...
AIGC最前线
0回复
1025浏览
大型语言模型
LLM
Clover
MRAG:一种多头RAG,提升具有显著不同内容的多个文档复杂查询的检索准确性
现有的RAG方案没有专注于需要检索多个具有显著不同内容的文档的查询,这类查询经常出现,但挑战在于这些文档的嵌入可能在嵌入空间中距离很远,难以全部检索。因此,提出一种多头检索增强生成方法(MRAG:MultiHeadRAG),它的关键思想是利用Transformer解码器的多头注意力层的激活,而不仅仅是前馈层,来生成嵌入。不同的注意力头可以捕获数据的不同方面,因此使用这些激活产生的嵌入能更好地表示文档和查询的各个方面。MRAG使...
PaperAgent
0回复
1928浏览
RAG
检索
MRAG
如何不爬梯免费使用AI文生图?
原创
现在各种AI大模型大行其道,前有ChatGPT颠覆了我们对对话型AI的原有印象,后有Sora文生视频,让我们看到了利用AI进行创意创作的无限可能性。如今各大公司和团队都争相提出自己的大模型,各种网页端和软件应用也极大地降低了我们使用AI作为生产力的门槛。可惜很多要么需要翻墙爬梯子,要么需要付费买会员,要么生成的图片不理想。那么有没有不爬梯又比较好用的文生图工具呢?"文生图"是一个极具创新性的在线AI工具,它能够根据用...
数字化助推器
0回复
1437浏览
AI
大模型
文生图
YOLO-NAS:开启实时目标检测新纪元
在当今人工智能的浪潮中,目标检测技术已经广泛应用于各个领域,从自动驾驶到安防监控,再到智能机器人,都离不开它的身影。而YOLO(YouOnlyLookOnce)算法,凭借其高准确性和实时性,在目标检测领域独领风骚。然而,随着技术的不断进步,人们对于检测速度和准确性的要求也在不断提高。在这样的背景下,YOLONAS应运而生,它结合了神经架构搜索(NAS)技术,为实时目标检测带来了全新的突破。一、YOLONAS概述YOLONAS,全称YouOnl...
sword_hero
0回复
1559浏览
NAS
应用场景
机器人
一文搞懂大模型、RAG、函数调用、Agent、知识库、向量数据库、知识图谱、AGI的区别和联系!!
原创
一、背景我们要把AI大模型当做人的大脑,因此调用AI大模型,相当于调用一个人,把AI大模型当人看,TA懂人话、TA说人话、TA会直接给出结果,但结果不一定正确。因此在AI大模型的推理基础上,通过RAG、Agent、知识库、向量数据库、知识图谱等技术手段实现了真正的AGI(通用人工智能)。这些技术到底有哪些区别和联系,下图作了横向对比,接下来我们详细剖析下。二、大语言模型(LLM)大语言模型(LLM)是通过深度学习方法,利用庞...
玄姐聊AGI
0回复
7320浏览
大模型
RAG
Agent
GPT4技术原理:大模型的幻觉,解铃还须系铃人
阿尔伯特·爱因斯坦曾经说过:像我们这样相信物理学的人都知道,过去、现在和未来之间的区别只是一种顽固执着的幻觉。换句话说,时间是一种幻觉。笔者觉得,此种意义上说,光也是一种幻觉,你能看到可见光,却对红外光和紫外光“熟视无睹”。而这一切不过是同一种形式的波或者粒子。人类的幻觉人类的幻觉无处不在,无时不有。只是绝大多数情境下,你觉察不到而已,像红紫外光。幻觉(Hallucination)是一种在没有外部刺激的情况...
ceesoft
0回复
1155浏览
GPT4
模型
物理学
闭环的生成式AI:将LLM和GPT集成到下一代网络中
精华
随着5G的全球部署和6G标准的制定,移动网络的演进速度日益加快。在这一过程中,机器学习(ML)技术因其卓越的数据处理能力、洞察力和决策能力而成为智能移动网络的有效解决方案。但是传统的ML算法在处理复杂的网络任务时,往往受限于其算法的局限性和训练数据的质量与规模。与此同时,LLMs和GPTs在近年来展现出了在各种认知任务中接近人类水平的性能,但它们在基础任务中常常缺乏常识,因此更多地被视为人类的辅助工具。6月7日...
xuxiangda
0回复
1584浏览
AI
LLM
GPT
百万上下文RAG,Agent还能这么玩
QwenAgent的设计思路虽然与LangChain相似,但其发布几个的Agent示例却很有意思。今天本文将深入探讨如何使用QwenAgent将上下文记忆扩展到百万量级,让Agent的智能得到更广泛的应用。暴力关键字检索优于向量方案在处理大规模文本数据时,一个关键的挑战是如何快速准确地定位到最相关的信息块。QwenAgent通过一种看似“暴力”的方法——,基于LLM判断相关性AND基于关键字检索,解决了这一难题。这种方法虽然简单,但在实际操作中...
ermulong
0回复
1559浏览
RAG
Agent
AI
Self-Attention在时间序列预测中有效吗?新Transformer架构效率效果双提升
今天给大家介绍最近的一篇探索selfattention在时间序列预测有效性的文章。本文承接AreTransformersEffectiveforTimeSeriesForecasting这篇工作,进一步指出导致Transformer在时间序列问题上效果不好的核心模块是selfattention。并提出了一种新的线性模型+crossattention结构解决,提升了长周期时序预测效果。论文标题:AreSelfAttentionsEffectiveforTimeSeriesForecasting下载地址:https:arxiv.orgpdf2405.16877v11....
海因斯DK
0回复
2079浏览
预测
时间序列
架构
精打细算用好 LLMs :LLM 落地应用成本及响应延迟优化
原创
精华
编者按:LLMs被视为AI领域的一个里程碑式的突破,但要将其应用于实际生产环境,并且还能用对、用好并非易事。模型的使用成本和响应延迟是目前将大语言模型(LLMs)应用于生产环境中的核心难题之一。在本期刊载的这篇文章中,作者从自身项目的实践经验出发,分享了一系列实用技巧,帮助优化LLMPrompt,能够一定程度上降低大模型的使用成本和响应延迟。文章首先解析了导致高成本和高延迟的根源在于输入输出tokens的数量,而非任务...
Baihai_IDP
0回复
1207浏览
LLM
AI
白海科技
暂无内容
1
111
112
113
114
115
116
117
118
119
客服