51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
WOT技术大会
IT证书
公众号矩阵
移动端
短视频
免费课程
课程排行
直播课
软考学堂
全部课程
厂商认证
IT技术
25年5月软考
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
我的关注
全部帖子
默认
发布时间
热度
原创
精华
热门标签
Deepseek
AI
模型
RAG升级二维战士!通义实验室放大招
📜摘要检索增强生成(RAG)在开放域问答任务中表现出色。然而,传统搜索引擎可能会检索浅层内容,限制了大型语言模型(LLM)处理复杂、多层次信息的能力。为了解决这个问题,我们引入了WebWalkerQA,一个旨在评估LLM执行网页遍历能力的基准。它评估LLM系统性地遍历网站子页面以获取对应信息的能力。同时我们提出了WebWalker,一个通过explorercritic范式模拟人类网页导航的multiagent框架。广泛的实验结果表明,WebWalkerQA具有...
NLP前沿1
0回复
274浏览
RAG
编程
搜索
SenseNova 大揭秘:商汤如何打造多模态处理 “全能王”?
在人工智能的浩瀚星空中,多模态大模型正成为最为璀璨的星座之一,引领着技术发展的新潮流。商汤科技于2025年1月重磅推出的“日日新”融合大模型(SenseNova),宛如一颗耀眼的超新星,以其原生融合模态的卓越特性,在多模态信息处理领域掀起了巨大波澜。本文将深入剖析SenseNova的方方面面,从项目架构到技术内核,从功能应用到实践操作,为读者全方位呈现这一前沿技术的魅力与价值,助力大家紧跟人工智能发展的时代步伐。一、...
穿越时空111
0回复
797浏览
SenseNova
多模态
OpenCompass
看了这么多文章,终于理解了 Scaling Law
精华
社区头条
你有没有想过,是什么让AI模型变得如此强大?为什么有些AI能够写诗作画,有些却只能做简单的问答?这其中,ScalingLaw(规模法则)扮演着至关重要的角色,它就像AI模型的核心,揭示了模型性能提升的奥秘。ScalingLaw是什么?简单来说,ScalingLaw指的是当我们增加模型的规模(例如模型包含的参数越多,模型就越大)、训练数据量和计算资源时,模型的性能就会随之提升。(感觉这是符合直觉的,但ScalingLaw最核心的在于量化给出...
芝士AI吃鱼
0回复
2049浏览
Scaling
OpenAI
函数
LLM之后,Agent的未来是RL!
嘿,大家好!这里是一个专注于AI智能体的频道今天给家人们聊一期播客总结,四十二章经最新一期播客请到了在Meta工作了七年的应用强化学习组负责人朱哲清Bill。作为斯坦福大学强化学习专业博士,现在创业做Agent的他,抛出了一个巨大的反共识观点:"LLM只是一个翻译官,真正的Agent核心应该是RL。"等等,这是什么意思?在2024年,我们见证了GPT4掀起的Agent热潮。Claude、GPTs、Copilot...几乎所有大公司都在用LLM构建Agent。但B...
探索AGI
0回复
433浏览
LLM
Agent
RL
DeepSeek R1横空出世,超越OpenAI o1,教你用Ollama跑起来
精华
社区头条
热门内容榜
• 最近上榜
AI正在深刻改变各行业,大语言模型(LLMs)更是其中的核心驱动力。例如,DeepSeekR1作为第一代推理模型,在数学、代码和推理任务上表现优异,与OpenAI的o1模型不相上下。将此类模型部署到本地,可为AI应用带来更强隐私保护、定制化和可控性。今天指导大家如何使用Ollama——一款AI模型管理和运行工具——在本地计算机上部署并运行DeepSeekR1。同时,推荐免费下载Apidog(https:apidog.com),能简化API设计与测试流程,是开发者...
小虎哦哦
0回复
1.2w浏览
DeepSeek
OpenAI
AI
图解新颖LLM的CoPE位置编码
1.快速总览研究人员提出了一种新颖的位置编码方法,称为上下文位置编码(下文称之为CoPE),它有别于基于标记的传统位置编码范式。它以上下文依赖的方式测量位置,在按位置寻址时会更加自由它在如下的任务中获得不错的收益:FlipFlop,SelectiveCopy,Counting,LanguageModeling,andCodeModelingtasks它优于现有方法,尤其是在域外泛化场景它有可能改善其他领域的编码,例如视频和语音。在这些领域,基于Token位置的编码不太合适...
鲁班模锤1
0回复
258浏览
CoPE
LLM
编码
我构建了一个自动生成提案的LLM,并拿到GitHub上开源了它
原创
社区头条
现有的大模型无法解决我的问题,于是我自己构建了一个开源工具,用于高效地自动生成提案。最近,我没有像以前那样频繁地更新开源文章,倒不是由于我停止写文章,而是由于开源商业化方面的进展很大,没完没了地起草提案这项任务消耗了我的太多时间。作为一家本土的开源商业公司,WhaleOps雇佣的大多是工程师。要求这些开源贡献者编写提案浪费了他们的开发时间,他们的提案并不总是符合质量标准。与大公司的管理不同,身为初创公...
51CTO内容精选
0回复
215浏览
LLM
大模型
ChatGPT
深扒星际之门主角团:中东皇室也参与了!奥特曼搭上特朗普,至少5000亿开搞“星际之门”!
原创
社区头条
编辑伊风出品51CTO技术栈(微信号:blog51cto)太炸裂了!一早上刷到OpenAI奥特曼和特朗普同框了!特朗普大手一挥,宣布了一个疯狂燃烧经费的AI项目——星际之门计划,将投资"至少"5000亿美元!!由OpenAI主导运营,在美国大搞AI基建。这个数字啥概念呢?粗略估计下大概是建设1.5个三峡大坝这样恐怖的工程量。图片而且,这还不是一个简单的画饼——"星际之门"立刻就要投入1000亿美元。特朗普说,他计划从德克萨斯州开始大规模建...
51CTO技术栈
0回复
400浏览
AI
基建
星际之门计划
Kimi发布最新模型k1.5,技术报告也干货满满
社区头条
热门内容榜
• 最近上榜
大家好,我是刘聪NLP。就在今晚,Kimi发布了最新模型k1.5,先来看榜单效果,简直爆炸。在长推理上,k1.5在数学能力上,无论是纯文本还是视觉多模态上,都远超openai的o1模型;在codeforces与其持平,LiveCode上略差,但相比于QVQ和QWQ有较大的优势。在短推理上,k1.5的数学能力真实遥遥领先,无论是gpt4o还是claude3.5sonnet都远不如k1.5,尤其是在AIME榜单上,k1.5有60.8,而最高的deepseekv3只有39.2,堪称断层式碾压。这个应...
NLP工作站
0回复
1521浏览
Kimi
视觉
多模态
OmniThink:如何让 LLM 写出有更有深度的文章
摘要机器写作通常依赖检索增强生成技术,但这些方法受限于模型预定义的范围,难以生成信息丰富的内容。普通检索的信息往往缺乏深度、实用性,且冗余问题严重,导致生成的文章内容浅显、重复且缺乏原创性。为此,我们提出了OmniThink框架,它模拟了人类迭代扩展和反思的认知过程。OmniThink的核心在于模拟学习者逐步深化对主题理解的认知行为。实验表明,OmniThink在不牺牲连贯性和深度的前提下,显著提升了生成文章的知识密度。...
大语言模型论文跟踪
0回复
244浏览
LLM
OmniThink
多模态
小红书 NoteLLM:用于笔记推荐和标签生成的 LLM
精华
一、背景最近“TikTok难民”涌入小红书,“小红书霸榜苹果AppStore”等话题受到广泛关注,字节跳动的Lemon8也不相上下。当然,作为一个技术公众号,我们这里并不是要讨论这一现象,而是要介绍小红书的NoteLLM,其主要用于小红书中的笔记推荐和标签生成。对应的论文为:[2403.01744]NoteLLM:ARetrievableLargeLanguageModelforNoteRecommendation[1]有关LLM在搜广推场景的应用落地也可以参考我们之前的文章:字节HLLM:大...
amei2000go
0回复
1702浏览
NoteLLM
LLM
WAP
多智能体微调:用多样化推理链实现语言模型的自我提升
社区头条
图片1.问题:单一模型自我提升的瓶颈近年来,大语言模型(LLMs)如GPT4取得了显著进展,但这些模型的性能仍然受限于已有的训练数据。尽管通过生成合成数据进行自我微调成为提升模型的主流方法,但随着微调轮次的增加,性能提升会迅速进入“收益递减”状态,模型的多样性和推理能力难以进一步提高。这种瓶颈限制了语言模型在复杂推理任务中的表现。图片2.方法:多智能体协作微调(MultiagentFinetuning)论文提出了一种全新框架...
sbf_2000
0回复
701浏览
多智能
语言
模型
深入探究编码器 - 解码器架构:从RNN到Transformer的自然语言处理模型
精华
1.引言许多大语言模型成功的核心在于编码器解码器架构,这一框架在机器翻译、文本摘要和对话式人工智能等任务中取得了突破性进展。编码器解码器架构的提出是为了解决序列到序列(Seq2Seq)问题,这在处理顺序数据方面是一个重大突破。1.1数据处理的主要发展表格数据最初,人们专注于利用人工神经网络(ANNs)来处理表格数据。通过增加网络层数,这种方法逐渐演变为深度神经网络(DNNs),从而增强了模型捕捉数据中复杂模式的能...
AI论文解读
0回复
993浏览
解码器
架构
自然语言
对话数据合成:清华利用多Agent合成大量医疗对话数据显著提升LLM在医疗场景效果
大家好,我是HxShine今天分享一篇来自清华的一篇利用Agent合成数据的文章,标题为《AgentHospital:ASimulacrumofHospitalwithEvolvableMedicalAgents》。这篇文章介绍了一种名为AgentHospital的仿医院模拟系统,该系统中患者、护士和医生都是由LLM驱动。文章的核心目标是使医生Agent能够在模拟环境中学习如何治疗疾病,从而验证社会模拟过程是否可以提高LLMAgent在特定任务上的性能。实验表明,随着在模拟过程中积累的样本越来...
arnoldzhw
0回复
508浏览
Agent
LLM
医疗
我们一起聊聊故障诊断图卷积合集!新增GAT、SGCN、GIN分类模型
前言本文基于凯斯西储大学(CWRU)轴承数据,先经过数据预处理进行数据集的制作和加载,最后通过Pytorch实现KNN+GCN模型对故障数据的分类。1.相关网络介绍1.1图卷积神经网络(GCN)论文地址:https:arxiv.orgabs1609.029071.2图注意力网络(GAT)论文地址:https:arxiv.orgabs1710.109031.3稀疏图卷积网络(SGCN)论文地址:https:arxiv.orgabs2104.015281.4GIN图同构网络论文地址:https:arxiv.or...
Tang_Lan
0回复
242浏览
GAT
SGCN
分类模型
Kimi思考模型k1.5是怎么练成的?细节曝光
社区头条
热门内容榜
• 最近上榜
Kimi发布新一代多模态思考模型k1.5,在竞赛数学、代码能力及视觉思考等测试中,k1.5模型性能已达到全球领先模型OpenAIo1正式版水平,月之暗面也成为OpenAI之外,全球第二家到达该水平的人工智能企业。Kimi1.5longCoT评测结果longtoshort,用长链式思考技术改进短链式思考模型,在短链式推理性能测试中,k1.5模型在数学、代码、视觉多模态和通用能力等方面到达或超越GPT4o、ClaudeSonnet3.5等全球领先模型。Kimi1.5shortCoT评测...
PaperAgent
0回复
1022浏览
Kimi
OpenAI
模型
面向统一的单、多主体个性化文生图框架!阿里通义发布AnyStory!
论文链接:https:arxiv.orgpdf2501.09503项目链接:https:aigcdesigngroup.github.ioAnyStory亮点直击提出了一种统一的单主体和多主体个性化框架,称为AnyStory。该框架在个性化单主体和多主体时实现了一致性,同时遵循文本提示;引入了一种增强的主体表示编码器,由简化的轻量级ReferenceNet和CLIP视觉编码器组成,能够对一般主体进行高保真细节编码;提出了一种解耦的实例感知router模块,能够准确感知和预测主体的隐空间条件...
angel
0回复
277浏览
图像生成
模型
AI
Runway全面开放新文生图模型Frames
早在去年11月25日,知名文生视频模型平台Runway首次展示了,全新文生图片模型Frames。Frames不仅能够保持风格的一致性和可控性,还允许用户进行广泛的创意探索,能生成复古、数码、杂志、动态、运动、拼图等不同类型风格的图片。但那个时候Frames仅向高级用户提供使用。现在,Runway已经向所有用户开放了Frames使用权,可以在其官网使用了。Runway联合创始人兼首席执行官CristóbalValenzuela表示,Frames专为创意领域打造,其...
Aceryt
0回复
392浏览
模型
训练
AI
OpenAI重磅:AI Agent智能体Function Calling 2.0!
原创
热门内容榜
• 最近上榜
近日,OpenAI推出了全新的AIAgent智能体FunctionCalling2.0使用指南,此次更新使得文档篇幅缩减了一半,并且引入了一系列关键的最佳实践。作为打造高效AIAgent智能体的核心技能之一,正确运用FunctionCalling对于开发强大的AIAgent智能体应用具有至关重要的作用。因此,今天我就来为大家揭秘这次更新的精华内容!1、FunctionCalling的两大核心应用文章中清晰地阐述了FunctionCalling的两个核心应用场景:第一、数据获取(Fetchi...
玄姐聊AGI
0回复
815浏览
AI Agent
智能体
Agentic AI 系统设计:AI Agent 智能体架构设计与实践
原创
精华
构建一个高效运作的AIAgent智能体系统有哪些关键步骤?在开发过程中,如何提前识别并解决那些可能在系统上线后带来严重问题的隐患?为了解答这些问题,我们需要将AIAgent智能体系统拆分为三个核心模块:工具、推理和执行。每个模块都面临着独特的挑战。一个模块的错误可能会连锁反应,以不可预见的方式影响其他模块,导致系统故障。例如,信息检索可能拉取到无关数据;推理错误可能导致工作流程不完整或陷入死循环;执行环节在...
玄姐聊AGI
0回复
1080浏览
AI Agent
智能体
暂无内容
1
12
13
14
15
16
17
18
19
20
客服