51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
WOT技术大会
IT证书
公众号矩阵
移动端
短视频
免费课程
课程排行
直播课
软考学堂
全部课程
厂商认证
IT技术
25年5月软考
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
我的关注
全部帖子
默认
发布时间
热度
原创
精华
热门标签
Deepseek
AI
模型
基于Langbase Memory Agents将任意LLM转为可对话式AI文档助手
原创
社区头条
在2025年当下,大语言模型(LLM)依旧无法获取用户的私有数据。当用户向其询问某些与个人相关的问题时,大语言模型要么凭借推测进行回应,要么给出错误的解答。这体现了大语言模型存在的固有局限性——它们仅基于公开信息进行训练,无法获取用户的私有上下文信息。内存代理(MemoryAgent)则通过实时且安全地将用户的私有数据与任意大语言模型进行链接,有效解决了上述问题。在本教程中,笔者将详细指导你如何借助Langbase(一...
51CTO内容精选
0回复
350浏览
大型语言模型
LLM
内存代理
不到140块!李飞飞团队超低成本复刻DeepSeek R1推理!16张H100只训练了26分钟,与R1训练方法不同!
原创
社区头条
编辑伊风出品51CTO技术栈(微信号:blog51cto)太魔鬼了!上周李飞飞团队发了篇新论文,再次降低了复刻o1能力的成本。低到什么程度呢?论文里说,在现成的预训练模型(用的是阿里系开源的Qwen2.532BInstruct)进行监督微调(SFT),使用构建的小规模数据集,仅耗时26分钟,就在16张H100GPU上完成训练。据研究人员介绍,这样的算力租赁成本大约在20美元左右!图片这么省时省钱的模型,居然和o1预览版性能掰手腕:实验结果显示,...
51CTO技术栈
0回复
766浏览
DeepSeek R1
李飞飞
OpenAI
使用 DeepSeek 必备的十个技巧,建议收藏!
原创
这个春节,DeepSeek实在太火了,无须赘述。今天,我们直接讲干货。用10个问题带大家了解:DeepSeek怎么用,如何与DeepSeek高质量对话,以及一些隐藏技巧。1、巧用DeepSeek的三种模式DeepSeek提供了三种聊天模式基础模型、深度思考(R1)和联网搜索,你可以根据不同的情境和需求,自由选择合适的模式。基础模型已在去年12月升级至DeepSeekV3版本,其性能可与全球领先的开源和闭源模型相媲美,包括4o、Claude3.5Sonnet、Qwen2.5、...
玄姐聊AGI
0回复
333浏览
DeepSeek
一文深剖Microsoft AutoGen,带你跑通多智能体AI框架
社区头条
热门内容榜
• 最近上榜
MicrosoftAutoGen是一款很棒的开源框架,专为智能体协作设计,能助开发者轻松构建强大、可扩展且智能的多智能体系统。它融合大型语言模型优势、模块化架构和丰富生态,在智能体AI应用中表现出色。今天为大家深入解析AutoGen的特性、用例、优势、实例及评估机制,带你探索这个神奇框架,感受AutoGen为开发带来的便利与创新。1.AutoGen简介AutoGen是开发者的得力助手,能帮助开发者创建智能体,使其相互协作完成复杂任务。该框架...
小虎哦哦
0回复
1783浏览
AutoGen
AI
框架
洞悉arXiv的LLM论文趋势
原创
大型语言模型(LLM)正在极大地影响AI研究,引发了关于迄今为止发生了什么变化以及如何塑造该领域未来的讨论。为了澄清这些问题,有研究人员分析新的数据集,其中包含16,979篇与LLM相关的arXiv论文,重点关注2023年与20182022年相比的最新趋势。首先研究人员观察到LLM研究越来越多地影响着社会,这从计算机和社会arXiv中LLM论文提交量增长20倍可以看出。大量新作者来自非计算机的NLP领域,推动了各个学科扩展。其次,令人惊讶的是...
鲁班模锤1
0回复
288浏览
arXiv
LLM
像Microsoft
部署满血DeepSeek R1的避坑指南-vLLM 0.7.1
社区头条
热门内容榜
• 最近上榜
今天看到vLLM的朋友圈发布了DeepSeekR1的PP支持,立刻开始我的捣鼓之旅,假如我训练的超大MoE上线了,也得做好技术准备工作是不嘛。把踩坑经验给大家分享一下,希望能够相比于官方文档更白话一点。DistributedInferenceandServing:https:docs.vllm.aienlatestservingdistributedserving.htmlrunningvllmonmultiplenodes知乎游凯超说一定要让整个过程变得丝滑无比,我俩配合做了几个验证,现在应该只需要Step0和Step3就可以run起...
NLP工作站
0回复
2403浏览
DeepSeek R1
-vLLM 0.7.1
Step3
WebWalker:通过Multi Agent提升RAG在开放域QA的性能
WebWalker:BenchmarkingLLMsinWebTraversal检索增强生成(RAG)在开放域问答任务中表现出色。然而,传统搜索引擎可能会检索浅层内容,限制了大型语言模型(LLM)处理复杂、多层次信息的能力。为了解决这个问题,我们引入了WebWalkerQA,一个旨在评估LLM执行网页遍历能力的基准。它评估LLM系统性地遍历网站子页面以获取对应信息的能力。同时我们提出了WebWalker,一个通过explorercritic范式模拟人类网页导航的multiagent框架。...
大语言模型论文跟踪
0回复
189浏览
WebWalker
RAG
QA
小红书 NoteLLM-2:用于推荐的多模态表征
一、背景本文中我们继续介绍小红书用于多模态场景笔记推荐的NoteLLM2。对应的论文为:[2405.16789]NoteLLM2:MultimodalLargeRepresentationModelsforRecommendation[1]二、摘要LLM在文本理解方面展现了卓越能力,现有研究也已探讨了其在文本Embedding任务中的应用,然而,利用LLM辅助多模态表征任务的研究尚不多见。本文作者旨在探索LLM在多模态ItemtoItem(I2I)推荐中增强多模态表征的潜力。如下图Figure1所示,一种可行的方...
amei2000go
0回复
341浏览
NoteLLM-2
多模态
NoteLLM
清华大学深度解析:RLHF 真的能规模化吗?
图片RLHF的规模化之谜:真的值得无限投入算力吗?强化学习自人类反馈(RLHF)已成为大语言模型(LLM)后训练的关键步骤,帮助ChatGPT、Llama等模型更符合人类偏好。然而,RLHF是否像预训练那样,能通过增加算力和数据带来持续提升?清华大学与知乎AI的最新研究对此进行了系统性分析,揭示了RLHF的规模化极限,并提出优化策略。图片研究方法:三大核心变量的深入探究研究团队围绕模型规模、数据多样性、推理计算预算三大因素,训...
sbf_2000
0回复
278浏览
RLHF
LLM
训练
VLLM 与 Ollama:如何选择合适的轻量级 LLM 框架?
社区头条
热门内容榜
• 最近上榜
VLLM是一款经过优化的推理引擎,在令牌生成速度和内存管理效率上表现出色,是大规模AI应用的理想之选。Ollama则是一个轻量级、易上手的框架,让在本地电脑上运行开源大语言模型变得更加简单。那么,这两个框架该选哪一个呢?接下来,我们会从性能、易用性、适用场景、替代方案,以及详细的安装步骤等方面进行全面对比,帮助你做出更合适的选择。一、VLLM和Ollama是什么?基础知识解析在深入探讨之前,我们先来了解一下这两个框...
AI论文解读
0回复
1878浏览
VLLM
Ollama
框架
NeurIPS 2024 | REBASE,比MCTS更高效的Inference Scaling算法
还在为大模型推理速度慢、成本高而烦恼吗?这篇来自CMU和清华大学的论文给你带来了一个颠覆性的解决方案!他们发现,在推理大型语言模型时,“大力出奇迹”不再是真理!通过深入研究推理过程中的计算与性能关系,他们提出了“推理缩放定律”,并革命性地推出了一种名为REBASE的全新算法。REBASE就像一位聪明的向导,能够巧妙地利用奖励信号,指引模型在推理的迷宫中高效探索,避免了传统方法中耗时费力的盲目搜索。实验结果令...
arnoldzhw
0回复
363浏览
MCTS
REBASE
算法
对标DeepSeek,Gemini 2.0轻量模型开卷“极致性价比”!谷歌守住多模态阵地应用们都要开始做推理了!
原创
社区头条
编辑伊风出品51CTO技术栈(微信号:blog51cto)DeepSeek的火热,让Google坐不住了!深夜,Google推出了Gemini2.0全家桶,一口气推出了三个模型型号:Gemini2.0Flash、Gemini2.0FlashLiteGemini2.0Pro。图片看技术报告,2.0系列的三个模型在通用、代码、推理、事实性、多语言等方面指标如下。比起此前Gemini1.5系列着实有了多维度的进化,但明显没有性能的断层式飞跃。图片再来看最近AI圈关注的重中之重——推理。谷歌也在Gemini...
51CTO技术栈
0回复
270浏览
DeepSeek
模型
多模态
只需一步!上交&哈佛提出FluxSR:首个基于12B+大模型的单步扩散真实世界超分模型
精华
论文链接:https:arxiv.orgpdf2502.01993代码&模型链接:https:github.comJianzeLi114FluxSR亮点直击开发了FluxSR,一种基于FLUX.1dev的单步扩散RealISR模型。这是首个基于超过120亿参数大模型的单步扩散RealISR模型。提出了一种流轨迹蒸馏(FTD)方法,明确建立了噪声到图像流与低分辨率到高分辨率流之间的关系。在噪声到图像流保持不变的情况下,能够保留T2I模型中的高度逼真性,并有效地将其转移到低分辨率到高分辨率的流中...
angel
0回复
703浏览
模型
技术
生成
把 DeepSeek 部署在你的电脑上,保姆级教程,建议收藏!
原创
热门内容榜
• 最近上榜
本地电脑部署主要适用于以下5种场景:第一、设备性能较强,配备独立显卡,能够支撑高效运行。第二、需要处理敏感数据,对数据安全性有较高要求,以防泄露。第三、需要与本地工作流程紧密结合,应对频繁或复杂的任务处理。第四、日常频繁使用,且API调用成本较高,本地部署有助于降低成本。第五、希望在开源模型基础上,进行个性化定制和优化。1、DeepSeekR1模型部署2步搞定本部分内容将重点阐述如何在本地环境下利用Ollama来部...
玄姐聊AGI
0回复
2742浏览
DeepSeek
DeepSeek 再爆大招,Janus-Pro 炸裂出场!
没想到,DeepSeek连续放出重磅消息,速度如此之快。转眼间,DeepSeek便推出了全新的多模态模型,统一多模态理解与生成。JanusPro多模态大模型震撼登场,采用Transformer架构,并未沿袭Diffusion方法,又一次颠覆了行业的认知,紧追OpenAI的脚步。拥有高性能电脑的同学们可以开始尝试了,7B版本已经能够超越StableDiffusion和DALLE3,强大到让人难以置信!这个春节,真是激动人心。见证国产AI的辉煌时刻。JanusPro多模态框架革新...
玄姐聊AGI
0回复
300浏览
DeepSeek
多模态大模型
Janus-Pro
ICLR 2025 | One Prompt One Story!基于单个prompt实现免训练身份一致图像生成
文章链接:https:arxiv.orgabs2501.13554GitHub代码:https:github.combyliutao1Prompt1Story项目主页:https:byliutao.github.io1Prompt1Story.github.io亮点直击首次分析了语言模型维持固有上下文一致性的能力,能够在一个提示中让多个帧的描述天然指代同一主体身份。基于上下文一致性特性,提出了一种新颖的免训练方法——OnePromptOneStory,用于实现一致的文本到图像生成。更具体地,进一步提出了提示加权(SVR)和交叉...
angel
0回复
547浏览
模型
训练
生成
用强化学习重塑多模态AI:解读Kimi k1.5的突破与创新
原创
01、概述近年来,随着人工智能的快速发展,强化学习(ReinforcementLearning,RL)技术逐渐成为推动AI模型性能提升的重要工具。相比传统的基于静态数据集的训练方法,RL通过交互与反馈实现了模型性能的迭代优化,为解决复杂任务(如数学推理、代码生成和多模态数据理解)开辟了全新路径。在这种背景下,由Kimi团队开发的下一代多模态大语言模型——Kimik1.5,凭借其创新的设计和卓越的性能脱颖而出。本文将详细解析Kimik1.5的技...
Halo咯咯
0回复
658浏览
大语言模型
多模态
探索 Gemini 2.0:2025 年不可错过的 AI 工具
原创
01、概述最近,Google推出的Gemini2.0成为了科技圈的热议话题。这款AI工具被誉为“颠覆者”,它的多模态能力、实时交互功能和多语言支持让人眼前一亮。但它到底值不值得尝试?有哪些亮点,又有哪些短板?作为一个已经“深度体验”的人,今天我就来带大家全面了解这款新一代AI工具的魅力,并告诉你如何用好它,让工作事半功倍。02、Gemini2.0的三大独特之处1)真·多模态:一次性能处理文字、语音、视频相比传统AI工具那种“贴补...
Halo咯咯
0回复
771浏览
Gemini 2.0
AI 工具
Gemini 2.0:针对代理时代的新AI模型
原创
社区头条
01、概述在信息快速迭代的时代,人工智能(AI)正以惊人的速度改变着我们的生活。从搜索引擎到多模态技术,AI的触角不断延伸,推动着人类科技的边界。作为AI领域的先锋,GoogleDeepMind近日发布了最新的AI模型——Gemini2.0,宣告了“智能代理时代”的到来。今天,我们将为大家详细解读Gemini2.0的核心亮点、实际应用以及对未来生活的深远影响。02、从1.0到2.0:GeminiAI的蜕变与进化1)Gemini1.0与1.5:奠定多模态AI的基础Gemi...
Halo咯咯
0回复
783浏览
Gemini 2.0
AI模型
基于AG2+ChromaDB开发多代理RAG系统
原创
社区头条
本文中,我们将介绍如何使用开源的AI多代理框架AG2和开源的向量数据库ChromaDB构建一个多代理RAG系统。引言近年来,检索增强生成(RAG)系统得到了迅速改进。理想情况下,我们可以将其演变划分为三个阶段。第一阶段,即在LLM出现之前,信息检索系统主要依赖于传统的搜索算法和索引技术。这些系统在理解上下文和生成类似人类的响应方面的能力是非常有限的。第二阶段,出现了LLM(大型语言模型)阶段,导致了剧烈的范式转变。现在...
51CTO内容精选
0回复
414浏览
MAS
LLM
大型语言模型
暂无内容
1
7
8
9
10
11
12
13
14
15
客服