PyTorch研习社
LV.1
打破知识壁垒,做一名知识的传播者
声望 89
关注 0
粉丝 0
私信
主帖 6
回帖
随着LLM应用的广泛普及,如何提高模型的推理效率并降低资源消耗成为了技术发展中的一大挑战。Unsloth通过引入多个强化学习(RL)算法和最新的量化技术,显著提高了LLM在推理和微调过程中的性能,并大幅降低了显存消耗。DeepSeek的研究人员在用纯强化学习(RL)训练R1Zero时观察到了一个“灵光一现”的时刻。模型学会了通过重新评估最初的思路来延长思考时间,而无需任何人工指导或预定义指令。Unsloth对整个GRPO过程进行了增强...
2025-02-11 13:48:58 968浏览 0点赞 0回复 0收藏
整个过年期间,AI圈的头条都被被DeepSeek霸占了。2月1日,OpenAI终于按捺不住,推出了全新的推理模型系列o3mini。这个系列不仅首次对免费用户开放了推理模型,还将成本降低了多达15倍(相比之前的o1系列)。OpenAI还表示,这是其推理模型系列中最新且最具成本效益的模型:最近,AI社区非常热衷于将DeepSeekR1与其他推理模型进行对比。尤其是经典的编程挑战——模拟弹跳球:“WriteaPythonscriptthatmakesaballbouncewithinacert...
2025-02-03 22:13:08 404浏览 0点赞 0回复 0收藏
LLM(LargeLanguageModel,大型语言模型)是一个功能强大的新平台,但它们并不总是使用与我们的任务相关的数据或者是最新的数据进行训练。RAG(RetrievalAugmentedGeneration,检索增强生成)是一种将LLM与外部数据源(例如私有数据或最新数据)连接的通用方法。它允许LLM使用外部数据来生成其输出。要想真正掌握RAG,我们需要学习下图所示的技术(技巧):图片这个图看起来很让人头大,但是不用担心,你来对地方了。本系列教程...
2025-01-17 13:06:08 646浏览 0点赞 0回复 0收藏
随着AI,尤其是LLM的迅猛发展,AIAgent正成为变革性工具,重新定义SaaS(SoftwareasaService,软件即服务)平台的运营模式、价值交付以及用户交互方式。到2025年,AIAgent不仅会增强现有系统,还将推动全新商业模式的诞生。垂直AIAgent:超越传统SaaS的新范式近年来,垂直AIAgent(VerticalAIAgents)的概念备受关注。这些专为特定行业和场景设计的Agent,可能引发比传统SaaS更深远的转变。据YC的Lightcone播客指出,这一领域将...
2025-01-09 13:02:45 534浏览 0点赞 0回复 0收藏
AI正以前所未有的速度进化,OpenAI的o3模型短短两个月内便从本科生水平跃升至博士级别,这一突飞猛进的进展让人震惊,但这一趋势已不可逆转。AI搜索公司Exa的CEOWillBryk在X上发表了一篇探讨AI的迅猛发展及其对未来社会、工作领域的深远影响的长文:《ThoughtsontheeveofAGI》(AGI前夜的思考)。1.AI发展迅速:从本科生到博士级别的进化​AI从本科水平到博士水平的快速跃升,进展速度令人震惊。OpenAI的o3模型展示了AI的巨大潜...
2024-12-31 13:23:27 1172浏览 0点赞 0回复 0收藏
LazyGraphRAG是微软最新推出的一种与GraphRAG截然不同的方法,该方法不需要事先汇总源数据,从而避免了前期索引成本,而前期索引成本对于某些用户和用例来说可能是难以承受的。LazyGraphRAG的一个关键优势是其在成本和质量方面的固有可扩展性。与标准向量RAG、RAPTOR、GraphRAG和DRIFT相比,LazyGraphRAG在成本质量范围内表现出色,如下所示:LazyGraphRAG数据索引成本与向量RAG相同,仅为完整GraphRAG成本的0.1%。对于与向量RA...
2024-12-24 10:55:40 862浏览 0点赞 0回复 0收藏
获得成就
已积累 1117 人气
获得 0 个点赞
获得 0 次收藏