背景大型语言模型(LLMs)如GPT4和LLaMA3凭借Transformer架构的强大情境学习(InContextLearning,ICL)能力,能够从有限的示例中快速学习并适应新任务。然而,ICL的泛化边界和脆弱性一直缺乏系统性的理解,这限制了其在实际应用中的潜力发挥。清华大学的研究团队通过定义一个以任务为中心的框架,从三个维度系统地研究了Transformer架构在ICL下的泛化能力,并提出了优化训练数据设计的重要指导原则。研究框架:三维泛化能力分析...
融合地理定位与对话能力的新型多模态模型图像地理定位技术在过去几年取得了显著进展,但传统模型仅限于提供GPS坐标,缺乏对位置的深入理解和与用户进行有意义对话的能力。中佛罗里达大学的研究团队最近提出了一种创新解决方案——GAEA(GeolocationAwareConversationalModel),这是首个将精确地理定位能力与丰富对话功能相结合的开源多模态模型。GAEA不仅能确定图像的拍摄位置,还能提供关于该位置的详细信息,包括附近的地标...
引言解码人类大脑处理语言的机制是神经科学的核心目标之一。人类语言处理由大脑的语言网络(LanguageNetwork,LN)支持,这是一组位于大脑左侧的前额叶和颞叶区域,具有对语言输入的选择性反应能力。近年来,随着机器学习的快速发展,基于大规模文本语料库训练的下一词预测的大型语言模型(LLMs)成为了模拟人类语言网络内部过程的有力工具。本文旨在探讨大型语言模型如何与人类语言网络对齐,并分析这种对齐在模型训练中的演化...
2025-03-12 00:42:58 737浏览 0点赞 0回复 0收藏
引言大型语言模型(LLMs)的推理能力近年来取得了显著进展,尤其是在训练后阶段。诸如DeepSeekR1、KimiK1.5和OpenAIo1等模型展现了卓越的逻辑推理能力。然而,这些成果的可复现性和扩展性仍面临诸多挑战,特别是在缺乏训练代码和数据集的情况下。LogicRL框架的提出旨在通过基于规则的强化学习(RL)方法,填补这一研究空白,并推动LLMs推理能力的进一步发展。LogicRL通过在逻辑谜题上进行训练,成功开发了类似DeepSeekR1的推理...
2025-03-12 00:42:12 847浏览 0点赞 0回复 0收藏
研究背景与创新点深度学习模型,尤其是大型语言模型(LLMs)在推理任务上的表现令人瞩目。传统观点认为,模型参数量是决定推理能力的主要因素。然而,GoogleResearch团队的这项研究《推理潜在思维:循环变换器的力量》提出了一个更为大胆的观点:许多推理问题主要需要的是足够的深度,而非海量参数。该研究探索了循环变换器(LoopedTransformers)在推理任务中的应用潜力,并揭示了模型架构与推理能力之间的深层联系。本文的核...
2025-02-27 11:24:49 847浏览 0点赞 0回复 0收藏
摘要大型语言模型(LLMs)在各个领域都取得了显著的成功,然而,由于它们所处的复杂和高维损失景观,其优化仍然是一个重大挑战。虽然自适应优化器如AdamW被广泛使用,但它们存在关键限制,包括无法捕捉坐标之间的相互依赖性以及高内存消耗。本文分析了COSMOS优化器,这是一种新颖的混合优化器,它利用梯度矩阵中特征子空间的重要性变化来实现内存效率,同时不牺牲优化性能。COSMOS将SOAP应用于主特征子空间,该子空间捕捉了主要...
2025-02-27 11:20:40 1010浏览 0点赞 0回复 0收藏
摘要模仿学习(ImitationLearning,IL)作为一种通过模仿示范来教授智能体复杂行为的范式,已经在机器人学习领域展现出巨大潜力。然而,随着机器学习技术的快速发展,设计现代模仿学习策略需要在特征编码、架构、策略表示等方面做出众多决策,这些选择构成了一个庞大且尚未被充分探索的设计空间。本文详细分析了XIL框架,这是一个开源的模块化框架,旨在系统地探索模仿学习策略的设计空间。通过对XIL的架构设计、核心组件以及在L...
2025-02-27 11:18:08 1062浏览 0点赞 0回复 0收藏
研究背景与动机本文提出了一种新的低秩适应(LoRA)变体GoRA(GradientdrivenAdaptiveLowRankAdaptation),通过梯度信息来自适应地分配秩和初始化低秩适配器的权重。该方法在保持LoRA高可用性和效率的同时显著提升了模型性能。现有问题秩的选择问题:LoRA的性能很大程度上取决于秩的选择,但增加秩会导致内存使用量上升。初始化策略局限:现有的非零初始化方法要么需要重置全部权重,要么需要保存额外的初始化结果。可用性与效率的...
2025-02-20 10:41:13 1050浏览 0点赞 0回复 0收藏
论文概述本文针对可解释人工智能(XAI)中的一个关键问题展开研究局部代理模型在文本领域中的稳定性估计。研究重点关注了相似度度量方法对XAI稳定性评估的影响,并提出了一种基于同义词权重的新型评估框架。研究背景可解释AI的重要性随着AIML技术的快速发展,模型的复杂度不断提高,其内部工作机制越来越难以理解。这种"黑盒"特性在医疗、金融等高风险领域尤其令人担忧。例如:医疗诊断系统的错误判断可能导致严重后果金融模型的决策...
2025-02-12 14:24:24 1111浏览 0点赞 0回复 0收藏
研究背景与意义在当前推荐系统研究领域中,知识图谱(KnowledgeGraph,KG)作为一种强大的数据集成和表示工具,已经被广泛应用于解决数据稀疏性和可解释性等问题。然而,不同推荐系统之间知识图谱的异构性和集成问题仍然是一个亟待解决的挑战。本文提出了RecKG(RecommendersystemKnowledgeGraph),一个专门面向推荐系统的标准化知识图谱框架,旨在实现异构推荐系统之间的无缝集成和互操作。核心创新点标准化知识图谱设计提出了专门针对...
2025-02-04 20:42:15 1030浏览 0点赞 0回复 0收藏
一、研究背景与意义近年来,大语言模型(LLMs)在医疗领域的应用展现出巨大潜力,特别是在疾病诊断和治疗规划等方面。然而,现有的医学大语言模型在处理复杂临床场景时,往往难以进行深度推理,尤其是在差异化诊断和个性化治疗建议等方面存在明显短板。本研究提出的FineMedLMo1模型,通过创新性地结合高质量合成医学数据和长格式推理数据,采用监督微调(SFT)和直接偏好优化(DPO)技术,显著提升了模型的医学推理能力。二、技术创新...
2025-01-20 12:15:09 1809浏览 0点赞 0回复 0收藏