51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
WOT技术大会
IT证书
公众号矩阵
移动端
短视频
免费课程
课程排行
直播课
软考学堂
全部课程
厂商认证
IT技术
25年5月软考
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
我的关注
全部帖子
默认
发布时间
热度
原创
精华
热门标签
AI
人工智能
智能体
数据合成方法-让模型自己说出用了哪些指令对齐数据
写在前面大家好,我是刘聪NLP。大模型时代,数据至上,如何利用大模型合成更多高质量数据也备受关注。今天给大家分享一个有意思的大模型合成数据方法MAGPIE,在不需要种子数据和额外人工干预的情况下,挖掘出对齐过的模型自身的指令数据。《MAGPIE:AlignmentDataSynthesisfromScratchbyPromptingAlignedLLMswithNothing》paper:https:arxiv.orgabs2406.08464github:https:github.commagpiealignmagpie核心思想:对齐过的大模型...
NLP工作站
0回复
1206浏览
数据
模型
对齐
LLM基础模型系列:Fine-Tuning总览
原创
由于对大型语言模型,人工智能从业者经常被问到这样的问题:如何训练自己的数据?回答这个问题远非易事。生成式人工智能的最新进展是由具有许多参数的大规模模型驱动的,而训练这样的模型LLM需要昂贵的硬件(即许多具有大量内存的昂贵GPU)和花哨的训练技术(例如,完全分片的数据并行训练)。幸运的是,这些模型通常分两个阶段进行训练——预训练和微调。其中前一个阶段(要)昂贵得多。鉴于高质量的预训练LLMs很容易在网上获...
鲁班模锤1
0回复
1229浏览
LLM
算法
技术
基于LangGraph多智能体技术,搭建AI写作自动化系统
1LangGraph概述LangGraph是LangChain的增强版,专注于构建智能体及多智能体流程。其核心优势在于新增的循环流程构建功能以及内嵌的记忆机制,这些特性对于智能体的构建极为重要。LangGraph为开发者提供了高度的控制能力,这在自定义智能体和流程的开发中极为关键。市面上绝大多数的智能体都是针对特定应用场景进行了定制。LangGraph不仅赋予了开发者灵活定制智能体的能力,还提供了直观且易于操作的开发体验。2构建终极自主研究...
小虎哦哦
0回复
1622浏览
多智能体
技术
AI
多智能体(Multi-Agent)系统是怎么一回事?
嘿,大家好!这里是一个专注于AI智能体的频道!今天来简单聊聊Multiagent系统,明天会分享一个简单的多智能体系统实战~。MultiAgent系统到底是啥?想象一下:如果有一个团队,每个成员都有自己的角色和任务,但又能互相协作,共同完成一个目标,那会是怎样的体验?MultiAgent系统就是这样一个概念。在AI的世界里,每个智能体都有自己的个性和角色,它们通过语言模型(LLM)来驱动,相互之间还能交流协作。那MultiAgent系统怎么...
探索AGI
0回复
2330浏览
多智能体
系统
• Agent
不妨一试!这六种在智能手机上运行的开源LLM
原创
您可以在不使用互联网的情况下,利用智能手机上LLM的强大功能,最大限度地加强隐私和控制。大语言模型(LLM)需要大量的计算资源,这些资源通常局限于功能强大的服务器。然而,新一代的紧凑模型让您可以直接在智能手机上运行这些强大的语言模型。有意思的是,您不需要互联网就可以在智能手机上使用LLM。下面这六种开源LLM经训练和优化后,可以在智能手机上使用。Gemma2B:谷歌针对移动语言任务的紧凑型高性能LLM。Phi2:微软的小...
51CTO内容精选
0回复
1367浏览
LLM
大语言模型
开源
大型语言模型(LLM)在机器人领域的机遇、挑战与展望
原创
精华
摘要—大型语言模型(LLMs)经历了显著的扩展,并且越来越多地被整合到各个领域中。特别是在机器人任务规划领域,LLMs利用其先进的推理和语言理解能力,根据自然语言指令制定精确高效的行动计划。然而,对于具体化的机器人任务,即机器人与复杂环境互动的任务,仅文本的LLMs常常因为缺乏与机器人视觉感知的兼容性而面临挑战。本研究提供了一个全面的概述,介绍了LLMs和多模态LLMs如何被整合到各种机器人任务中。此外,我们提...
AIRoobt
0回复
2322浏览
大模型
机器人
探索大型语言模型在电能行业的能力与局限
原创
摘要:大型语言模型(LLM)作为聊天机器人因其在自然语言处理以及广泛任务中的多功能能力而引起了广泛关注。虽然各行业对采用此类基础模型的人工智能工具充满了热情,但需要探讨此类LLM在提升电能行业运营方面的能力与局限,本文在这方面确定了有价值的研究方向。未来研究的关键方向包括用于微调LLM的数据收集系统、将电力系统特定工具嵌入LLM,以及基于检索增强生成(RAG)的知识库,以提高LLM响应的质量和LLM在安全关键应用中...
AIRoobt
0回复
2291浏览
大模型
电力系统
提升RAG系统性能10条策略建议
原创
在大型语言模型(LLM)时代,检索增强生成(RetrievalAugmentedGeneration,RAG)系统通过结合检索与生成技术,显著提升了LLM的回复内容生成质量。然而,优化RAG系统性能是一个复杂的过程,涉及到数据处理、模型选择、算法优化等多个方面。本文将详细介绍10条策略建议,帮助您深度优化RAG系统的性能表现。数据清理数据质量直接影响RAG系统的性能。在预处理阶段,需要对数据进行彻底的清理和规范化,去除噪声和错误信息,确保数据...
AIGC观察者
0回复
1122浏览
RAG
大模型
OpenAI在RAG技术上的最佳实践与策略
原创
随着人工智能技术的不断演进,大型语言模型(LLM)的性能优化已成为AI领域的热点问题。OpenAI的技术专家团队分享了他们在检索增强生成(RAG)技术、提示工程和微调方面的最佳实践,为提升模型性能提供了宝贵的经验和策略。一、微调技术的最新进展JohnAllard深入介绍了OpenAI在微调领域的最新进展,包括:函数调用数据的微调:通过特定数据集的微调,优化模型对特定函数调用的理解。持续微调:提供了一种机制,允许模型随着时间...
AIGC观察者
0回复
1704浏览
大模型
RAG
AI大模型技术的四大核心架构演进之路
原创
随着人工智能技术的飞速发展,大模型技术已经成为AI领域的重要分支。本文将深入探讨四种关键的大模型技术架构:纯粹Prompt提示词法、Agent+FunctionCalling机制、RAG(检索增强生成)以及Finetuning微调技术,揭示它们的特性和应用场景。一、纯粹Prompt提示词法:构建直观交互模式纯粹Prompt提示词法是AI大模型交互的直接形式,它通过模拟自然对话,实现用户与AI的即时互动。核心特性:即时性:AI模型能够迅速响应用户输入,提...
AIGC观察者
0回复
1570浏览
大模型
RAG
生成式 AI 注定会颠覆搜索
原创
作者EmiliaDavid编译伊风出品51CTO技术栈(微信号:blog51cto)AI搜索正在向更深处走去。AI搜索的领头羊——Perplexity最近对其ProSearch人工智能工具进行了升级。主要改进是启动了多步骤推理,这使得AI搜索可以解决更复杂的问题。Perplexity能理解问题何时需要规划,逐步实现目标,并更高效地合成综合答案,同时可以在先前结果的基础上启动后续搜索。无独有偶,腾讯所推出的大模型应用元宝,也布局了AI搜索。当用户进行提问时...
51CTO技术栈
0回复
1112浏览
生成式
AI
搜索
使用“反事实任务”评估大型语言模型
LLMs的智能本质是什么?在之前的文章中,我谈到了评估大型语言模型能力的困难。这些模型在许多基准测试中表现出色,但我们通常不知道基准测试中的测试项目,或足够相似的项目,是否出现在训练数据中。这些模型是在进行一般性的理解和推理,还是在进行AI研究员SubbaraoKambhampati所说的“近似检索”——依赖于模型训练数据中包含的文本模式?反事实任务范式反事实任务范式可以帮助回答这个问题。在这个范式中,模型在成对的任...
lintoms
0回复
1502浏览
语言
模型
LLM
Jina AI将LLM Reranker延迟打下来了:21秒变3秒!
继JinaRerankerv2之后,JinaAI又开源了PERank,一种新的基于LLM的重新排序器,用于高效的列表式段落重新排序。不是将原始文本输入到LLM的上下文窗口,而是使用嵌入模型将每个段落表示为一个特殊标记,然后将[指令]+[查询]+[特殊标记]输入到LLM中。在推理时,PERank将输出空间限制在这些特殊标记上,从而实现更高效的解码。PERank将重新排序100个文档的延迟从21秒大幅减少到3秒。RankGPT(上)与PERank(下)的比较。RankGPT将整...
PaperAgent
0回复
1421浏览
Jina AI
LLM
上下文窗口
从CUDA到Keras,这些年你应该了解的深度学习工具
“风起于青萍之末”,十年前,Nvidia被人工智能(AI)清风拂面,推出CUDA,成功把自己打造成风口上的飞猪。“Nvidia还从没有抢到过像人工智能这样强的风口,这意味着我们在GPU领域的成就无以伦比”,在AI淘金热潮中,N记这家“卖水的”走到了2017CES聚光灯下。“据估计,世界上目前有3000家AI初创公司,大部分都采用了Nvidia提供的硬件平台”,如果大家最近在某东关注过游戏本,可以直观感受到N记这种成功。一切得从GPU说起。GP...
ceesoft
0回复
1139浏览
CUDA
Keras
深度学习
《自然》科学期刊:人工智能与量子力学的交汇,分布式智能系统中的自组织现象
分布式智能系统(DIS)是由多个智能代理组成的系统,这些代理可以是人类(自然智能代理,NIA)或人工智能(人工智能代理,AIA)。在DIS中,代理之间通过网络进行信息交换和协作,共同完成复杂的任务。随着互联网和通信技术的发展,DIS在工业、经济、管理和日常生活中的应用越来越广泛。例如在智能制造中,多个机器人可以通过DIS协同工作,提高生产效率;在智能交通中,车辆可以通过DIS共享交通信息,优化行驶路线;在智能家居中...
xuxiangda
0回复
1024浏览
人工智能
量子力学
智能
Agent智能体?我们要的到底是什么
本文将深入探讨智能体的概念、为何“具有智能体特性”变得如此重要,以及这一趋势如何影响我们对未来技术的构想。什么是智能体?传统应用程序通常遵循预先定义好的规则和逻辑,而智能体则不同,它可以根据LLM的理解和判断,动态地选择下一步操作,这使得智能体能够处理更加复杂和不确定的任务。简单来说,智能体就是一个利用LLM来决定应用程序控制流程的系统,可以被视为一种能够自主决策和执行任务的系统。它通过与外部数据和...
ermulong
0回复
1663浏览
Agent
Agentic
LLM
序列建模中Next Item Prediction的代表性工作
NextItemPrediction任务是序列推荐系统中的一个基础任务,根据用户的历史浏览行为item序列,预测用户下一个感兴趣的item。今天这篇文章,给大家梳理一下近几年来,NextItemPrediction任务的代表性工作。1.基于BERT的序列建模论文标题:BERT4Rec:SequentialRecommendationwithBidirectionalEncoderRepresentationsfromTransformerBERT4Rec是阿里在2019年提出的一种基于BERT的NIP建模方法。在之前的工作中,大多基于RNN的单向模型...
海因斯DK
0回复
1778浏览
建模
结构
BERT
新一代的交互形式LUI(language user interface)到来,微软为它架了一座桥
ChatGPT为代表的LLM以其惊艳的自然语言理解能力得到大众认可之后,一大批基于自然语言的应用被纷纷提上日程,以对话的方式进行人机交互的模式再一次被业内所关注。大约五六年前,智能音箱因为其自然语言对话的交互形式,掀起了一场智能音箱热潮,各大公司对其产品给予了厚望,但由于技术不够成熟,理解和对话能力不够强,导致了智能音箱始终难以作为大众消费品获得成功,而当下基于大模型的语义理解和对话能力有了质的提高,大...
Syrupup
0回复
1569浏览
LUI
typeChat
OpenAI
LFPLM:基于预训练语言模型的通用灵活负荷预测框架
原创
摘要——准确的负荷预测对于维持发电机和消费者之间的电力平衡至关重要,特别是在可再生能源日益融合的情况下,这些能源带来了显著的间歇性波动。随着数据驱动方法的发展,基于机器学习和深度学习的模型已成为负荷预测任务的主要方法。近年来,预训练语言模型(PLM)在各个领域表现出色,取得了显著进展。本文提出了一种基于PLM的负荷预测方法,该方法不仅具有准确的预测能力,还具有通用性和灵活性。此外,本文还提出了一...
AIRoobt
0回复
1549浏览
大模型
RAG技术性能提升之文档分块策略方案
原创
在人工智能领域,尤其是大型语言模型(LLM)的应用中,检索增强生成(RetrievalAugmentedGeneration,RAG)技术正变得越来越重要。RAG技术通过结合检索和生成能力,为模型提供了丰富的外部知识源,从而生成更准确、更符合上下文的答案。本文将深入探讨RAG技术中的文档分块策略,这些策略对于提高检索效率和生成质量具有决定性作用。一、文档分块策略的重要性文档分块是RAG技术中的关键步骤,它影响着模型对信息的检索和理解。合...
AIGC观察者
0回复
2609浏览
RAG
大模型
暂无内容
1
95
96
97
98
99
100
101
102
103
客服