51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
WOT技术大会
IT证书
公众号矩阵
移动端
短视频
免费课程
课程排行
直播课
软考学堂
全部课程
厂商认证
IT技术
25年5月软考
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
我的关注
全部帖子
默认
发布时间
热度
原创
精华
热门标签
DeepSeek
AI
大模型
两难抉择:自己定制LLM代理还是使用现有LLM代理框架?
原创
本文旨在帮助你在使用自己定制的LLM代理还是使用现有LLM代理框架之间作出正确的选择。简介首先,要感谢JohnGilhuly对本文的贡献。当下,人工智能代理暂时处在大休整时期。随着多个新的AI开发框架的不断出现和人们对该领域不断进行新的投资,现代人工智能代理正在克服不稳定的初始阶段,迅速取代RAG而成为实施重点。那么,2024年最终会成为什么样的年份呢?是自主人工智能系统接管我们人工来书写电子邮件、预订航班、处理数据,...
51CTO内容精选
0回复
955浏览
人工智能
LLM代理
LLM代理框架
阿里国际发布首个大规模商用翻译大模型Marco,效果超Google、DeepL等,全球开放!
原创
编辑星璇出品51CTO技术栈(微信号:blog51cto)在AI调用量最高的场景之一——机器翻译,阿里国际的AI团队有了新进展。10月16日,阿里国际副总裁、AI负责人张凯夫在接受彭博社专访时表示,阿里国际最新研发的Marco翻译大模型,支持中、英、日、韩、西、法等15种全球主流语种。目前已在阿里国际AI官网Aidge上发布,面向全球用户开放使用。基于目前广泛使用的开源评测数据集Flores,Marco翻译大模型在BLEU自动评测指标上,领先于市...
51CTO技术栈
0回复
1755浏览
阿里国际
大模型
Marco
多模态-故障诊断 | 大核卷积开启视觉新纪元!
前言本期推出结合CVPR2022视觉顶会论文RepLKNet的多模态故障诊断创新模型,适合各种故障诊断领域、电能质量扰动信号、各种声信号、脑电信号等分类任务!创新模型还未发表!!!有小论文、毕业论文需求的不容错过!提供马尔可夫转换场MTF、递归图RP、格拉姆矩阵GAF、连续小波变换CWT、短时傅里叶变换STFT五种时频图像变换方法,可灵活替换多模态特征中的时频图像类型!1创新模型相关解释●数据集:CWRU西储大学轴承数据集●环境框...
Tang_Lan
0回复
1047浏览
多模态
故障诊断
视觉
忘记Tool检索,拥抱全新Agent ToolGen!
传统大模型工具调用的方法依赖于将工具描述作为上下文输入,这受到上下文长度的限制,并需要单独的、通常效率低下的检索机制。之前基于检索的方法与ToolGen之间的比较。以前的方法使用检索器根据相似性匹配检索相关工具,这些工具进一步被放入提示中供LLMs选择。ToolGen可以通过直接生成工具标记来检索工具。ToolGen也可以在不依赖任何外部检索器的情况下完成任务。为此,微软等提出ToolGen,这是一种将工具知识直接整合到LLM参...
PaperAgent
0回复
1123浏览
Tool
检索
Agent
图解LLM-Agent大模型智能体
LLMAgent大模型智能体热度空前,但智能体是什么、为什么、怎么办,行业还没有统一认知,典型的小学语文课本里“小马过河”的现实版。是什么一、OpenAI工程师LilianWeng的定义2023.6.23规划子目标和分解:将大型任务分解为更小的、可管理的子目标。反思和改进:对过去的行动进行自我批评和自我反省,从错误中学习。记忆短期记忆:上下文学习都是利用模型的短期记忆来学习。长期记忆:长期保留和回忆信息的能力。工具使用调用外部...
ceesoft
0回复
1015浏览
LLM
Agent
大模型
人工智能与人类情感的交汇点:一致性评估方法的探索
精华
近来,人工智能(AI)的迅猛发展使其在情感生成和评估领域的应用逐渐成为研究热点。AI技术尤其是生成对抗网络(GANs)和变分自编码器(VAEs),在图像生成方面取得了显著进展。然而情感生成的复杂性和主观性一直是一个挑战。图像能够传达情感,但情感体验具有高度的个人主观性,尤其是在通过AI生成图像并试图传达特定情感时。10月13日arXiv发表的论文《LEVELOFAGREEMENTBETWEENEMOTIONSGENERATEDBYARTIFICIALINTELLIGENCEANDHUM...
xuxiangda
0回复
3055浏览
人工智能
人类情感
方法
LangChain应用开发指南-TruLens用量化对抗幻觉
精华
在AI的发展中,大规模语言模型已经取得了令人瞩目的成果,然而,随之而来的是模型质量和不确定性的问题。如何衡量和改进模型的质量,一直是我们面临的一个挑战。为了解决这些问题,我们将在这篇文章中,介绍LangChain框架和TruLens工具,它们将帮助我们评估模型的质量,提高模型质量,并能够用量化的方法对抗不确定。什么是TruLensTruLens是面向神经网络应用的质量评估工具,它可以帮助你使用反馈函数来客观地评估你的基于LLM(...
ermulong
0回复
917浏览
LangChain
量化
TruLens
清华大学最新发布:统一时序预测模型,上下文长度首次扩展至千级别,适用各类数据集
今天给大家介绍一篇清华大学的时间序列预测最新工作,提出了统一的Transformer时序预测模型,能同时处理单变量和多变量时序预测,并将时序预测的上下文长度首次扩充到千级别。论文标题:TIMERXL:LONGCONTEXTTRANSFORMERSFORUNIFIEDTIMESERIESFORECASTING下载地址:https:arxiv.orgpdf2410.04803v11.背景构建类似NLP领域的统一大模型是时序预测领域近期研究的焦点。虽然前序已经涌现很多工作,但是这些建模方法只能处理...
海因斯DK
0回复
1376浏览
清华大学
数据集
预测模型
A16Z:导出"你的大脑"给AI,你将收获什么?
a16z分析师最新发表的文章《ExportYourBrain:HowIUploadedMyselftoAI》展示了一个令人振奋的产品方向:导出"我们的大脑"给AI,从而在日常生活和工作中获得前所未有的效率和洞察力。这篇文章指明了未来一个非常有前景的AI应用赛道。核心观点:AI作为个人数字化延伸文章的核心观点是,AI不仅仅是简单的任务自动化工具,而是可以通过深度学习我们的思维方式和行为模式,成为我们的"数字化延伸"。这种技术的发展将彻底改变我们的工...
Syrupup
0回复
640浏览
AI
数字化
数据
#AIGC创新先锋者征文大赛# RAG vs 长上下文 LLMs:谁主沉浮?
原创
精华
【本文正在参与AI.x社区AIGC创新先锋者征文大赛】https:www.51cto.comaigc2223.html编者按:随着大语言模型(LLMs)的上下文窗口不断扩大,您是否开始思考:我们还需要花费大量时间和资源来构建复杂的检索增强生成(RAG)系统吗?本文深入探讨了长上下文LLMs与RAG系统的优劣势,揭示了它们在实际应用中的表现差异。通过对最新四篇学术研究的全面分析,作者阐明了长上下文LLMs在某些任务中的优势,同时也指出...
Baihai_IDP
0回复
904浏览
AI
RAG
LLMs
大模型面经——以医疗领域为例,整理RAG基础与实际应用中的痛点
原创
RAG相关理论知识与经验整理。谈到大模型在各垂直领域中的应用,一定离不开RAG,本系列开始分享一些RAG相关使用经验,可以帮助大家在效果不理想的时候找到方向排查或者优化。本系列以医疗领域为例,用面试题的形式讲解RAG相关知识,开始RAG系列的分享本篇主要是理论知识与经验;后续会结合最新的优化方法给出详细的优化代码,和实践中衍生的思考。下面是本篇的快捷目录。1.RAG思路2.RAG中的prompt模板3.检索架构设计一、RAG思...
shizhi02
0回复
1067浏览
大模型
RAG
OpenAI o1:用内部思维链进行复杂推理
原创
精华
本篇将介绍OpenAIo1。OpenAIo1,这是一种新的大型语言模型,经过强化学习训练,可以执行复杂的推理。O1在回答之前会思考在响应用户之前,它可以产生一个很长的内部思维链。OpenAIo1在竞争性编程问题(Codeforces)中排名89百分位,在美国数学奥林匹克竞赛(AIME)资格赛中跻身美国前500名学生之列,在物理、生物和化学问题的基准(GPQA)上超过了人类博士水平的准确性。OpenAI的大规模强化学习算法教会模型如何在高度数据高效...
shizhi02
0回复
1080浏览
OpenAI o1
大型语言模型
多模态大模型最全综述导读
原创
多模态大模型最新研究综述简单版。不知道最近微软出的多模态大模型最全综述MultimodalFoundationModels:FromSpecialiststoGeneralPurposeAssistants大家有没有看包含5大主题一共119页,内容又干又多,目前网上找到的中文解读干货内容都比较全比较长,很容易迷失其中,一直难以看完。本期来给大家做一个这篇论文相对简单的导读;如果大家有想要着重了解部分或感兴趣的内容可以先针对性地看。下面是一个快捷目录。1.章节分布2.具...
shizhi02
0回复
1246浏览
多模态大模型
大模型
如何分析和修复LLM应用程序中的错误
原创
本文通过四个阶段过程来系统地理解和修复LLM应用程序中的错误。大型语言模型(LLM)为机器学习的应用创造了一个新的范式。一方面,用户有一个机器学习模型,可以根据自己的需求和任务进行定制。另一方面,可能无法访问模型的权重和超参数。用户可以通过调整提示和提供给模型的信息来控制模型的行为。这对于那些习惯于开发传统机器学习应用程序的人来说带来了难题。如果没有一种系统的方法来分析错误并进行更正,那么可能会陷入...
51CTO内容精选
0回复
964浏览
机器学习
大型语言模型
LLM
#AIGC创新先锋者征文大赛#PyTorch深度学习基础环境搭建
【本文正在参与AI.x社区AIGC创新先锋者征文大赛】https:www.51cto.comaigc2223.html1.Miniconda安装Miniconda是一个轻量级的Python发行版,只包含最基本的内容——Python、conda以及相关的必须依赖项。它适用于空间要求严格的用户或只需要Python和Conda核心功能的用户。Miniconda由于其轻量级的特点,非常适合那些对存储空间有严格限制的用户,或者只需要使用Python和Conda核心功能的用户。例如,进行简单的包管理和环境管理时...
MinionPy
0回复
574浏览
pytorch;
OpenAI开源多智能体编排框架Swarm!
原创
编辑星璇出品51CTO技术栈(微信号:blog51cto)OpenAI终于又Open了一回!这次开源的对象,竟然轮到了多智能体框架!图片Swarm开源后,X上立马引来开发者的的讨论,有网友表示这能帮助简化许多潜在的多智能体用例的工作流程。图片下面我们就来简单介绍一下这个开源项目。一、Swarm是什么?据github文当介绍,Swarm是一个实验性质的多智能体框架,并不是为生产目的开发的,因此团队表示不会提供任何官方支持。其中,Swarm关注的重...
51CTO技术栈
0回复
794浏览
OpenAI
开源
多智能
发布会上特斯拉Optimus竟是人扮演的?时薪高达48美元!马斯克人形机器人的预言会想星舰一样成功吗?
原创
编辑伊风出品51CTO技术栈(微信号:blog51cto)史上最短发布会结束后,马斯克一夜搞没了4700亿人民币(670亿美元)!图片大家纷纷奇怪:怎么了,马斯克画的饼难道不香了?这边,外媒又甩出来一个惊天大瓜:发布会上的特斯拉机器人Optimus居然是人扮的!更准确的说——是有工作人员在不远处戴着VR设备,远程进行操控的。就像特斯拉曝光的训练场景一样,大家都躲在不远处的一个小屋里回应着参会者,堪称AI时代版的柜员机里有柜员...
51CTO技术栈
0回复
883浏览
Optimus
马斯克
人形机器人
开源大模型如何治理?斯坦福基础模型研究中心给您支招
原创
精华
人工智能领域正经历着范式转变,基础模型(如GPT4、LLAMA2)处于核心位置,驱动着技术创新和大量投资。这引发了对其监管的广泛需求。而在关于如何监管基础模型的讨论中,模型的发布过程至关重要。近日,由斯坦福大学基础模型研究中心主任PercyLiang领导的论文《ConsiderationsforGoverningOpenFoundationModels》发表在Science,对开源大模型治理与监管进行了深入探讨,今天我们就一起学习一下这篇重要论文吧!一、基础模型的发...
AIGC最前线
0回复
1245浏览
开源大模型
Top-k Accuracy:模型优化策略不一定徒劳无功
原创
构建模型通常是一个迭代过程,给定数据集:训练模型评估模型改进,直到满意为止你的改进策略不一定徒劳无功!如何评估模型是否进步了呢?通常会使用某些性能指标来评估改进策略的有效性。然而,在多分类问题中,当使用“Accuracy”指标评估改进策略有效性时,通常带有欺骗性。换句话,某些改进策略其实已经提升模型性能了,但通过“Accuracy”这个指标没有反映出来。“Accuracy”陷阱这里的“Accuracy”其实应该是“Top1Accurac...
鱼虫子
0回复
878浏览
模型
构建模型
评估模型
Entropix,终于找到了真正解决幻觉的方法了
最近,神秘大佬开源一个框架entropix,2周不到收获2.4kstar。Entropix的核心思想是通过量化模型的不确定性,来做出更多的“思考”,从而获得更好的效果。当大模型在预测下一个词时,模型会为每个词分配一个可能的概率。如果模型特别笃定的那个token的概率都很低,也就是不确定性很高的时候,熵越高。很多时候,想减少模型的幻觉时,可能会将模型的采样超参数如temperature设为0。但是这样做并不一定能提高模型不产生幻觉输出的概...
NLP前沿1
0回复
991浏览
entropix
模拟
幻觉
暂无内容
1
70
71
72
73
74
75
76
77
78
客服