51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
WOT技术大会
IT证书
公众号矩阵
移动端
短视频
免费课程
课程排行
直播课
软考学堂
全部课程
厂商认证
IT技术
25年5月软考
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
我的关注
全部帖子
默认
发布时间
热度
原创
精华
热门标签
DeepSeek
AI
大模型
基于LLM的多Agent框架在金融市场数据的应用
架构图片上图展示了本文的整体架构:结合了传统的统计技术和大型语言模型驱动的多智能体系统。首先利用从简单的规则、无监督学习和深度学习技术等现有手段,对金融表格数据中的异常进行识别。异常识别后,将数据传到LLM多智能体系统中。整个系统包括:数据转换Agent、数据专家Agent、报告整合Agent、管理层讨论。其中数据专家Agent包括三个专家:•网络调研专家:这位专家通过网络资源的深入挖掘,如数据发布方的公告、头条新闻...
大语言模型论文跟踪
0回复
1033浏览
LLM
Agent
框架
Intel Smooth-SwiGLU:FP8 LLM 训练,34% 加速
一、背景本文中我们继续介绍一个Intel最新的关于FP8训练相关的工作,其在一定程度上分析并解决了FP8训练中的不收敛问题,进一步推进了FP8训练落地(尤其是在H100H800GPU上)的可行性。对应的论文:[2409.12517]ScalingFP8trainingtotrilliontokenLLMs[1]二、摘要本文中,作者首次在2TToken的数据集上使用FP8精度训练了LLM,比以前的限制增加了20倍。通过这些扩展训练实验,作者发现了FP8训练中的关键不确定性,这些不确定性在早...
amei2000go
0回复
920浏览
LLM
浮点数
Google
LLM的"数数"能力有多弱?一个意想不到的"罪魁祸首"| 专家模型的潜在隐患:用户提示被窃取的背后
大模型领域的发展日新月异,每天都有许多有趣的论文值得深入品读。下面是本期觉得比较有意思的论文:1、LLM的"数数"能力有多弱?一个意想不到的"罪魁祸首"2、专家模型的潜在隐患:用户提示被窃取的背后1、LLM的"数数"能力有多弱?一个意想不到的"罪魁祸首"你相信大型语言模型(LLM)连简单的"数数"都可能做不好吗?近期一篇震惊学术界的论文揭示了这个令人惊讶的事实:即便是号称"无所不能"的AI模型,在面对基础计数任务时也可...
sbf_2000
0回复
617浏览
LLM
模型
AI
多智能体新进展 | 斯坦福大学提出新模型'Hypothetical Minds',让AI更懂人类思维
精华
本文提出了一种名为“HypotheticalMinds”的模型,该模型结合了大语言模型和多智能体强化学习,通过在自然语言处理的框架下生成、评估和细化关于其他智能体策略的假设,来提高智能体在多智能体环境中的表现。该模型在多种竞争性、合作性和混合动机的多智能体环境中均显示出优越的性能,特别是在处理隐藏信息和策略推理方面。HypotheticalMinds模型简介1.模型架构与组件HypotheticalMinds模型是一个基于大型语言模型(LLM)的自...
AI论文解读
0回复
1497浏览
多智能
模型
AI
Microsoft | 利用LLM本身训练SoTA embedding模型
大家好,我是HxShine今天分享一篇Microsoft公司的一篇文章,Title:ImprovingTextEmbeddingswithLargeLanguageModels:使用大型语言模型改善文本嵌入。这篇文章探索了直接利用LLM来做embedding模型,其只需要利用合成数据和少于1000次的训练步骤就能获得高质量文本表征。该方法分为两步:1)利用LLM生成文本embedding任务合成数据集:利用专有的大型语言模型(LLM)生成近100种语言的数十万个文本嵌入任务的多样化合成数据。2)...
arnoldzhw
0回复
851浏览
LLM
SoTA
模型
使用Streamlit、LangChain和Bedrock构建一个交互式聊天机器人
原创
本文将帮助你使用低代码前端、用于会话管理的LangChain以及用于生成响应的BedrockLLM来创建聊天机器人。在不断发展的AI领域,聊天机器人已成为一种不可或缺的工具,用于增强用户参与度和简化信息传递。本文将逐步介绍构建交互式聊天机器人的具体过程,使用Streamlit作为前端、使用LangChain用于协调交互,以及使用基于AmazonBedrock的AnthropicClaude模型作为大语言模型(LLM)后端。我们将深入研究前端和后端的代码片段,并解...
51CTO内容精选
0回复
2040浏览
大语言模型
交互式聊天机器人
LLM后端
故障诊断论文实验怎么设计?对比、消融、泛化实验保姆级教程
前言本文基于凯斯西储大学(CWRU)轴承数据和东南大学轴承数据,进行快速傅里叶变换(FFT)和变分模态分解VMD的数据预处理,最后通过Python实现基于2DSWinTransformer+1DCNNSENet并行的特征融合模型对故障数据的分类。1模型泛化实验西储大学数据集1.1设置参数,训练模型1.2模型评估准确率、精确率、召回率、F1Score故障十分类混淆矩阵:其他可视化图:(1)分类标签可视化(2)原始数据tSNE特征可视化(3)模型训练后的tSNE特...
Tang_Lan
0回复
1097浏览
消融
泛化
预处理
OpenAI开发者日:o1两分钟捏应用,控制无人机翻跟头!奥特曼现场连线,模型能力还在迅猛提升
原创
昨日,OpenAI的开发者日活动如期而至!OpenAI这次的开发者日主打一个世界巡演,这次的伦敦场过后,11.21日在新加坡还有一场收官活动。这次,事务繁忙的奥特曼没有亲临现场,采用了视频通话的形式和观众见面。而抗起大旗的是,OpenAI开发者体验主管RomainHuet。图片现场是这样的:一整个人从众。屋顶钢架和砖砌的墙壁别有风格。图片我们还可以沉浸式参会,看看这场开发者日的议程。可以看到主会场的四个演讲分别是,《可靠应用程...
51CTO技术栈
0回复
695浏览
OpenAI
开发者
GPT3.5
ChatGPT搜索杀疯了,商业模式很简单:无广告!奥特曼谈AI搜索:并非挑战谷歌,搜索引擎这个概念很无聊!
原创
编辑言征太霸道了!OpenAI这次真的要谷歌摁倒地上摩擦了一觉醒来,奥特曼放出了一条诚意满满的道歉帖让让业内人都疯狂了起来。“这次真的很好!”图片“嘿,我真的很抱歉一直在炒作我们自己的产品,但你真的应该获得chatgptplus并安装chrome扩展程序进行搜索当我们发布一些不太好的东西时,我会很高兴地承认,但这次它真的很好。”一时间,用户蜂拥而至,谷歌也慌忙应战,也推出了自己的AI搜索功能:Google宣布可以在GoogleAISt...
51CTO技术栈
0回复
689浏览
ChatGPT
搜索
奥特曼
定制化视频生成新模范!零样本主体驱动,精确运动控制!复旦&阿里等发布DreamVideo-2
文章链接:https:arxiv.orgpdf2410.13830项目链接:https:dreamvideo2.github.io亮点直击DreamVideo2,首个无需微调,同时支持主体定制和运动控制的零样本视频定制框架,能够通过设计的参考注意力学习主体外观,并使用二值mask引导的运动模块实现运动轨迹控制。识别出DreamVideo2中运动控制占主导的问题,并通过使用混合mask增强参考注意力(即mask参考注意力)和设计重加权扩散损失来解决该问题,从而有效平衡了主体学习和运动...
angel
0回复
721浏览
视频生成
AI
无需昂贵标注!大幅提升SDXL和SD3-Medium效果!文生图偏好优化新宠来了
文章链接:https:arxiv.orgpdf2410.18013亮点直击合成标注偏好数据集(SynPic):从不同的T2I模型生成图像,并通过多个预训练的奖励模型对其进行标注,这些模型可以估计人类偏好。因此,数据收集过程中无需人工标注,使得数据收集成本更低且易于扩展。通过聚合多个奖励模型的评分,减轻了奖励过度优化的问题。与传统的成对比较不同,为每个提示生成的图像构建一个排名。虽然聚合多个人工标注者的偏好并构建排名是可行的,但这相...
angel
0回复
733浏览
模型
图像生成
突发!OpenAI正式发布ChatGPT网络搜索,彻底颠覆谷歌!
今天凌晨1点,OpenAI正式发布了ChatGPT网络搜索功能,能实时、快速获取附带相关网页来源链接的答案。用户通过自然语言就能获取各种网络信息,例如,帮我看看今天华尔街日报的头条新闻是什么;雅虎体育板块中的NBA热门新闻有哪些;CNBC的热门财经新闻报道了哪些内容,ChatGPT都能快速帮你找到这些并附带原始链接。同时ChatGPT搜索功能也会结合上下文提问,提供更有深度的搜索结果,例如,当你想找一家三星米其林餐厅时,还会告诉...
Aceryt
0回复
643浏览
ChatGPT
搜索
Llama 3.2 Vision & Molmo:多模态开源生态系统基础
原创
编者按:视觉功能的融入对模型能力和推理方式的影响如何?当我们需要一个既能看懂图像、又能生成文本的AI助手时,是否只能依赖于GPT4V这样的闭源解决方案?我们今天为大家分享的这篇文章,作者的核心观点是:多模态语言模型领域正处于快速发展阶段,Llama3.2Vision和Molmo等开源模型的出现为构建开放的多模态生态系统奠定了重要基础。本文分享了来自Meta的Llama3.2Vision和AI2的Molmo模型的主要技术架构及其特点,同时比较了它...
Baihai_IDP
0回复
1000浏览
Llama 3.2 Vision
AI
大模型
Zyphra发布Zamba2-7B:新一代高性能小型语言模型
原创
01引言在如今竞争激烈的人工智能(AI)领域,性能和效率始终是技术发展的焦点。10月15日,Zyphra公司推出了全新的Zamba27B小型语言模型(LLM),以其强大的计算能力和卓越的效率引起了广泛关注。Zamba27B在7B参数范围内突破了技术瓶颈,不仅在质量上超越了Mistral7B、Google的Gemma7B以及Meta的Llama38B,还具备更快的推理速度。Zyphra公司希望通过这种高效且紧凑的设计,真正实现先进AI的普及,使个人开发者、企业甚至硬件受限...
Halo咯咯
0回复
891浏览
大语言模型
超级新星降临:Arcee AI发布SuperNova-Medius,14亿参数的小模型,大作为!
原创
01引言在人工智能(AI)的世界里,大型语言模型已经成为解决复杂任务、提升决策过程的重要工具。但这些模型的扩展也带来了高计算成本、低可访问性和环境影响等挑战。ArceeAI直面这些挑战,推出了SuperNovaMedius——一款旨在保持大型模型高质量输出的同时,克服其局限性的小语言模型。02SuperNovaMediusSuperNovaMedius是一款14亿参数的小语言模型,它颠覆了传统AI模型中大小与性能的关系。它在保持相对较小的模型大小的同时,...
Halo咯咯
0回复
983浏览
大语言模型
数据分析自动化:LIDA智能可视化的魔法!
原创
01概述在这个数据驱动的时代,我们每天都在产生和处理海量的数据。如何从这些数据中提取有价值的信息,并以一种直观、易于理解的方式呈现,成为了一个重要的课题。今天,给大家介绍一个强大的工具——LanguageIntegratedDataAnalysis(LIDA),它能够自动化地创建可视化图表,让数据洞察变得触手可及。02LIDA的核心特性语法无关的可视化无论你是Python、R还是C++的开发者,LIDA都能帮助你产出视觉输出,而无需锁定在特定的编程...
Halo咯咯
0回复
654浏览
框架
人工智能
AI+大模型在金融行业的应用场景
原创
AI技术之于现有金融行业的赋能是多领域、多环节的。从现有行业形态看,AI可赋能的金融领域包括营销(如精准营销、交叉销售)、资管、风控(如反洗钱)等,面对客户可包含金融消费者、金融机构和金融监管机构,改善金融市场信息对称性并提升交易的效率和安全性。从潜在赋能的细分环节看,包含智能核身、智能催收、智能客服等在内的应用持续推出且逐步成熟,而智能投研、智能投顾、智能营销等高市场价值的环节仍然存在较大提升空间。...
数字化助推器
0回复
1780浏览
AI
大模型
大模型应用创业的草台班子——从管理的角度来看待创业
原创
“整个世界都是一个草台班子,但区别在于有的草台班子会越来越好,有的草台班子会越来越差”在很多人看来,创业应该是一件很严肃的事情,需要人力,技术,资源,资本等等各种乱七八糟的东西;但事实上创业没有想的那么复杂,而且远比你想象中的要简单的多。世界上很多伟大的公司都起源于一个地下车库或者一个破破烂烂的小房间,在国内创业者如果没有自己的办公室和员工可能会被嘲笑,但在硅谷可能路边角落里的两个人,吃着廉...
AI探索时代
0回复
581浏览
大模型产品
创业
放弃折腾,AutoRAG一键锁定最佳RAG技术栈!
AutoRAG:RAGAutoML工具可自动为你的数据找到最佳RAGPipeline。市面上有许多RAGPipeline和模块,但不知道哪种Pipeline最适合“你自己的数据”和“你自己的用例”。制作和评估所有RAG模块非常耗时且难以完成。AutoRAG支持一种简单的方法来评估许多RAG模块组合。可以使用自己的评估数据自动评估各种RAG模块,并找到最适合自己用例的RAGPipeline。AutoRAG支持的RAG技术栈支持16种解析模块、10种切块模块解析模块:PDFMiner,PDFPlu...
PaperAgent
0回复
1052浏览
AutoRAG
RAG
技术栈
智能体协作进化论,从心智理论到逆向注意力
让智能体在不断变化的环境中动态适应、并有效合作是一个巨大的挑战,特别是当智能体需要与陌生的智能体互动时,传统训练方法往往表现不佳。这种情况下,引入逆向注意力智能体(InverseAttentionAgents)成为了一种创新且有效的解决方案。逆向注意力智能体的核心在于借鉴“心智理论”(TheoryofMind,ToM),通过注意力机制来推断其他智能体的目标和行为,并据此调整自己的行动。这种方法不仅能够提升智能体在合作任务中的表现,...
xuxiangda
0回复
817浏览
智能体
进化论
心智
暂无内容
1
61
62
63
64
65
66
67
68
69
客服