51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
WOT技术大会
IT证书
公众号矩阵
移动端
短视频
免费课程
课程排行
直播课
软考学堂
全部课程
厂商认证
IT技术
25年5月软考
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
我的关注
全部帖子
默认
发布时间
热度
原创
精华
热门标签
AI
模型
智能体
KDD'24大厂推荐系统优化工作总结
社区头条
今天这篇文章给大家介绍几篇KDD2024中,大厂在推荐系统领域的优化工作,论文来自爱彼迎、腾讯、快手、美团等公司,设计多目标建模、多样性、搜索意图建模、rankingloss等问题。1.爱彼迎:多目标建模和模型蒸馏论文标题:MultiobjectiveLearningtoRankbyModelDistillation下载地址:https:arxiv.orgpdf2407.07181多目标建模转换成模型蒸馏问题。多目标的场景要求最小化一个目标的预测误差,同时其他目标的预估误差在一个约束内。...
海因斯DK
0回复
1050浏览
推荐
系统
优化
#AIGC创新先锋者征文大赛# 我与AIGC的缘分
原创
本文正在参与AI.x社区AIGC创新先锋者征文大赛https:www.51cto.comaigc2223.html作为一名刚刚踏入AIGC(人工智能生成内容)行业的小白,我的心中充满了对未知世界的好奇与期待。这个新兴的领域,对我而言,既是一个挑战,也是一个全新的起点。初识AIGC是再一次偶然的一个大厂华哥的行业会议上,看到了人工智能对于内容生成的文章的快捷性,当时还是停留在概念的理解方面,只是觉得能够自动化的生成文字、图像、音视频等...
万里悲秋长做客
0回复
714浏览
AIGC
征文
大奖
挑战赛
51CTO
Mistral AI 发布革命性边缘模型 Ministral 3B 和8B:性能与隐私双料俱佳
近日,MistralAI发布了两款新型边缘模型——Ministral3B和Ministral8B,引发了科技界的广泛关注。这两款模型不仅在性能上表现出色,更在隐私保护方面独具优势。图片性能卓越,隐私优先Ministral3B和8B专为设备端计算设计,能够处理长达128k的文本信息。特别是Ministral8B,采用了创新的滑动窗口注意力机制,显著提升了运算速度和内存效率。此外,这两款模型均以隐私保护为设计核心,确保数据在本地处理,降低数据泄露风险。多场...
Syrupup
0回复
772浏览
AI
Ministral
性能
不用羡慕Mac用户!ChatGPT Windows版本开放了!OpenAI能成为王牌级办公套件吗?
原创
OpenAI又又又搞了点花活!此前macOS系统才有的桌面应用,终于登陆Windows了!主打一个Alt+Space快捷拉取,更快人一步地向GPT提问。图片虽然,目前都是充值玩家(ChatGPTPlus、Enterprise、Team和Edu用户)才可以测试。但他们也承诺说,以后会开放给全部用户体验。图片想要一手体验的朋友,现在可以移步MicrosoftStore下载Windows应用程序。图片下载地址:https:www.microsoft.comstoreapps9NT1R1C2HH7J我们发现,ChatGPT桌面版...
51CTO技术栈
0回复
665浏览
Mac
ChatGPT
Windows
阿里商业级视频生成框架——轨迹控制版视频生成 Tora 重磅开源!
论文链接:https:arxiv.orgpdf2407.21705项目链接:https:alivideoai.github.iotoravideo代码链接:https:github.comalibabaTora阿里团队最近在GitHub上推出了其创新的文生视频生成工具——Tora,为学术界和开源社区提供了新的研究资源。Tora基于先进的DiT框架,专注于轨迹控制的视频生成。此次开源的版本包括了完整的推理代码和模型权重,旨在为研究人员和开发者提供高效的工具,促进技术交流与学习。从GitHub上的README文件来...
angel
0回复
774浏览
模型
框架
丰田、波士顿动力联手开发,实体大型行为模型机器人
社区头条
丰田在官网宣布与波士顿动力联合开发实体大型行为模型(LBM)机器人,以加速Atlas的通用能力和商业化场景。LBM的运行模式与ChatGPT等大模型类似,但LBM不能生成文本、图片等,而是帮助实体机器人能够通过观察人类行为来学习各种物理任务,例如,炒菜、做饭、照顾老人等。丰田希望将自己的LBM技术与波士顿动力的招牌机器人Atlas相结合,将很多不可能、电影中的场景实现。丰田自研的LBM技术通过分析大量的人类互动数据,使机器人...
Aceryt
0回复
559浏览
波士顿
机器人
刚刚,OpenAI开放ChatGPT Windows版本,可像Office那样使用了
精华
社区头条
今天凌晨OpenAI宣布向所有ChatGPTPlus、Enterprise、Team和Edu用户,提供Windows桌面应用早期版本。用户可在微软的应用商店中下载,安装完成后通过Alt+Space快捷键就能迅速启用,提供文件分析、搜索对话、文本生成等功能,使用体验相当丝滑和Office一样。目前,OpenAI已经开放了Mac、Windows两大操作系统的桌面版本,唯独没有对Linux做出明确的发布时间安排,所以,不少用户询问何时能开放该平台版本。OpenAI还没有给出详细的日...
Aceryt
0回复
1220浏览
OpenAI
ChatGPT
使用OpenAI和Kumologica对用户支持请求进行智能分类
原创
社区头条
本文将讨论如何使用Kumologica中AI代理和OpenAI平台,实现智能案例分类场景的设计。本文将演示如何使用Kumologica和OpenAI协助开发出AI代理API。此类API可以使用用户提交的信息,有效地对企业内生成的用户支持请求案例进行分类,而无需客户支持代理(即:Helpdesk之类的接单人员)的干预。从实用性角度考虑,这样的API管理方案可以自动对来自各种渠道的案例,进行分类和优先级的判定,识别出那些高优先级的案例...
51CTO内容精选
0回复
520浏览
OpenAI
Kumologica
AI代理
LightRAG开源了!轻巧、强大,GraphRAG的进化版
社区头条
Hi,这里是Aitrainee,欢迎阅读本期新文章。我们以前介绍了HybridRAG、GraphRAG这些,今天我们将介绍一个崭新的RAG项目:LightRAG。现有的RAG系统老是搞不清复杂关系,答案经常被切碎,缺乏上下文,难以真正理解问题。而LightRAG就是来解决这些问题的,它把图结构引入文本索引和检索,采用双层检索系统,从低到高全面覆盖信息。更酷的是,它还能快速更新数据,保持实时高效的响应,而且它已经开源了哦!并且你现在可以通过简单...
老蛀虫
0回复
1174浏览
LightRAG
开源
进化版
LangChain 与 LlamaIndex:构建 LLM 应用程序的利器,如何强强联手?
精华
近年来,大型语言模型(LLM)的快速发展彻底改变了人工智能领域,为开发者构建功能强大的语言驱动应用程序打开了大门。然而,将LLM集成到实际应用程序中并非易事,需要克服数据索引、检索和高效查询等挑战。LangChain和LlamaIndex作为两个新兴的开源框架,为开发者提供了构建LLM应用程序的强大工具。LangChain提供了高级API和现成的链,简化了与LLM提供商的连接和查询过程。LlamaIndex则专注于数据框架,通过向量存储索引和检索...
丢翅膀的鱼
0回复
1075浏览
LangChain
LLM
应用程序
Adaptive-RAG:性能提升50%以上的高效RAG策略
图片框架自适应RAG通过判断问题的复杂性来自动选择使用哪种RAG策略。作者将问题划分为三类(如上图的C部分):•开放领域问答:这类任务通常涉及两个模块:一个检索器和一个阅读器。随着具有千亿参数的超强推理能力的LLMs的出现,LLMs和检索器之间的协同作用已经取得了显著进展。然而,尽管在单跳检索增强LLMs方面取得了进展,但某些查询的复杂性需要更复杂的策略。•多跳问答:多跳问答(MultihopQA)是传统开放领域问答(Open...
大语言模型论文跟踪
0回复
747浏览
RAG
策略
QA
Packing Analysis:LLM 样本 Padding 与 Packing 的对比
一、背景我们之前已经分享过几篇关于SamplePacking相关的文章,也提到了其中的性能优化问题。最近今天又看到一篇新的论文,这里进行简单介绍。对应的论文为:[2410.08081]PackingAnalysis:PackingIsMoreAppropriateforLargeModelsorDatasetsinSupervisedFinetuning相关工作可以参考我们之前的文章:SamplePacking:长序列LLM训练的Attention问题及优化SamplePacking综述:LLM效果与效率的TradeoffBinaryBlockMasking:加快稀疏A...
amei2000go
0回复
1175浏览
LLM
样本
Packing
AI界的"小而美":Mistral AI的最新力作如何重新定义边缘计算 | 多智能体协作让大语言模型训练效率暴增
大模型领域的发展日新月异,每天都有许多有趣的论文值得深入品读。下面是本期觉得比较有意思的论文:1、AI界的"小而美":MistralAI的最新力作如何重新定义边缘计算2、多智能体协作让大语言模型训练效率暴增1、AI界的"小而美":MistralAI的最新力作如何重新定义边缘计算在人工智能飞速发展的今天,一个令人振奋的消息从MistralAI传来。就在Mistral7B模型发布一周年之际,这家创新公司再次为我们带来了惊喜:Ministral3B和Ministr...
sbf_2000
0回复
804浏览
AI界
边缘计算
语言模型
打破视觉-语言预训练的瓶颈:新算法解决噪声和标注问题
精华
引言:探索视觉语言对比预训练中的噪声和低质量标注问题在视觉语言对比预训练中,噪声和标注质量被认为是影响训练效果的重要因素。本文通过深入研究和分析训练过程中的两个主要问题——错误的负样本对分配和低质量及多样性不足的标注——揭示了通过解决这些问题来提高训练质量的潜力尚未被完全实现。首先,我们研究了影响对比学习的噪声问题,即在一个批次中可能会发现语义相似甚至相同的图像标注被错误地视为负样本对。其次,...
AI论文解读
0回复
1252浏览
语言
预训练
噪声
撤出OpenAI后,苹果继续泼冷水:大模型不会推理。科技界炸锅:大模型只会检索拼凑答案
原创
社区头条
编辑言征出品51CTO技术栈(微信号:blog51cto)前沿的AI独角兽公司们正在花费所有精力使LLM更擅长推理。然而苹果最近却给他们泼了盆冷水。近期,苹果公司的一个六人研究团队最近发表了一篇题为《了解大型语言模型中数学推理的局限性》的论文,论文中各种基准测试,十分详实。不过最后的结论基本上就是想证明:当前的LLM无法推理。图片“当前的LLM无法执行真正的逻辑推理;他们从训练数据中复制推理步骤,“该论文中写道,其中还...
51CTO技术栈
0回复
738浏览
OpenAI
大模型
AGI
英伟达出手即王炸!重磅开源Nemotron大模型:击败GPT-4o、仅次于o1!
原创
社区头条
编译伊风出品51CTO技术栈(微信号:blog51cto)英伟达闷声干大事!什么炒作也没有,直接开源媲美GPT4o、仅次于o1的模型!图片英伟达(Nvidia)在周二悄然发布了一款新型人工智能模型,性能超越了行业领导者OpenAI和Anthropic的产品,这标志着公司人工智能战略的重大转变,并可能重新塑造该领域的竞争格局。这款名为Llama3.1Nemotron70BInstruct的模型悄无声息地出现在热门的人工智能平台HuggingFace上,凭借其在多个基准测试中...
51CTO技术栈
0回复
525浏览
OpenAI
大模型
检索
对连续概率分布的一个常见误解
原创
考虑下面这个连续概率分布的概率密度函数,它表示的是从A点到B点可能花费的时间。这是一个连续随机变量t取值区间为[1,5]的均匀分布,其概率密度函数可以表示成下面形式。那么,问题来了!Q)他从A点到达B点花费3分钟的概率P(T3)是多少?哇哦!上述答案都是错的,正确答案是:0。有的人可能会立马抗议,并表示为什么在掷色子中每个点的概率就是16呢?因为掷色子实验结果是离散的,离散随机变量的概率分布称为概率质量函数(PMF)...
鱼虫子
0回复
551浏览
连续概率
机器学习
为什么你会觉得大模型很难学?甚至学了好久还不知道大模型到底是个什么玩意?
原创
社区头条
“先从简单的开始,而不是从复杂的开始;简单意味着成就感,复杂意味着挫败感”理论是来自于现实中的实践结果,理论来自于实践,验证于实践;单纯的理论是没有生存空间的。为什么你觉得大模型很难?甚至觉得学不会大模型?原因就在于你太沉迷于理论,而忽略了实践的意义。大模型不是一个纯理论的科学大模型技术并不是一个纯粹的理论科学,而是一个具有较强实践性的实践科学。我们有很多人在学习大模型技术的过程中,觉得大模型...
AI探索时代
0回复
596浏览
大模型
大模型面经——MoE混合专家模型总结
原创
本篇将介绍MoE(MixtureofExperts,混合专家模型)相关面试题。以下是一个快捷目录:一、MoE介绍二、MoE出现的背景三、有哪些MoE模型四、介绍稀疏MoE层五、介绍门控网络或路由六、为什么门控网络要引入噪声呢七、如何均衡专家间的负载八、“专家”指什么九、专家的数量对预训练有何影响?十、什么是topK门控十一、MoE模型的主要特点十二、MoE和稠密模型的对比十三、MoE的优势十四、MoE的挑战十五、微调MoE的方法十六、MoE的并...
shizhi02
0回复
670浏览
大模型
MoE
多模态大模型中,多模态融合后怎样知道最终结果受哪种模态影响更大?
原创
本篇介绍多模态大模型中如何基于最终结果分析各模态的影响。具身智能被众多大佬看好,通往AGI的路最终肯定需要多个模态的大模型互相融合。多个模态配合好也是有可能去构建一个模拟现实的世界模型的。最近一直在研究和尝试多模态大模型在一些VQA领域的前瞻研究和实际落地部署问题,遇到一个值得思考的问题:如果当预测结果出问题的时候,怎么去溯源是哪个模态的数据出的问题呢?这个方向感觉探索的足够深入是可以发论文的。由...
shizhi02
0回复
547浏览
多模态
多模态大模型
暂无内容
1
55
56
57
58
59
60
61
62
63
客服