51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
WOT技术大会
IT证书
公众号矩阵
移动端
短视频
免费课程
课程排行
直播课
软考学堂
全部课程
厂商认证
IT技术
25年5月软考
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
我的关注
全部帖子
默认
发布时间
热度
原创
精华
热门标签
DeepSeek
模型
AI
马斯克最新预言:AI毁灭世界的概率为20%!星舰全程复用后成本将砍99%!
原创
精华
整理伊风出品51CTO技术栈(微信号:blog51cto)3月1日,马斯克再次做客《TheJoeRoganExperience》播客节目,语出惊人!“还有一个更高级的阶段——当AI比所有人类加在一起还要聪明。坦白说,我觉得这个节点可能会出现在2029或2030年,基本上刚好赶上《终结者》的时间线。”而到那时候,我们有80%的概率会获得好的结局。而20%的概率,AI会像《终结者》中的“天网”终结人类文明。上图:马斯克说AI将“走向极端”,它要么会超级好...
51CTO技术栈
0回复
111浏览
马斯克
AI
火星殖民
大模型是一场新的搜索战争,OpenAI不会赢家通吃,一家最好被收购!
原创
社区头条
编辑言征出品51CTO技术栈(微信号:blog51cto)最近DeepSeek开源周带来了很多惊喜与热议。但小编发现大家对于马斯克的Grok3的讨论却远远不够充分。作为“大模型球赛”的最不可捉摸的强大力量,马斯克的xAI最新模型已经上线,便迅速登顶了iPhone的下载排行榜,引起的轰动同样不可小觑。此外,进入2025之后,大模型的五六个主流玩家都怎么样了?要想突破OpenAI的绝对领先的日活数据,都有哪些突破口?3月2日,硅谷知名投资人BillG...
51CTO技术栈
0回复
129浏览
大模型
OpenAI
马斯克
一键开启大模型评估:LangChain下场给出最佳实践
🚀评估体系为何重要?在构建基于LLM的生产级应用时,系统化评估(evals)是确保可靠性的关键。LangChain全新推出的OpenEvals与AgentEvals工具包,为开发者提供标准化评估框架与预置评估器,让复杂评估变得简单易行。真实痛点警示:某金融企业因未做轨迹评估,导致智能体误调敏感API造成百万损失一、评估体系双核引擎:数据×指标的化学反应1.📖数据质量决定评估效度需构建场景化测试数据集(推荐510个高质量样本)数据应反映真...
ermulong
0回复
105浏览
大模型
评估
LangChain
专门针对时间序列分类任务的时序大模型
今天给大家介绍一篇华为最近发表的时间序列分类大模型工作,填补了专门用于时间序列分类的大模型工作空白,借鉴了VisionTransformer的训练方式和模型结构,迁移到时间序列分类任务中,在多种类型的数据集上取得了不错的效果。推荐阅读:2024时序预测都有哪些经典工作——汇总篇,2024时间序列预测相关最新SOTA工作汇总,涉及模型结构、表示学习、频域信息、扩散模型10余个专题。论文标题:Mantis:LightweightCalibrat...
海因斯DK
0回复
115浏览
时间序列
时序
大模型
OpenAI 发布GPT-4.5:更大规模、更知识渊博的模型,预训练的巅峰之作,COT升级为COD
OpenAI昨晚宣布推出其最新的预训练模型GPT4.5,这是一款在规模和知识水平上均达到新高度的产品,被OpenAI誉为其“迄今为止最大、知识最渊博的模型”,标志着无监督学习的又一次重大飞跃。GPT4.5目前作为研究预览版,向ChatGPTPro用户和开发者开放,预计下周将向Plus用户和其他用户开放。核心更新与特点预训练规模显著提升:GPT4.5的预训练计算规模大约是GPT4的10倍,带来性能的全面提升。在性能甚至超过了一些推理模型,如gemin...
Syrupup
0回复
99浏览
OpenAI
GPT-4.5
模型
Agent只是手段,工作流才是内容!
原创
精华
社区头条
编辑|言征出品51CTO技术栈(微信号:blog51cto)现代企业中有一个无名英雄:工作流程。它有时被称为规则引擎、流程流、单状态机或软件定义的工作流程。在用户界面(UI)中,它是一个“向导”。开发者通常(有些轻蔑地)称它为“业务逻辑”。各位这里不妨花点时间来欣赏这个无名英雄的独特威严,因为我们即将把硅谷炙手可热的关注之光投向它的门槛:AI代理。关于AI、大型语言模型(LLMs)和代理应用程序已经有很多的讨论,很难...
51CTO技术栈
0回复
125浏览
Agent
代理
应用程序
CVPR 2025 | 扩散模型炼出新绝技!注意力蒸馏技术:图像生成效果全面碾压传统方法
论文链接:https:arxiv.orgpdf2502.20235项目链接:https:xugao97.github.ioAttentionDistillation亮点直击分析了之前即插即用注意力特征方法的局限性,并提出了一种新颖的注意力蒸馏损失,用于重现参考图像的视觉特征,取得了显著优越的结果。开发了attentiondistillation引导采样,这是一种改进的分类器引导方法,将注意力蒸馏损失整合到去噪过程中,大大加快了合成速度,并支持广泛的视觉特征转移和合成应用。生成效果一览给...
angel
0回复
162浏览
模型
视觉
生成
什么是检索增强生成 (RAG)?
原创
01、概述在人工智能的飞速发展中,大型语言模型(LLMs)凭借卓越的文本生成能力,成为自然语言处理领域的明星。然而,这些模型仍然面临一些关键问题,比如如何理解用户意图、提供精准且上下文相关的回答。为解决这些痛点,一个全新的技术框架——检索增强生成(RetrievalAugmentedGeneration,RAG)横空出世,它通过结合检索与生成两种能力,为AI的未来打开了更大的可能性。02、什么是RAG?RAG是一种革命性的AI框架,它将检索式...
Halo咯咯
0回复
92浏览
检索增强生成
RAG
GPT‑4.5发布:一款迄今为止最大、最贵的模型
原创
01、概述随着技术的不断进步,我们迎来了GPT4.5的研究预览版。这是OpenAI推出的最强大的聊天模型之一,相比于之前的版本,GPT4.5在多个方面都有显著的提升。它不仅在预训练和后训练上进行了更深的扩展,而且在“情商”方面的表现也大幅度提高。今天,让我们一起探讨GPT4.5的创新亮点,以及它如何改变我们与AI互动的方式。02、什么是GPT4.5?GPT4.5代表了自然语言处理技术的又一次飞跃,它的能力主要体现在两个方面:无监督学习...
Halo咯咯
0回复
101浏览
GPT‑4.5
无监督学习
模型训练
大模型
【AI洞察】Kimi 1.5技术报告全解析:长链推理、短链优化与多模态融合的创新实践
原创
01、概述在科技飞速发展的今天,人工智能领域的每一次突破都牵动着无数人的心。Kimi1.5的出现,无疑在AI界投下了一枚重磅炸弹,其技术报告更是蕴含着巨大的信息量,让我们得以窥探这一先进模型的奥秘。本文将对Kimi1.5技术报告进行全方位、深层次的解读,带您领略其独特的魅力与强大的实力。02、Kimi1.5的诞生背景随着人工智能技术的不断发展,人们对AI模型的性能要求也越来越高。从最初的简单文本生成到如今的复杂推理、多模态...
Halo咯咯
0回复
148浏览
Kimi 1.5
AI 模型
大语言模型
颠覆认知!多模态模型思维链评估白皮书:反思机制成胜负手,感知任务竟被CoT拖后腿
论文:https:arxiv.orgpdf2502.09621主页:https:mmecot.github.io代码:https:github.comCaraJ7MMECoT数据集:https:huggingface.codatasetsCaraJMMECoT亮点直击精心策划了MMECoT基准,涵盖了六种多模态推理场景的综合范围。数据收集和标注过程经过严格的人为验证,旨在为社区提供高质量的多模态推理评估数据集。识别了现有基准中的关键问题,并引入了专门针对多模态CoT推理的全面评估套件,该套件仔细检查了推理的质量、鲁棒...
angel
0回复
210浏览
模型
AI
训练
企业部署DeepSeek的AI基础设施方案建议
原创
要成功实现DeepSeek大模型的私有化部署,绝非易事,从模型选型到基础设施搭建,再到推理部署工程优化,每一个环节都需要精心规划与考量。接下来,让我们深入探讨企业私有化部署DeepSeek的关键要点与策略。1DeepSeek模型选型在企业进行deepseek大模型私有化部署时,模型选型是至关重要的第一步,它直接关系到后续的应用效果与成本投入。通过业务场景适配性分析确定合适的模型,能让企业充分发挥大模型的价值。DeepSeek提供了多种...
夜行神鱼
0回复
162浏览
DeepSeek
大模型
人工智能
微软提出AutoGen Studio,用低代码方式开发智能体
精华
AIAgent的高效、能力强、自动化等技术特点在零售、金融、教育、新闻等业务中得到广泛应用。但是,没有专业编程能力的业务人员想构建复杂的智能体并不容易。例如,需要考虑使用哪一种大模型,智能体可用的工具,智能体可执行的行动步骤数以及任务终止条件判断等。所以,为了简化智能体构建流程,微软的研究人员在其开源的超过30000颗星AutoGen智能体之上,与低代码技术相结合构建了AutoGenStudio,通过可视化拖拽低代码的方式就...
Aceryt
0回复
152浏览
微软
智能体
开发
OpenAI GPT-4.5 系统卡片
原创
1.引言我们正在发布OpenAIGPT4.5的研究预览版,这是我们迄今为止最大且知识最丰富的模型。GPT4.5基于GPT4o构建,进一步扩展了预训练规模,并被设计为比我们强大的STEM领域推理模型更具通用性。我们使用新的监督技术结合传统方法(如监督微调[SFT]和基于人类反馈的强化学习[RLHF])对其进行训练,这些方法与GPT4o的训练方法类似。在部署前,我们进行了广泛的安评评估,未发现与现有模型相比存在显著的安全风险增加。早期测试表明...
AIRoobt
0回复
182浏览
GPT-4.5
OpenAI
无监督学习
链式推理
探索基于大型语言模型的智能体:定义、方法与前景
原创
精华
智能体被认为是从人工智能通向通用人工智能(AGI)的潜在路径。因此,研究人员为实现智能体投入了大量努力,探索了多种实现方式。得益于近期大型语言模型(LLMs)的进展,以通用自然语言作为接口的基于LLM的智能体在多种应用中展现出强大的泛化能力——从作为自主的通用任务助手,到在编码、社会和经济等领域中的应用,基于LLM的智能体为广泛的探索提供了可能性。本文调研了当前研究现状,深入概述了基于LLM的智能体,包括单智...
AIRoobt
0回复
205浏览
大型语言模型
智能体
多智能体系统
FlexTok-一种图像编码新方式
原创
本文介绍一种图像编码的方法。图像标记化推动了自回归图像生成发展,但传统2D网格标记和现有1D标记方法存在不足,如无法适应图像内在复杂性。FlexTok创新之处在于可将2D图像投影为可变长度、有序的1D标记序列,图像标记化通过提供一种比原始像素更高效、更易处理的压缩离散表示,极大地推动了自回归图像生成的发展。传统方法多采用二维网格标记化,但像TiTok这样的最新研究表明,一维标记化能够通过消除网格冗余来实现高质量的...
shizhi02
0回复
88浏览
FlexTok
图像编码
计算机视觉
详解AI代理的内部工作机理
原创
社区头条
我在过去设计对话式系统时亲眼目睹了传统AI的局限性。我设计的系统可以可靠地检测实体,但其僵硬的逻辑使得这种解决方案不能扩展。对话遵循预先编程的路径:如果用户说X,就回应Y。任何偏差都会破坏整个流程,凸显出这类系统有多死板多僵硬。基于基础模型的代理改变了这一切。它们是自主系统,能够处理不可预测的场景并无缝协作。代理可以规划行程、收集实时数据或管理客户账户,随时适应变化。代理不仅仅是工具的使用者,它们...
51CTO内容精选
0回复
179浏览
AI代理
人工智能
基础模型
炸裂更新!全球首个混合推理模型Claude 3.7 Sonnet发布,编码能力直接起飞!
原创
在人工智能领域,每一次重大突破都能引发全球科技爱好者的热烈讨论。Anthropic公司发布的全新模型——Claude3.7Sonnet,无疑再次点燃了AI社区的热情。作为全球首个混合推理模型,Claude3.7Sonnet不仅在编码能力上实现了质的飞跃,还通过其独特的“标准和扩展思考模式”重新定义了AI的推理方式。一个模型,两种思考方式Claude3.7Sonnet的最大亮点在于其“一个模型,两种思考方式”的设计理念。用户可以根据需求选择“标准模式”...
水晶花雨_32
0回复
196浏览
大模型
混合推理模型
Claude 3.7 Sonne
如何安全地使用第三方应用程序访问DeepSeek
社区头条
译者张哲刚审校重楼AI编码助手改变了开发人员编写软件的方式。它们可以自动执行重复性的任务,及早发现错误,进而加快开发进度。但是,并不是所有的AI编码工具在构建时都考虑到了安全性这个重要的问题。DeepSeek是最优秀最有前途的免费AI编码助手之一。它被誉为游戏规则改变者,其推理模型堪比OpenAIo1,甚至更好。它能够提供高级代码建议,并且支持多种编程语言。但有一个问题是——当你输入代码后,你知道都发生了些什么吗...
51CTO内容精选
0回复
304浏览
DeepSeek
安全
QodoGen
Perplexity AI
大型语言模型(LLMs)如何能够从长达数十年的符号 AI 项目中受益
将大型语言模型(LLMs)应用于实际应用的主要障碍之一是它们的不可预测性、缺乏推理能力和难以解释性。如果无法解决这些挑战,LLMs将无法成为在关键环境中可信赖的工具。在最近的一篇论文中,认知科学家GaryMarcus和人工智能先驱DouglasLenat深入探讨了这些挑战,他们将这些挑战归纳为了确保通用人工智能的16个愿望清单。TechTalks的创始人BenDickson将其整理发表了一篇名为"HowLLMscouldbenefitfromadecades’longsymbolicAIpr...
lintoms
0回复
196浏览
大型语言
模型
LLMs
暂无内容
1
2
3
4
5
6
7
8
9
10
客服