51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
WOT技术大会
IT证书
公众号矩阵
移动端
短视频
免费课程
课程排行
直播课
软考学堂
全部课程
厂商认证
IT技术
25年5月软考
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
我的关注
全部帖子
默认
发布时间
热度
原创
精华
热门标签
Deepseek
AI
模型
DeepSeek火遍中国汽车圈!吉利、东风最激进,李斌何小鹏打气,上汽官宣打造全球首个DS实装量产汽车品牌!
原创
社区头条
出品51CTO技术栈(微信号:blog51cto)继各大腾讯、阿里等各大AIInfra厂商火速接入DeepSeek后,这款“国民AI”的热度已经席卷到了汽车圈。图片首先是吉利,主打的是语音主动交互场景。2月6日,吉利汽车宣布其自研的星睿大模型与DeepSeekR1深度融合,具体来讲就是利用DeepSeekR1模型对星睿车控FunctionCall大模型、汽车主动交互端侧大模型等进行蒸馏训练。吉利汽车介绍,融合后的AI系统不仅能精准理解用户的模糊意图,准确调用约...
51CTO技术栈
0回复
321浏览
DeepSeek
吉利
模型
奥特曼最新AGI断言:人工智能的成本每 12 个月下降约 10 倍,但推动AI能力边界的成本不会变便宜
原创
社区头条
出品51CTO技术栈(微信号:blog51cto)本周巴黎人工智能行动峰会之前,许多科技界知名人士都提前亮出了他们对人工智能未来的愿景。OpenAI首席执行官SamAltman也不例外,今天更新了个人博客,提出了一些新概念或者新提法:比如“计算预算”(computebudget),再比如“2035年,任何人都应该能够调动与2025年所有人的智能总和”。“技术进步的历史影响表明,我们关心的大多数指标(健康结果、经济繁荣等)在平均水平和长期来看都...
51CTO技术栈
0回复
154浏览
AGI
人工智能
AI
一个强大的集成学习算法:梯度提升树!
社区头条
一、算法介绍梯度提升树(GradientBoostingTrees,GBT)是一种强大的集成学习方法,它通过迭代地添加弱预测模型来构建一个强预测模型。在每一轮迭代中,新的模型会试图纠正前序模型产生的错误。GBT可以用于回归和分类问题,并且在许多实际应用中表现优异。二、算法原理三、案例分析为了展示梯度提升树的实际应用,我们将使用提供的数据集来预测机器是否会发生故障。首先加载数据,并进行必要的预处理。3.1数据预处理与模型建立im...
宝宝数模AI
0回复
313浏览
学习算法
梯度
提升树
【PaperDaily】谷歌推出AlphaGeometry2,超过金牌选手,称霸IMO
1.GoldmedalistPerformanceinSolvingOlympiadGeometrywithAlphaGeometry2我们推出了AlphaGeometry2,这是对Trinh等人在2024年提出的AlphaGeometry的重大改进版本,如今它在解决奥林匹克几何问题方面的能力已经超过了普通金牌得主。为了实现这一突破,我们首先对原有的AlphaGeometry语言进行了扩展,使其能够处理涉及物体运动的更难题型,以及包含角度、比例和距离的线性方程的问题。这些改进以及其他新增内容,显著提高了AlphaG...
AIPaperDaily
0回复
230浏览
谷歌
LLMs
R 语言
10分钟让WPS接入DeepSeek,实现AI赋能
社区头条
热门内容榜
• 最近上榜
在办公场景中,WPS作为一款强大的办公软件,不仅提供了丰富的文档编辑功能,还支持宏(Macro)来实现自动化处理。随着人工智能技术的发展,将大模型(如ChatGPT、DeepSeek、文心一言等)集成到WPS中,可以大幅提升文档编辑、内容创作、数据分析的效率。本文介绍如何通过WPSJS宏调用DeepSeek大模型,实现自动化文本扩写功能。1.随便打开一个word文档,点击工具栏“工具”2.点击“开发工具”3.点击“查看代码”4.在打开的WPS宏编...
AI取经路
0回复
1497浏览
WPS
DeepSeek
AI
AI.com域名改跳 DeepSeek,蹭热度
网传假消息:现在ai.com跳转到Deepseek,而不是ChatGPT了。该域名自ChatGPT推出后一开始先被OpenAI买下跳转到ChatGPT,后被xAI买下跳转到xAI,然后又被OpenAI买下跳转到ChatGPT。现在被Deepseek买下跳转到Deepseek了。实际上:OpenAI、xAI、Deepseek压根没人承认购买过这域名.天天改跳转地址左右横跳,搁这儿钓凯子域名ai.com的注册信息AI.com:频繁跳转的幕后逻辑最初,坊间传言OpenAI斥巨资收购AI.com以导流至ChatGPT.com,然而...
云原生AI百宝箱
0回复
260浏览
DeepSeek
AI
趋势
各AI大厂官方指令库大公开!照着抄秒变AI大神!
社区头条
你以为写AI提示词需要代码思维?要学"结构化""语义压缩"?——错!官方早就把"标准答案"喂到你嘴边了!操千曲而后晓声,观千剑而后识器这些覆盖300+场景的官方模板库,就是你的AI速成秘籍!虽然官方示例各有偏向,但是它们绝大多数都是通用的,你可以拿其他家的示例直接在DeepSeek中测试运行!👇手把手教学现在开始,文末附链接🔗👇🌟Google:职场人效率核武器[职场神器合集]•周报生成器:自动整理工作进展+数据可视化•PPT大...
草台AI
0回复
351浏览
AI
Google
数据可视化
图文详解:带你读懂 DeepSeek-R1 的核心原理
原创
精华
社区头条
热门内容榜
• 最近上榜
编者按:DeepSeekR1到底有什么特别之处?它为什么能在推理任务上取得如此出色的表现?这背后的训练方法又蕴含着怎样的创新?当我们需要模型处理数学题、编程任务,或是进行逻辑分析时,高质量的推理能力显得尤为重要。然而,传统的训练方法往往需要耗费大量人力物力,这对许多研究团队和企业来说都是不小的负担。今天这篇深度解析DeepSeekR1训练方法的文章,将展示一个令人耳目一新的解决方案:如何通过创新的强化学习方法,在...
Baihai_IDP
0回复
1612浏览
LLM
AI
推理模型
ReFT:通过强化微调增强LLMs
原创
01、概述近年来,随着大规模语言模型(LLMs)的迅猛发展,如何让这些模型更高效地适应特定任务和领域成为了人工智能领域的热点话题。在这场竞赛中,强化微调(ReinforcedFineTuning,ReFT)脱颖而出,为语言模型的优化提供了一种创新性的解决方案。无论是OpenAI还是字节跳动,均采用了不同的路径对这一技术进行了深入探索,展示了ReFT在提升推理能力、优化性能上的巨大潜力。今天,我们将带你全面了解ReFT技术的背景、核心机制...
Halo咯咯
0回复
498浏览
LLMs
大语言模型
强化微调
ReFT
Google AI发布Gemini 2.0 Flash Thinking 模型
原创
01、概述随着人工智能技术的飞速发展,我们见证了它在诸多领域的卓越表现。然而,即使是当下最先进的AI系统,在某些核心挑战上仍显不足,尤其是涉及多模态推理与规划能力的任务。当任务需要抽象推理、科学理解或精确的数学计算时,这些缺陷就愈发明显。与此同时,AI在实际应用中的扩展也带来了更多复杂需求,例如分析包含数百万字节的长文档。如何突破这些限制,决定了AI能否在教育、科研和产业等领域释放更大的潜力。在这一背...
Halo咯咯
0回复
487浏览
大模型
Gemini 2.0
Google AI
如何高效转换PDF为Markdown:构建优质Graph RAG的第一步
原创
01、概述在信息驱动的时代,基于图的RAG(GraphRAG)正迅速成为一种强大的工具,超越了传统依赖向量存储的RAG应用。它不仅提供语义相似性检索,更具备强大的推理能力。例如,向量存储能轻松回答“XYZ公司去年的CFO是谁?”这种基于显式信息的问题,但对于“XYZ公司哪两位董事毕业于同一所学校?”这样需要隐式推理的问题,图RAG更胜一筹。但问题在于,如何构建图数据库以支持这种高级检索?更进一步,如何从复杂的年报中提取信...
Halo咯咯
0回复
227浏览
RAG
Graph RAG
PDF
Markdown
“几十块”从零复现deepseek-R1–zero“顿悟时刻”不可能实验验证
原创
最近各种营销号鼓吹基于qwen的模型几十块钱复现deepseekR1zero,坑坏了算法工程师,笔者实验验证下这个夸张说法,因为实验仅仅是快速的实现,无过多的优化,下面实验数据仅供参考,欢迎指正。实验过程DeepSeekR1Zero过程DeepSeekR1Zero是一个纯RL(无SFT)来探索模型推理能力的过程(基于GRPO的RL优化过程)。RewardModel是基于规则的奖励过程(RuleBaseRM),R1Zero阶段只关注数学、程序类推理问题,都是能简单通过规则判别答...
毛毛雨_11
0回复
346浏览
LLM
大模型
RAG范式演进及Agentic-RAG总结综述
原创
RAG的核心思想是通过实时数据检索弥补这一缺陷——在生成答案前,系统先从外部数据源(如数据库、API或互联网)动态检索相关上下文,再结合LLM的知识生成更精准、实时的响应。但它们通常在处理动态、多步推理任务、适应性和复杂工作流的协调方面仍然存在不足。rag三大组件检索器(Retriever):从外部数据源(如向量数据库、知识图谱或网页)中搜索与查询相关的信息。相关技术:如BM25关键词匹配、密集向量搜索等。增强器(Augm...
毛毛雨_11
0回复
727浏览
RAG
DeepSeek多模态大模型Janus、Janus-Pro模型架构及优化方法浅谈
原创
社区头条
热门内容榜
• 最近上榜
deepseek开源的多模态大模型Janus再次升级,也来简单看下Janus的架构设计。核心创新点:传统的多模态模型通常使用单一视觉编码器来处理多模态理解和生成任务,这会导致任务之间的冲突,因为这两种任务对视觉信息的需求粒度不同。Janus通过将视觉编码解耦为独立的路径,分别处理多模态理解和生成任务,使两个任务得到统一,并取得了比较好的性能。多模态理解:使用SigLIP编码器提取图像的高级语义信息,适合理解任务。视觉生成:...
毛毛雨_11
0回复
931浏览
多模态
LLM
大模型
使用语义模型和场景感知NLP的个性化搜索优化以改进搜索结果
原创
社区头条
本指南展示了如何使用HuggingFace的Transformer模型构建语义搜索引擎,以提供更精确、更贴合场景的搜索结果。你也许会好奇,像谷歌这样的搜索引擎是如何将“预算友好的度假胜地”(budgetfriendlyvacationspot)和“廉价的旅游地点”(cheapplacestotravel)等短语解释为基本相同的查询?这正是语义搜索的强大之处。传统搜索引擎严重依赖于精确的关键字匹配,它们只查找包含查询中输入的确切单词的文档或结果。例如,你如果搜索...
51CTO内容精选
0回复
694浏览
语义搜索
语义模型
场景感知
外国专家解读DeepSeek:预算有限,如何复制R1推理模型?纯强化学习不现实!
原创
社区头条
出品51CTO技术栈(微信号:blog51cto)SebastianRaschka是一位外国知名的AI专家。特别在大型语言模型(LLM)研究方面,有着丰富的研究经验。近日DeepSeekR1推理模型的推出,将“任何一款不是o1的模型快速蒸馏成具备强推理能力的o1”成为了可能,而且所需的成本和算力都大大降低。但爆火有一个地方不好,就是很容易让我们迷失在炒作的海洋中,寻找不到有价值的信息。Raschka非常nice,昨天发布了一篇有关DeepSeek推理模型...
51CTO技术栈
0回复
212浏览
DeepSeek
R1
推理模型
DeepSeek R1 Vs OpenAI o1!全球顶级推理模型训练技术对比大解密!
原创
社区头条
热门内容榜
• 最近上榜
整理言征出品51CTO技术栈(微信号:blog51cto)过去12个月,大型语言模型(LLM)的重头戏是增强其推理能力,以弥补与通用人工智能(AGI)的差距。DeepSeekR1和OpenAIo1是引领这一发展的两个著名模型,旨在出色地完成复杂的推理任务。本文对这些模型进行了深入比较,仔细研究了它们的架构设计、训练方法、性能基准、优势、局限性、成本和可访问性。一、模型概述DeepSeekR1:DeepSeekR1代表了DeepSeekAI开发的第一代推理模型。它的独...
51CTO技术栈
0回复
1785浏览
DeepSeek R1
OpenAI o1
模型
多尺度深度卷积神经网络的多尺度特征输出分析
以齿轮箱故障数据为例,故障工况如下:(a)健康状态HEA;(b)切齿故障CTF;(c)缺齿故障MTF;(d)齿根裂纹RCF;(e)齿面磨损SWF;(f)滚动体故障BF;(d)复合故障CWF;(e)内圈故障IRF;(f)外圈故障ORF。下图为齿轮箱九种状态的多尺度特征学习情况。鉴于不同尺寸的卷积核能提取不同频率段的特征,可以看出特征图类似于通常的时间尺度表征映射图,不同尺度的卷积操作能够捕获不同的特征信息,模型可以根据不同的状态输入振动信号自适应地...
步惊云_32
0回复
209浏览
卷积神经
网络
SincNet
DeepSeek:教育变革的催化剂
2024年底,一款名为DeepSeek的AI产品引发了全球关注,其在美区苹果AppStore免费榜飙升至首位,并在中国区同样占据榜首位置。外媒评价称,DeepSeekV3的性价比优势标志着中国AI公司在基础层创新上首次对硅谷主导地位构成实质性挑战。DeepSeek的出现不仅是技术突破的象征,更引发了对教育现状的深刻反思。该产品在文学创作方面展现出卓越能力,例如其创作的带有古龙风格的新春祝福语,其文采和深度令人惊叹。这不禁让人思考:在AI...
风云2002_1
0回复
345浏览
DeepSeek
人工智能
个性化
一文读懂 DeepSeek-R1:大语言模型推理能力进化的秘密武器
精华
社区头条
热门内容榜
• 最近上榜
大家好!今天咱得聊聊人工智能这圈的大新闻。现在大语言模型,就像雨后春笋一样冒出来,大家都知道它们厉害,能聊天、能写文章、能做题,可你知道它们的推理能力是咋一步步变强的吗?最近,DeepSeekAI搞出了个大动作,整出了DeepSeekR1系列模型,这就好比给大语言模型的推理能力打了一针超强的“升级针”,直接让它们的“智商”上了好几个台阶。这模型到底咋做到的?它又会给我们的生活带来啥意想不到的变化?今天咱就好好扒一...
十一月雨_55
0回复
2521浏览
DeepSeek-R1
大语言
模型
暂无内容
1
3
4
5
6
7
8
9
10
11
客服