51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
WOT技术大会
IT证书
公众号矩阵
移动端
短视频
免费课程
课程排行
直播课
软考学堂
全部课程
厂商认证
IT技术
25年5月软考
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
我的关注
全部帖子
默认
发布时间
热度
原创
精华
热门标签
Deepseek
AI
模型
Questel:2024深度学习与大模型全球专利全景报告
“欧米伽未来研究所”关注科技未来发展趋势,研究人类向欧米伽点演化过程中面临的重大机遇与挑战。将不定期推荐和发布世界范围重要科技研究进展和未来趋势研究。Questel是一家世界著名端到端知识产权解决方案提供商,为超过20,000家客户和150万用户提供服务,覆盖30个国家。主要提供软件套件,用于发明和知识产权资产的搜索、分析和管理。简述深度学习和大型语言模型(LLMs)专利的关键趋势图示深度学习领域知识产权保护的激烈...
欧米伽未来研究所
0回复
463浏览
深度学习
大模型
DL
阿里面试惊现难题:大模型服务吞吐率太小咋整?
社区头条
想象一下,就像咱们家里的水管,正常来讲水应该哗哗地流,可要是这管子太窄了,水就只能滴滴答答,让人干着急!当下咱们面临的大模型服务吞吐率太小,不就类似于这窄窄的水管吗?当面试官问你有没有办法把大模型服务吞吐这个“管子”拓宽,让数据像奔腾的江河一样顺畅流淌,你准备怎么解决?1.面试官心理分析当面试官问你这个问题的时候,其实面试官主要是想考验你如下3个方面:第一,在实际业务中,你有没有做过大模型服务性能...
丁师兄大模型
0回复
409浏览
大模型
服务
吞吐率
基于 LlamaFactory 微调大模型的实体识别的评估实现
介绍使用LlamaFactory结合开源大语言模型实现文本分类:从数据集构建到LoRA微调与推理评估.https:blog.csdn.netsjxgghgarticledetails144290200在前一篇文章的文本分类评估中,已经介绍了主要的框架,故在大模型微调的流程框架方面本文不再赘述。实体数据集格式下述是实体识别评估的一条数据示例:{"prompt":"从以下政府文本中,提取指定的实体类别,并按照JSON格式输出结果。xxx","predict":"\njson\n{\n\"行政区划和地理实体\...
AI悠闲区
0回复
400浏览
微调
大模型
实体识别
全面指南!掰细了讲混合专家模型MoE的内部结构
热门内容榜
• 最近上榜
什么是混合专家模型MoE呢?混合专家模型MoE是一种能让大型语言模型(LLM)质量变好的技术。它主要由两部分组成:专家——现在每个前馈神经网络(FFNN)层都有好多个“专家”,每次可以用其中一部分。“专家”一般也是前馈神经网络。门控网络——它能决定把哪些tokens送到哪些专家那儿。在带混合专家模型MoE的大型语言模型的每一层,都能看到这些有点专门作用的专家:要知道,这里的‘专家’可不是像‘心理学’‘生物学’这种特定...
智驻未来
0回复
914浏览
MoE
模型
数据
2024,中国大模型落地究竟如何,这些人和企业值得关注!
原创
社区头条
热门内容榜
• 最近上榜
2024,中国大模型行业落地究竟怎么样了?回顾2024,生成式AI浪潮汹涌,但核心驱动力却始终没有变化,依旧源自于“人”不懈推动。特别是过去一年,行业内涌现出众多上下求索的创新先锋,他们对中国人工智能落地产生了深远影响。透过这些人物群像,我们可以窥见2024中国AI落地进程的生动面貌。他们其中,不乏互联网业内的精英,敏锐捕捉到前沿技术的落地痛点,通过出色的产品表现,赢得公众的声声喝彩。更有佼佼者走出大厂,为信...
51CTO技术栈
0回复
585浏览
大模型
AI
阿里巴巴
文档解析技术指南:从传统Pipeline到端到端大模型
原创
编者按:每天我们都在与各种格式的文档打交道,如何快速准确地从这些文档中提取有价值的信息,如何让AI理解文档中的表格、公式和图表,成为摆在我们面前的一道难题。特别是对于从事数据分析、学术研究或法律工作的专业人士来说,手动处理和整理这些文档不仅耗时耗力,还容易出错。一份技术报告中的复杂数学公式,一篇论文中的多层嵌套表格,或是一份合同中的关键条款,都需要我们投入大量精力去理解和提取。本文深入剖析了当前...
Baihai_IDP
0回复
836浏览
LLMs
AI
拒绝复制粘贴!Snap&卡内基梅隆提出多主体开集个性化视频生成新范式Video Alchemist!
社区头条
文章链接:https:arxiv.orgpdf2501.06187项目链接:https:snapresearch.github.ioopensetvideopersonalization亮点直击提出了VideoAlchemist,这是一种支持前景对象和背景的多主体、开放集合个性化的新型视频生成模型。精心构建了大规模训练数据集,并引入训练技术以降低模型过拟合。引入了MSRVTTPersonalization,这是一种新的视频个性化基准,提供多种条件模式并能准确测量主体保真度。总结速览解决的问题现有视频个性化生成...
angel
0回复
615浏览
图像
生成
AI
向量数据库真的能满足所有 AI Agent 的记忆需求吗?
原创
编者按:当AIAgent执行长期任务时,如何有效管理和存储它们的"记忆"?向量数据库真的能满足所有AIAgent的记忆需求吗?我们今天为大家带来的文章中,作者指出当前主流的向量数据库虽然能够有效处理对话记忆,但无法完全满足AgenticAI系统在长期任务执行过程中的多样化记忆需求。文章首先介绍了AgenticAI系统的基本概念,以营销案例说明了其任务分解和执行能力。随后深入探讨了向量数据库在管理AI记忆方面的应用及其局限性,特别...
Baihai_IDP
0回复
375浏览
AI
LLM
什么?推荐系统未必数据越多,效果越好!
原创
社区头条
推荐系统自1992年基于用户的协同过滤算法诞生以来,经历了一波又一波的革新大潮,发展至今,已经形成了一套体系完善,理论严密的技术领域。随着越来越多的基于深度学习的推荐系统模型诞生,该领域关于准确率的追求似乎已经不再吸引人们的眼球。相反,越来越多的人开始关注其他热点技术,比如大模型算法。2023年,来自澳大利亚RMIT大学的YueqingXuan等研究人员在arXiv上公布了一篇题为MoreIsLess:WhenDoRecommendersUnderperform...
51CTO内容精选
0回复
365浏览
大模型
算法
推荐系统
多模态大模型Reyes增加batch推理方式,提升推理速度
原创
笔者在前面预训练了一个多模态大模型Reyes,详情见《【多模态&LLM】Reyes:一个从0到1开始训练的多模态大模型(技术报告)》。本文将为Reyes增加一个batch推理方式,提高Reyes的推理速度。Reyes8B开源地址:modelscope权重下载地址:https:modelscope.cnmodelsyujunhuinlpReyes8Bgithub:https:github.comyujunhuicsReyes使用方式将本仓库中的modelingreyes.py文件替换modelscrope下载的modelingreyes.py...
毛毛雨_11
0回复
361浏览
多模态
大模型
Meta AI 发布 Apollo:视频理解的新家族——LMM 大型多模态模型
原创
01、概述近年来,随着多模态模型(LMMs)在文本和图像处理任务上的进步,视频处理领域却显得有些“姗姗来迟”。与单一静态数据相比,视频集成了时间和空间维度的复杂性,对计算资源的要求更高。然而,现有方法通常沿用图像处理模型的架构,或依赖简单的均匀帧采样,这种方式难以有效捕捉视频中的动态与时间模式。此外,训练大规模视频模型耗费极大的计算资源,使得实验和创新受限。为了解决这些问题,MetaAI和斯坦福大学的研究...
Halo咯咯
0回复
534浏览
多模态
大语言模型
阿里巴巴AI研究院发布CosyVoice 2:改进的流式语音合成模型
原创
社区头条
01、概述近年来,语音合成技术取得了显著进展,尤其是在实现实时、自然流畅的语音生成方面。然而,在真正的应用中,诸如延迟、发音准确度、说话人一致性等问题仍然困扰着行业,尤其是在需要高响应性的流媒体应用中。这些技术难题在处理复杂语言输入时尤为突出,比如绕口令或多音字,这超出了现有模型的处理能力。为了应对这些挑战,阿里巴巴的研究人员推出了CosyVoice2,一款针对语音合成技术难题的升级版模型,旨在有效解决这...
Halo咯咯
0回复
800浏览
语音合成模型
Hugging Face 发布 Picotron:解决 LLM 训练 4D 并行化的微型框架
原创
01、概述近年来,随着大型语言模型(LLMs)的兴起,自然语言处理技术取得了飞速发展。从GPT到Llama,这些前沿的语言模型在各个领域中展现出了令人惊叹的能力。然而,训练这些顶级模型的过程却充满了挑战。以Llama3.1405B为例,其训练过程中需要约3900万个GPU小时,相当于4500年单GPU计算时间。为了在几个月内完成这样的训练,工程师们采用了4D并行化的策略,跨越数据、张量、上下文和管道等多个维度进行优化。这种方法虽然高效...
Halo咯咯
0回复
371浏览
人工智能
框架
突发,美国开始拉黑国产大模型公司!智谱官方回应:手握全链路大模型核心技术,无实质影响!
原创
社区头条
编辑伊风月初,腾讯被美国国防部列进了“中国军工企业清单”(1260H清单)已经够离谱了!没想到刚过去10天,更离谱的事情出现了:大模型公司也登上了美国黑名单!昨晚深夜,美国商务部工业和安全局(BIS)修订了实体清单,其中大模型六小虎之一的智谱公司赫然在列。图片把手伸向大模型公司,美国官方也给定了理由:“十个实体因其通过发展和整合先进的人工智能研究来推动中国的军事现代化而被列入清单。”令人惊讶的是,这十家...
51CTO技术栈
0回复
574浏览
美国
腾讯
大模型
李飞飞:通过「空间智能」重构世界
社区头条
热门内容榜
• 最近上榜
在人工智能的持续演进中,多模态大语言模型(MLLMs)已成为核心研究领域之一,其在整合语言和视觉信息方面的潜力备受关注。李飞飞、谢赛宁团队的最新研究成果犹如一颗璀璨的新星,照亮了MLLM在空间智能领域的探索之路,引发了学界和业界的广泛关注。本文将深入剖析该团队的研究,详细阐述MLLM在空间智能方面的突破与挑战,一同探索MLLMs在视觉空间智能方面的进展与难题。1.引言视觉空间智能在人类的日常生活中,视觉空间智能起...
AIGC前沿技术追踪
0回复
1533浏览
李飞飞
空间智能
MLLMs
闭着眼学机器学习—朴素贝叶斯分类
1.算法介绍朴素贝叶斯是一种基于贝叶斯定理的分类算法,广泛应用于文本分类、垃圾邮件过滤、情感分析等领域。它是一种简单但非常有效的分类方法,特别适用于高维度特征空间的分类问题。朴素贝叶斯分类器的"朴素"来源于它对特征之间独立性的假设。尽管这个假设在现实中往往不成立,但该算法在许多实际应用中仍然表现出色。2.算法原理3.案例分析我们使用著名的鸢尾花(Iris)数据集来演示朴素贝叶斯分类器的应用。首先建立朴素贝叶斯分...
AIPaperDaily
0回复
250浏览
朴素贝叶斯
分类
算法
LLM合集:MiniMax-01 开源,性能比肩 GPT-4o,上下文窗口领先 20-32 倍
1.MiniMax01:ScalingFoundationModelswithLightningAttention我们推出了MiniMax01系列,包括MiniMaxText01和MiniMaxVL01。这两款产品不仅性能可与顶尖模型相媲美,而且在处理更长文本上下文方面具备卓越能力。其核心技术是LightningAttention及其高效的扩展方法。为充分发挥计算能力,我们将其与混合专家(MoE)技术相结合,打造出拥有32个专家模块、共计4560亿参数的模型,每个Token激活459亿参数。针对MoE和闪电注意力机制,...
AIPaperDaily
0回复
432浏览
LLM
MiniMax
GPT-4o
人工智能小白到高手:什么是损失函数
在机器学习中,损失函数是用来衡量模型预测值与真实值之间差距的一个函数。它在模型训练过程中起着至关重要的作用,因为通过最小化损失函数,模型能够调整其参数,从而使得预测结果越来越接近真实值。为了帮助理解这一点,我们将以均方误差(MSE)为例,详细讲解什么是损失函数,以及它在实际应用中的作用。什么是损失函数?损失函数是一个用于评估模型预测准确性的数学函数。具体来说,损失函数通过对比模型的预测值与真实值,...
AI取经路
0回复
430浏览
人工智能
MSE
模型
黄仁勋:AI Agent是个价值数万亿美元的机会
在近日的Nvidia发布会上,CEO黄仁勋展示了一张令人印象深刻的指数型曲线,勾勒出人工智能(AI)技术的发展路径。这张图不仅体现了AI技术的过去、现在与未来,还为AI的应用场景和发展阶段提供了清晰的愿景。本文将结合这张图表,解析AI技术的四个发展阶段:感知智能(PerceptionAI)、生成式AI(GenerativeAI)、代理智能(AgenticAI)和物理智能(PhysicalAI)。1.感知智能:AI的起点感知智能是AI发展的第一阶段,位于曲线的起...
云原生AI百宝箱
0回复
437浏览
AI
Agent
Nvidia
AI指令的秘密:三个关键词就能让AI效果翻倍
AI指令的秘密:三个关键词就能让AI效果翻倍大多数人用AI的方式都太直接了。他们输入问题,得到答案,就像在用计算器,这通常也能够取得不错的效果。但有趣的是,仅仅加入几个特定的关键词,就能让AI的回答质量产生质的飞跃。神奇的关键词效应我发现三个特别受欢迎的关键词模式:1."roast"普通提示:"帮我看看这段代码有什么问题"roast提示:"请用最犀利的方式roast一下这段代码,指出所有可能的问题,不用顾及我的感受"或者是更...
草台AI
0回复
307浏览
AI
prompt
场景
暂无内容
1
15
16
17
18
19
20
21
22
23
客服