51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
WOT技术大会
IT证书
公众号矩阵
移动端
短视频
免费课程
课程排行
直播课
软考学堂
全部课程
厂商认证
IT技术
25年5月软考
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
我的关注
全部帖子
默认
发布时间
热度
原创
精华
热门标签
DeepSeek
AI
大模型
微软人工智能研究院推出 OLA-VLM:一种以视觉为中心的优化多模态大型语言模型的方法
原创
精华
01、概述随着人工智能(AI)领域的飞速发展,多模态大语言模型(MLLMs)正在快速崛起,推动着机器在理解和推理文本与视觉数据方面的能力。传统的AI系统通常在语言和视觉之间有着明显的界限,但随着技术的进步,我们正迎来一个可以同时处理视觉和语言信息的新时代。多模态大语言模型通过弥合视觉与语言之间的鸿沟,正在为图像分析、视觉问答、以及多模态推理等领域带来革命性变革。这些技术的出现,标志着人工智能在理解和与世界...
Halo咯咯
0回复
746浏览
多模态
大语言模型
大模型之嵌入与向量化的区别是什么?
原创
“嵌入是更高层次的向量化,是智能化的;而向量化是一种数值转化的过程,是机械式的”在前面写了几篇关于嵌入和向量化的文章,然而在今天才发现之前理解的有偏差,嵌入和向量并不是一个东西,其效果虽然相似但却并不完全一样。嵌入与向量化先来思考一下向量化和嵌入是同一个东西吗?如果不是,那他们的区别是什么?我们都知道向量是大模型的底层数据结构,可以说没有向量就没有大模型;因此,在神经网络中唯一能够处理的数据格...
AI探索时代
0回复
593浏览
大模型
向量化
AGI将至!2025年,第一批智能体成为公司劳动力;回顾OpenAI九年:我们的愿景不会改变,但策略将继续演变!
原创
社区头条
出品51CTO技术栈(微信号:blog51cto)OpenAICEO,营销高手,奥特曼又开始疯狂发推了。首先,他又充当起了AI“谜语人”,给观众一些模棱两可的话。“接近奇点;不清楚是哪一边”。很多人觉得这是给出了信号:AGI就要来了!图片两小时前,奥特曼又洋洋洒洒写了篇4、5千字的长文:反思。图片画个文章的重点(下文有全文翻译):OpenAI在过去的九年中从零开始发展,作为先驱“摸着石头过河”,经历了多次曲折和挑战。在2025年,预...
51CTO技术栈
0回复
581浏览
AGI
OpenAI
AI
大模型之神经网络特征提取综述
原创
“特征提取是神经网络的核心能力之一,但其复杂程度远没有想象中的那么简单”在之前的文章编码器和解码器中介绍了编码器和解码器的核心功能之——特征提取和特征重建;编码器的核心任务是特征提取,而解码器的核心任务是特征重建。但除开模型设计者也就是神经网络设计者之外,对大模型的使用者来说,大模型就是一个黑盒模型;用户只需要给定输入,大模型就可以根据训练结果给出相对应的数据输出。因此对使用者来说,大模型内的...
AI探索时代
0回复
518浏览
大模型
神经网络
如何估算不同大小的大模型需要多大的GPU?
精华
在几乎所有的LLM访谈中,都有一个问题不断出现:“为大型语言模型提供服务需要多少GPU内存(LLM)?这不仅仅是一个随机的问题,它是一个关键指标,表明您对这些强大模型在生产中的部署和可扩展性的理解程度。在使用GPT、LLaMA或任何其他LLMs,了解如何估算所需的GPU内存至关重要。无论您是处理7B参数模型还是更大的模型,正确调整硬件大小以服务于这些模型都至关重要。让我们深入研究数学运算,这将帮助您估算有效部署这些模型...
sulu637
0回复
803浏览
大模型
GPU
LLaMA
三分钟带你看完Lovable,这款全新的AI全栈APP构建器击败了Bolt吗?
社区头条
Hi,这里是Aitrainee,欢迎阅读本期新文章。以前漏了一个Lovable没说,现在他更新迭代的更好了,我们来讲讲。Hi,这里是Aitrainee,欢迎阅读本期新文章。以前漏了一个Lovable没说,现在他更新迭代的更好了,我们来讲讲。这也是一个AI全栈应用程序构建器。他现在和Bolt一样,除了能够通过自然语言生成全栈Web程序之外,现在也能与Superbase集成《Bolt+Supabase:1分钟实现APP的登陆功能、连接数据库(Bolt、Cursor、BaaS、AI全栈...
老蛀虫
0回复
854浏览
Lovable
AI
APP
langchain送来新年礼物,开源canvas来了
langchain也送来新年礼物了,对标openaicanvas的项目开源。OpenCanvas不是又一个AI聊天机器人。它是一个开源的Web应用,可以让你与AI助手协同工作,以更高效、更智能的方式创作文档和代码。它汲取了OpenAI“Canvas”的灵感,但又有所创新,为你带来更强大的功能和更灵活的体验。试用地址:https:opencanvas.langchain.comOpenCanvas的独特之处:完全开源,自由掌控:所有代码都是开源的,并采用MIT许可。你可以自由地使用、修改...
NLP前沿1
0回复
304浏览
langchain
canvas
AI
Megrez-3B-Omni:无问芯穹端侧全模态大模型技术剖析与应用指南
在人工智能领域,技术的创新不断推动着行业的发展。前段时间,无问芯穹发布的Megrez3BOmni模型引起了广泛关注,它作为全球首款端侧全模态理解开源模型,为智能设备的交互体验带来了全新的变革。本文将对Megrez3BOmni进行详细介绍,包括项目概述、技术特点、性能优势、应用场景、快速使用以及项目地址等,希望能帮助读者更好地了解这一创新技术。一、项目概述Megrez3BOmni是由无问芯穹发布的全球首款端侧全模态理解开源模型。它...
穿越时空111
0回复
805浏览
Megrez
人工智能
技术
深入探讨语音转文本技术的演进
语音转文本(STT),也称为自动语音识别(ASR),是一种将口语转录成书面文本的AI技术,现在越来越多的公司利用STT在现有应用程序中嵌入新的音频功能,并为一系列用例创建智能助手。语音转文本模型简史首先,一些背景信息。语音转文本是AI中自然语言处理(NLP)分支的一部分。它的目标是使机器能够理解人类语音并将其转录成书面格式。你可能会想,转录语音有多难。简短的回答是:非常难。与可以以相对简单的方式放入矩阵中的图...
芝士AI吃鱼
0回复
475浏览
语音
文本
技术
一篇大模型GraphRAG最新综述
嘿,大家好!这里是一个专注于AI智能体的频道AI的“知识焦虑”很多时候,即使是最强大的AI模型,在面对复杂问题时也会显得力不从心?它们仿佛拥有惊人的记忆力,却无法真正理解知识背后的逻辑和关联。这就像一个学霸,背诵了无数知识点,却难以灵活运用。原因在于,传统的AI模型(例如大模型)处理信息的方式,通常是将数据视为孤立的个体。它们无法像人类一样,自然而然地捕捉到数据之间的关系,而这种关系正是理解知识的关键...
探索AGI
0回复
709浏览
GraphRAG
大规模
检索
十个Cursor智能编程技巧,从小白到高手
提高效率和优化工作流程是每个开发者所追求的。本文分享如何利用Cursor工具,从提升性能到增强技能,全方位改进你的编码实践。1.精准上下文提升Cursor性能Cursor的效能与提供的上下文信息质量直接相关。具体又准确的信息能提升其建议的准确性。通过“”标记相关文件和链接,可以提高代码建议的精确度。例如,在开发API端点时,可以这样指定任务:“routesapi.jsmodelsuser.js创建用户注册端点,执行输入验证、密码加密并存储用...
小虎哦哦
0回复
2619浏览
Cursor
集成终端
键盘
博通连续30天暴涨,英伟达将遭平替?AMD优势不够,英伟达卡生产过剩
原创
社区头条
编辑|言征出品51CTO技术栈(微信号:blog51cto)2025年开年,AI芯片的市场角逐再度成为大洋彼岸的角逐话题。近日,霸主英伟达的收入增长速度开始放缓,相比之下过去30天博通等公司股价持续暴涨,业界很多人都在猜测率先打破英伟达垄断地位的第二“英伟达”会是谁云租赁市场又会发生怎样的变化12月25日,最新一期的BG2播客中,主持人比尔·格利(BillGurley)和布拉德·杰斯特纳(BradGerstner)再次同台,并邀请了SemiAnalysis...
51CTO技术栈
0回复
1058浏览
英伟达
AMD
租赁市场
完整复现Sora,Open-Sora最新技术报告发布,提供完整训练代码、权重及数据处理工具
精华
社区头条
文章链接:https:arxiv.orgpdf2412.20404项目链接:https:github.comhpcaitechOpenSora总结速览解决的问题人工视觉智能,特别是生成和模拟我们所见世界的能力,相较于语言能力的突破仍然滞后。现有视频生成模型在高保真视频内容生成、灵活视频合成及长时间视频生成方面面临诸多挑战。提出的方案本文引入OpenSora,一个开源的视频生成模型,支持文本生成图像、文本生成视频以及图像生成视频等多种视觉生成任务。通过空间时间扩散...
angel
0回复
1586浏览
开源
视频
技术
即插即用,无痛增强模型生成美感!字节跳动提出VMix:细粒度美学控制,光影、色彩全搞定
文章链接:https:arxiv.orgpdf2412.20800代码地址:https:github.comfenfenfenfanVMix项目地址:https:vmixdiffusion.github.ioVMix亮点直击分析并探索现有模型在光影、色彩等细粒度美学维度上生成图像的差异,提出在文本提示中解耦这些属性,并构建一个细粒度的美学标签体系,提供清晰的模型优化方向;提出VMix条件注入方法,它将输入文本提示解耦为内容描述和美学描述,通过值混合交叉注意力的条件控制方法,从不同维度提升模...
angel
0回复
459浏览
研究
模型
AI
机器学习用户宝典:使用SVM解读情感
原创
社区头条
有没有想过机器是如何识别人脸表情或分类物体的?答案在于支持向量机(SVM)。我们在这篇博文中将通过一个分步骤的项目来探究其工作原理。在介绍该项目之前,不妨简要介绍一下SVM。支持向量机支持向量机(SVM)可能听起来像一个复杂的术语,但它却是机器学习领域一种简单而强大的方法。你可以把它想象成一个智能边界划分者,帮助机器对数据进行分类。无论是分类垃圾邮件、识别人脸还是检测情感,SVM都能找到分离不同类别数据的...
51CTO内容精选
0回复
782浏览
机器学习
SVM
AI
大模型底座之向量化,以及向量化的原理
原创
社区头条
“向量化是一切大模型技术的基础,大模型中的一切都是向量。”在之前的文章曾不止一次的讲过向量,向量作为大模型的基础数据格式,其重要性不言而喻;但大部分人对向量还是没有一个深刻的认识。所以,今天我们就来讨论一个问题,那就是向量化,大模型的入口。向量化向量的概念这里就不解释了,有问题的可以看之前的文章,或者自己去找一下向量,矩阵的内容看看。先来讨论第一个问题,为什么要向量化?原因在于计算机无法直接处...
AI探索时代
0回复
1429浏览
大模型
向量化
2025年五大最佳AI网站建设平台
随着技术的进步,如今使用AI构建网站已经不再是新鲜事。只需告诉AI你想创建什么样的网站,它就能为你生成一个。在本文中,我将向你展示几款最佳的免费AI网站构建器。我已经对这些工具进行了详细测试,以便你可以轻松选择。顶级推荐HostingerAI网站构建器CodeDesignAIDurableAI网站构建器1.HostingerAI网站构建器HostingerAI网站构建器能够从零开始创建网站。使用这个工具不需要任何编码或技术技能。它利用智能AI模型生成符合你...
丢翅膀的鱼
0回复
1792浏览
AI
平台
网站
华为终端BG李小龙曝出业界翻车难题:手机拍摄的模糊文字,用AI增强很容易翻车
原创
社区头条
编辑言征出品51CTO技术栈(微信号:blog51cto)近日,华为终端BG李小龙发博展示了Mate70Pro+的AI照片增强的功能,并热心询问大家对于AI云增强效果是否满意。图片为了方便大家查看效果,大家可以点击下面的大图来查看AI增强效果。左侧是原图,右侧是AI增强图左侧是原图,右侧是AI增强图不过一位好奇的网友在评论区问了一个让李小龙非常关注的问题:小龙总,高倍率看不清楚的字能AI(增强)吗,最好要自然点,不能弄成假的。图片...
51CTO技术栈
0回复
852浏览
华为
手机
AI
新鲜速递:图解新颖LLM的CoPE位置编码
原创
1.快速总览研究人员提出了一种新颖的位置编码方法,称为上下文位置编码(下文称之为CoPE),它有别于基于标记的传统位置编码范式。它以上下文依赖的方式测量位置,在按位置寻址时会更加自由它在如下的任务中获得不错的收益:FlipFlop,SelectiveCopy,Counting,LanguageModeling,andCodeModelingtasks它优于现有方法,尤其是在域外泛化场景它有可能改善其他领域的编码,例如视频和语音。在这些领域,基于Token位置的编码不太合适...
鲁班模锤1
0回复
616浏览
LLM
CoPE
位置编码
长文 | 大模型Post-Training总结
社区头条
今天给大家带来一篇知乎好友hadiii的一篇文章,汇总Llama3.1、DeepSeekV3、TÜLU3和Qwen2.5的后训练PostTraining技术。知乎:https:zhuanlan.zhihu.comp12862210431本文汇总Llama3.1,DeepSeekV3,TÜLU3,Qwen2.5报告的后训练部分,摘录其中核心的细节。大多涉及到数据,SFT,RL(各种RM训练,DPO,GRPO,RLVR等等)。1.Llama3.1paper:https:ai.meta.comresearchpublicationsthellama3herdofmodelsIllustrationoftheoverallpos...
NLP工作站
0回复
861浏览
大模型
Post
-Train
暂无内容
1
22
23
24
25
26
27
28
29
30
客服