51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
WOT技术大会
IT证书
公众号矩阵
移动端
短视频
免费课程
课程排行
直播课
软考学堂
全部课程
厂商认证
IT技术
25年5月软考
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
我的关注
全部帖子
默认
发布时间
热度
原创
精华
热门标签
DeepSeek
AI
大模型
学习大模型技术的方法论——从应用中学习大模型
原创
“知行合一,在知中行,在行中知”在技术学习的过程中,有时会陷入一个误区,那就是一心扑在技术上;然后也不知道技术有什么用,该怎么用。在学习大模型的过程中也是如此,有时钻牛角尖陷入技术无法自拔;但是,如果真的让你用大模型的技术去解决业务问题,这时自己又开始傻眼了。因为不知道怎么把技术和业务相结合,也就是说学了技术但又不知道该怎么用。把技术与业务相结合——知行合一的方法论技术人员有一个很大的问题就是...
AI探索时代
0回复
1282浏览
模型
人工智能
对企业来说大模型商业化的三种方式
原创
“技术商业化,这是所有企业都需要思考的问题”技术的发展难免需要经过商业化的过程,这也是技术造福人类的根本所在。而具体怎么把技术与商业相结合,这就是一个哲学问题或者说是方法论。比如,互联网刚出现时,很多人都意识到了互联网的巨大商业价值,但却不知道它的价值在哪;也不知道怎么把互联网与商业相结合;最终产生了第一次互联网泡沫。但经过那次互联网泡沫之后,互联网涅槃重生,直到今天。可以说互联网成为当今社会...
AI探索时代
0回复
1646浏览
大模型
大模型的发展趋势预测——大模型会做的更小,还是做的更大
原创
“大模型的发展,类似于计算机的发展由大到小”最近在抖音上看到360创始人——周鸿祎说他关于大模型的发展的四个趋势,也就是开源,廉价,专业,小巧。开源就是以openAI为代表的闭源大模型和MetaGoogle为代表的开源大模型的模型大战;廉价就是大模型的训练成本会进一步降低,也就是意味着大模型会越来越便宜;专业即垂直领域的大模型会大放异彩;最后小巧是大模型在未来会被移植到手机上。虽然不知道周鸿祎的预测是否准确,开源...
AI探索时代
0回复
659浏览
大模型
AI画家的「滑铁卢」:为什么冰可乐不愿意住进茶杯里?
精华
文章的第一作者是上海交通大学博士研究生赵峻图(主页:https:juntuzhao.run),他的研究方向包括计算机视觉和人工智能赋能的生命科学。此外,他还担任上海交通大学校田径队队长。文章的通讯作者为上海交通大学长聘教轨助理教授、博士生导师王德泉(主页:https:dequan.wang)。设想一下,如果让你画一幅“茶杯中的冰可乐”的图片,尽管茶杯与冰可乐的组合可能并不恰当,你仍然会很自然地先画出一个茶杯,然后画上冰块与可乐。...
轻薄滴假象
0回复
824浏览
AI
图片生成
4090单卡可跑,6秒直出电影级画质,智谱版Sora正式开源!
7月26日,智谱发布AI生视频产品「清影」,30秒将任意文图生成视频,并上线在他们的AI助手「智谱清言」上,被誉为是国内首个人人可用的Sora。就在发布6天后,「清影」生成到视频数便已突破了百万量级。今天,智谱AI宣布将与「清影」同源的视频生成模型——CogVideoX正式开源。团队表示,希望每一位开发者、每一家企业都能自由地开发属于自己的视频生成模型,从而推动整个行业的快速迭代与创新发展。打开AI助手「智谱清言」即可体...
duhorse
0回复
839浏览
视频
生成
OpenAI版终结者降临!地表最强机器人Figure 02问世,进宝马狂飙20小时
号称OpenAI二代机器人「Figure02」,真的来了!刚刚,FigureAI终于官宣了第二代人形机器人,完全换了一身新形象——黑色的外观,更加灵活的五指。创始人BrettAdcock表示,「这是『地表最强』的人形机器人」!值得一提的是,Figure02的设计评审耗时18个月完成。据介绍,迭代后的Figure手部具有16个自由度,能够承受与人类相当的力量。现在的它,已经进入宝马车厂开始打工了,可以无休止地狂干20个小时。Figure02还可以与人类直接...
duhorse
0回复
867浏览
AI
机器人
基于Llama 3的AI代理开发实战演练
原创
通过本文,您将学会基于开源的深度学习模型可视化工具Gradio构建一个具有Llama3模型函数调用功能的AI代理的完整过程。简介想象一下,你想买点东西。于是,你访问某个电子商务网站并使用搜索选项查找所需内容。也许你有很多东西要买,所以这个过程不是很有效。现在,请考虑一下这样一个场景:打开一个应用程序,用简单的英语描述一下你想要的东西,然后按下回车键。你不必担心搜索和价格比较,因为应用程序会自动为你处理了。很...
51CTO内容精选
0回复
1137浏览
Llama 3
AI代理
深度学习
别缴“对齐税”了,未审查/对齐的模型更受欢迎!用户:纯粹版比受限版有用!
原创
编辑言征出品51CTO技术栈(微信号:blog51cto)1.未经对齐的模型很重要审查模型的主要缺点之一是所谓的“对齐税”。这是指当模型被过度调整以符合特定的道德准则时,性能会下降。但缺点远不只是性能,经过了几番教训后,Nidum.AI联合创始人ArjunReddy认为:“未经审查的模型没有任何人为的偏见,当你在LLM的基础上构建产品时,使用无偏见的模型非常重要。”(即,对齐审查≈新的偏见)Reddy进一步提到,由于偏见,该公司避免使...
51CTO技术栈
0回复
2427浏览
模型
LLMs
LLM
美国国防部大刀阔斧,启动AI项目:将老旧C代码全部转换为Rust
原创
整理丨诺亚出品51CTO技术栈(微信号:blog51cto)为了加快向内存安全编程语言的迁移步伐,美国国防部高级研究计划局(DARPA)正积极推动一项名为“TRACTOR”的创新项目。TRACTOR,即“TRanslatingAllCTORust”,是一个旨在利用先进的机器学习技术自动将老旧的C代码转换为Rust语言的工具。内存安全问题一直是软件开发中的老大难,比如常见的缓冲区溢出漏洞,这些隐患常常潜伏在庞大的代码库中,成为安全威胁的主要来源。DARPA希...
51CTO技术栈
0回复
1277浏览
AI项目
C代码
Rust
模块化RAG:RAG新范式,像乐高一样搭建
精华
1.RAG系统的发展历史与问题RAG(检索增强生成)通过访问外部知识库,检索增强生成(RAG)为LLMs提供了关键的上下文信息,极大地提升了其在知识密集型任务上的表现。RAG作为一种增强手段,已在众多实际应用场景中广泛运用,涵盖知识问答、推荐系统、客户服务以及个人助手等领域。RAG技术的发展可归结为三个阶段:•起初,检索增强技术被引入,提升预训练语言模型在知识密集型任务上的表现。比如:Retro通过检索增强优化了预训练...
大语言模型论文跟踪
0回复
1460浏览
RAG
系统
微调
我们一起聊聊Google DeepMind推出Gemma 2 技术报告
引言:大规模语言模型的发展与挑战近年来,大规模语言模型(LLMs)在语言理解、生成和推理方面展现出了强大的能力。随着模型规模的不断扩大,新的能力也逐渐显现。最新的大型模型不仅在推理基准测试上达到了前所未有的性能,还展示了多模态和多语言的能力,甚至能处理超过1M个令牌的上下文长度。尽管小规模模型的性能也在迅速提升,这些提升主要来自于增加训练长度。然而,这种方法与数据集大小的增长呈对数关系,最新的小型模...
AI论文解读
0回复
1753浏览
LLMs
Gemma 2
模型
未来的智能战场——多智能体系统的防御与生存之道
多智能体系统(MultiAgentSystems,MAS)近年来在各类任务中展现出卓越的能力,尤其是在代码生成、数学问题解决、翻译和文本评估等领域。通过多个专家智能体的协作,这些系统能够将复杂任务分解为更小的子任务,由各个智能体分别处理,从而提高整体效率和准确性。然而随着多智能体系统的广泛应用,其安全性问题也日益凸显。特别是当系统中存在恶意智能体时,这些智能体可能会生成错误或不相关的结果,进而破坏整个系统的协作效果...
xuxiangda
0回复
1931浏览
多智能体
系统
错误率
比OpenAI的Whisper快50%,最新开源语音模型
生成式AI初创公司aiOla在官网开源了最新语音模型WhisperMedusa,推理效率比OpenAI开源的Whisper快50%。aiOla在Whisper的架构之上进行了修改采用了“多头注意力”机制的并行计算方法,允许模型在每个推理步骤中预测多个token,同时不会损失性能和识别准确率。开源地址:https:github.comaiolalabwhispermedusahuggingface:https:huggingface.coaiolawhispermedusav1传统的Transformer架构在生成序列时,是遵循逐个token的顺序预...
Aceryt
0回复
943浏览
模型
开源
斯坦福、Salesforce等开源1万亿tokens多模态数据集
华盛顿大学、斯坦福大学、Salesforce等研究人员联合开源了多模态数据集MINT1T。据悉,MINT1T共包含了大约1万亿个文本标记和34亿张图像,是现有开源多模态数据集的10倍,同时还首次从ArXiv网站中爬取了专业论文,进一步提升了数据质量。这对于开源领域开发GPT4o、Gemini等多模态模型,提供了全面、多元化的数据集。开源地址:https:github.commlfoundationsMINT1TMINT1T数据集包含了多种来源,其中,HTML文档的主要来源于CommonC...
Aceryt
0回复
811浏览
数据
模型
AI界的新宠:揭秘Llama 3.1如何革新AI合成技术
精华
合成数据技术并不是创造全新的信息,而是通过转换现有信息来生成不同的变体。在过去的十多年里,合成数据技术已被广泛应用于提升各类模型的精确度——无论是通过变换图像来优化物体检测模型,还是加强信用卡欺诈检测,亦或是提升BERT模型在自动问答方面的表现。随着大型语言模型(LLMs)的出现,生成合成数据的动力和技术都得到了极大的加强。各行各业的企业正在利用合成数据来微调基础LLMs,以满足各种应用场景的需求,比如:金...
ermulong
0回复
1011浏览
AI
合成技术
Llama 3.1
两阶段超长周期用户行为序列建模方法总结
今天这篇文章介绍的主题是推荐系统中,基于两阶段的超长周期用户兴趣建模系列工作。主要介绍业内比较有代表性的由快手发表的3篇工作,从2020年最开始的SIM首次提出的两阶段行为序列建模方法,到2022年KDD上发表的TWIN对两阶段一致性的优化,再到2024年CIM上提出的在TWIN基础上引入层次聚类进一步释放长周期建模能力。1.背景在推荐系统的排序模型中,用户行为序列建模部分的迭代一直是最核心的收益来源。用户行为序列建模迭代,...
海因斯DK
0回复
2048浏览
序列
建模
方法
Llamaindex推出workflow应对复杂LLM应用构建,以及技术实现从图(Graph)转向事件驱动(EDA)原因解析
同一天,LLM应用开发另一个代表产品Llamaindex也发布了其在此领域的新功能——workflow,进一步提升应用编排的能力。早在去年,Llamaindex在这方面已经有了动作,推出了QueryPipeline(详见:应用编排的未来是Pipeline,LlamaIndex开发预览版推出QueryPipeline,提升应用开发的灵活性),它是一个声明式设计,可以自定义整个查询流程为一个DAG(有向无环图)流程,支持从简单到复杂的不同服务流程。对于一般的RAG类...
Syrupup
0回复
1819浏览
LLM
EDA
Graph
MSRA古纾旸:2024年,视觉生成领域最重要的问题有哪些?
精华
文章链接:https:arxiv.orgpdf2407.18290亮点直击概述了视觉生成领域中的各种问题。这些问题的核心在于如何分解视觉信号,其他所有问题都与这一核心问题密切相关,并源于不适当的信号分解方法。本文旨在引起研究人员对视觉信号分解重要性的关注。问题1:生成模型的目标是什么?在作者看来,生成模型的设计目的是“创造人们所设想的”。数字信号的生成需要经过三个里程碑:第一个里程碑是将用户的想法翻译成计算机可以理解的格式...
angel
0回复
916浏览
视觉
生成
为什么最新的LLM使用混合专家(MoE)架构
原创
本文详细介绍了混合专家(MoE)架构,该架构通过混合或融合不同的“专家”模型共同解决特定的问题。专业化的必要性医院有很多具有不同专长的专家和医生,他们擅长解决各自领域内的医疗难题。外科医生、心脏病专家、儿科医生等各类专家紧密合作,为患者提供了全面而个性化的医疗护理服务。同样,人们也可以将这一合作模式应用于人工智能领域。人工智能中的混合专家(MoE)架构被定义为不同“专家”模型的混合或融合,能够共同处理或...
51CTO内容精选
0回复
1564浏览
LLM
人工智能
大型语言模型
小模型和开源正在成为AI发展的变数
原创
编译丨诺亚出品51CTO技术栈(微信号:blog51cto)在IT行业,“精益”常用来描述追求更高效率和成本效益的流程,生成式AI也不例外。一些企业的AI系统运行成本高达数百万美元,并消耗大量电力,促使企业寻求更高效、精益的AI解决方案。企业自然倾向于借助公共云快速部署生成式AI,因其提供便捷的一站式服务。大型云服务商已从AI投资中获益。但使用云服务的成本有时会超过传统数据中心,尽管如此,企业仍在寻找有效降低成本的方法...
51CTO技术栈
0回复
754浏览
AI
小模型
开源
暂无内容
1
104
105
106
107
108
109
110
111
112
客服