51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
WOT技术大会
IT证书
公众号矩阵
移动端
短视频
免费课程
课程排行
直播课
软考学堂
全部课程
厂商认证
IT技术
25年5月软考
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
我的关注
全部帖子
默认
发布时间
热度
原创
精华
热门标签
AI
人工智能
智能体
大模型的泡沫什么时候破灭?
原创
作者沈旸出品51CTO技术栈(微信号:blog51cto)对于技术泡沫,大家可能最熟悉的就是Gartner的技术成熟度曲线图。过去几年确实出现了许多备受关注的技术,例如云计算、大数据、区块链和元宇宙。新技术让人激动,但很多企业在跟进这些技术时往往犹豫不决,担心不下注未来会被淘汰,也担心投入巨大但方向错误。例如,前几年Facebook押注元宇宙,甚至将公司名称改为Meta,但元宇宙的技术成熟度和市场发展并未达到预期。幸好,Meta公...
51CTO技术栈
0回复
628浏览
模型
云计算
大数据
浅谈—领域模型训练
今天给大家带来知乎好友ybq一篇关于如何进行领域模型训练的文章,主要内容是对postpretrain阶段进行分析,后续的Alignment阶段就先不提了,注意好老生常谈的“数据质量”和“数据多样性”即可。原文:https:zhuanlan.zhihu.comp711537210Qwen2:https:arxiv.orgabs2407.10671MiniCPM:https:shengdinghu.notion.siteMiniCPMc805a17c5c8046398914e47f0542095aLlama3.1:https:arxiv.orgabs2407.21783什么是领域模型?领域模型为...
NLP工作站
0回复
883浏览
领域
模型
训练
Flux:Midjourney的新图像模型挑战者
原创
BlackForestLabs是一家由前Stability.ai开发人员创立的AI初创公司,旨在为图像和视频创建尖端的生成式AI模型。这家初创公司声称,其第一个模型系列Flux.1为文本到图像的生成设定新的标准。BlackForestLabs总部位于德国弗莱堡,由AI研究人员和开发人员组成,他们曾在Stability.ai从事StableDiffusion和其他生成式AI模型的工作。团队在今年春季从Stability.ai离开,到目前为止已经筹集了3100万美元的种子资金。本轮融资由Andreess...
鲁班模锤1
0回复
713浏览
图像
模型
Flux
利用LlamaIndex和本地PDF文档,轻松打造知识图谱GraphRAG
检索增强生成(RAG)技术通过引入外部知识源,增强了大型语言模型的回答准确性和上下文契合度。尽管RAG在处理复杂异构信息时可能会忽略实体间的结构和联系,例如,向量数据库可能错误地将“员工”与“雇主”关联得更紧密,而非“信息”。知识图谱的引入有效解决了这一局限。它采用节点和边的三元组结构,如“雇主—提交—索赔”,清晰地表达了实体间的关系。这种结构化的方法让知识图谱在处理复杂数据搜索时更为精确和高效。1技...
小虎哦哦
0回复
1813浏览
LlamaIndex
PDF
GraphRAG
Agent planning大揭秘:记忆增强规划能力!
如何让LLM在规划能力上变得更聪明,想象一下,如果我们的AI助手能够记住过去的经历,并且在需要的时候能够回忆起来,那会是多么方便的事情啊!首先,我们要明白,对于AI来说,记忆是提升规划能力的关键。目前,有两种主要的方法可以通过记忆来增强LLMAgents的规划能力:基于RAG的记忆和参数记忆。RAG,也就是检索增强生成,它能够用检索到的信息来增强LLM的最新知识。想象一下,如果AI能够把过去的经验存储在记忆中,并在需要的...
探索AGI
0回复
1113浏览
Agent
LLM
RAG
学习大模型技术的方法论——从应用中学习大模型
原创
“知行合一,在知中行,在行中知”在技术学习的过程中,有时会陷入一个误区,那就是一心扑在技术上;然后也不知道技术有什么用,该怎么用。在学习大模型的过程中也是如此,有时钻牛角尖陷入技术无法自拔;但是,如果真的让你用大模型的技术去解决业务问题,这时自己又开始傻眼了。因为不知道怎么把技术和业务相结合,也就是说学了技术但又不知道该怎么用。把技术与业务相结合——知行合一的方法论技术人员有一个很大的问题就是...
AI探索时代
0回复
966浏览
模型
人工智能
对企业来说大模型商业化的三种方式
原创
“技术商业化,这是所有企业都需要思考的问题”技术的发展难免需要经过商业化的过程,这也是技术造福人类的根本所在。而具体怎么把技术与商业相结合,这就是一个哲学问题或者说是方法论。比如,互联网刚出现时,很多人都意识到了互联网的巨大商业价值,但却不知道它的价值在哪;也不知道怎么把互联网与商业相结合;最终产生了第一次互联网泡沫。但经过那次互联网泡沫之后,互联网涅槃重生,直到今天。可以说互联网成为当今社会...
AI探索时代
0回复
1415浏览
大模型
大模型的发展趋势预测——大模型会做的更小,还是做的更大
原创
“大模型的发展,类似于计算机的发展由大到小”最近在抖音上看到360创始人——周鸿祎说他关于大模型的发展的四个趋势,也就是开源,廉价,专业,小巧。开源就是以openAI为代表的闭源大模型和MetaGoogle为代表的开源大模型的模型大战;廉价就是大模型的训练成本会进一步降低,也就是意味着大模型会越来越便宜;专业即垂直领域的大模型会大放异彩;最后小巧是大模型在未来会被移植到手机上。虽然不知道周鸿祎的预测是否准确,开源...
AI探索时代
0回复
573浏览
大模型
AI画家的「滑铁卢」:为什么冰可乐不愿意住进茶杯里?
精华
文章的第一作者是上海交通大学博士研究生赵峻图(主页:https:juntuzhao.run),他的研究方向包括计算机视觉和人工智能赋能的生命科学。此外,他还担任上海交通大学校田径队队长。文章的通讯作者为上海交通大学长聘教轨助理教授、博士生导师王德泉(主页:https:dequan.wang)。设想一下,如果让你画一幅“茶杯中的冰可乐”的图片,尽管茶杯与冰可乐的组合可能并不恰当,你仍然会很自然地先画出一个茶杯,然后画上冰块与可乐。...
轻薄滴假象
0回复
711浏览
AI
图片生成
4090单卡可跑,6秒直出电影级画质,智谱版Sora正式开源!
7月26日,智谱发布AI生视频产品「清影」,30秒将任意文图生成视频,并上线在他们的AI助手「智谱清言」上,被誉为是国内首个人人可用的Sora。就在发布6天后,「清影」生成到视频数便已突破了百万量级。今天,智谱AI宣布将与「清影」同源的视频生成模型——CogVideoX正式开源。团队表示,希望每一位开发者、每一家企业都能自由地开发属于自己的视频生成模型,从而推动整个行业的快速迭代与创新发展。打开AI助手「智谱清言」即可体...
duhorse
0回复
706浏览
视频
生成
OpenAI版终结者降临!地表最强机器人Figure 02问世,进宝马狂飙20小时
号称OpenAI二代机器人「Figure02」,真的来了!刚刚,FigureAI终于官宣了第二代人形机器人,完全换了一身新形象——黑色的外观,更加灵活的五指。创始人BrettAdcock表示,「这是『地表最强』的人形机器人」!值得一提的是,Figure02的设计评审耗时18个月完成。据介绍,迭代后的Figure手部具有16个自由度,能够承受与人类相当的力量。现在的它,已经进入宝马车厂开始打工了,可以无休止地狂干20个小时。Figure02还可以与人类直接...
duhorse
0回复
706浏览
AI
机器人
基于Llama 3的AI代理开发实战演练
原创
通过本文,您将学会基于开源的深度学习模型可视化工具Gradio构建一个具有Llama3模型函数调用功能的AI代理的完整过程。简介想象一下,你想买点东西。于是,你访问某个电子商务网站并使用搜索选项查找所需内容。也许你有很多东西要买,所以这个过程不是很有效。现在,请考虑一下这样一个场景:打开一个应用程序,用简单的英语描述一下你想要的东西,然后按下回车键。你不必担心搜索和价格比较,因为应用程序会自动为你处理了。很...
51CTO内容精选
0回复
951浏览
Llama 3
AI代理
深度学习
别缴“对齐税”了,未审查/对齐的模型更受欢迎!用户:纯粹版比受限版有用!
原创
编辑言征出品51CTO技术栈(微信号:blog51cto)1.未经对齐的模型很重要审查模型的主要缺点之一是所谓的“对齐税”。这是指当模型被过度调整以符合特定的道德准则时,性能会下降。但缺点远不只是性能,经过了几番教训后,Nidum.AI联合创始人ArjunReddy认为:“未经审查的模型没有任何人为的偏见,当你在LLM的基础上构建产品时,使用无偏见的模型非常重要。”(即,对齐审查≈新的偏见)Reddy进一步提到,由于偏见,该公司避免使...
51CTO技术栈
0回复
1866浏览
模型
LLMs
LLM
美国国防部大刀阔斧,启动AI项目:将老旧C代码全部转换为Rust
原创
整理丨诺亚出品51CTO技术栈(微信号:blog51cto)为了加快向内存安全编程语言的迁移步伐,美国国防部高级研究计划局(DARPA)正积极推动一项名为“TRACTOR”的创新项目。TRACTOR,即“TRanslatingAllCTORust”,是一个旨在利用先进的机器学习技术自动将老旧的C代码转换为Rust语言的工具。内存安全问题一直是软件开发中的老大难,比如常见的缓冲区溢出漏洞,这些隐患常常潜伏在庞大的代码库中,成为安全威胁的主要来源。DARPA希...
51CTO技术栈
0回复
1125浏览
AI项目
C代码
Rust
模块化RAG:RAG新范式,像乐高一样搭建
精华
1.RAG系统的发展历史与问题RAG(检索增强生成)通过访问外部知识库,检索增强生成(RAG)为LLMs提供了关键的上下文信息,极大地提升了其在知识密集型任务上的表现。RAG作为一种增强手段,已在众多实际应用场景中广泛运用,涵盖知识问答、推荐系统、客户服务以及个人助手等领域。RAG技术的发展可归结为三个阶段:•起初,检索增强技术被引入,提升预训练语言模型在知识密集型任务上的表现。比如:Retro通过检索增强优化了预训练...
大语言模型论文跟踪
0回复
1169浏览
RAG
系统
微调
我们一起聊聊Google DeepMind推出Gemma 2 技术报告
引言:大规模语言模型的发展与挑战近年来,大规模语言模型(LLMs)在语言理解、生成和推理方面展现出了强大的能力。随着模型规模的不断扩大,新的能力也逐渐显现。最新的大型模型不仅在推理基准测试上达到了前所未有的性能,还展示了多模态和多语言的能力,甚至能处理超过1M个令牌的上下文长度。尽管小规模模型的性能也在迅速提升,这些提升主要来自于增加训练长度。然而,这种方法与数据集大小的增长呈对数关系,最新的小型模...
AI论文解读
0回复
1378浏览
LLMs
Gemma 2
模型
未来的智能战场——多智能体系统的防御与生存之道
多智能体系统(MultiAgentSystems,MAS)近年来在各类任务中展现出卓越的能力,尤其是在代码生成、数学问题解决、翻译和文本评估等领域。通过多个专家智能体的协作,这些系统能够将复杂任务分解为更小的子任务,由各个智能体分别处理,从而提高整体效率和准确性。然而随着多智能体系统的广泛应用,其安全性问题也日益凸显。特别是当系统中存在恶意智能体时,这些智能体可能会生成错误或不相关的结果,进而破坏整个系统的协作效果...
xuxiangda
0回复
1402浏览
多智能体
系统
错误率
比OpenAI的Whisper快50%,最新开源语音模型
生成式AI初创公司aiOla在官网开源了最新语音模型WhisperMedusa,推理效率比OpenAI开源的Whisper快50%。aiOla在Whisper的架构之上进行了修改采用了“多头注意力”机制的并行计算方法,允许模型在每个推理步骤中预测多个token,同时不会损失性能和识别准确率。开源地址:https:github.comaiolalabwhispermedusahuggingface:https:huggingface.coaiolawhispermedusav1传统的Transformer架构在生成序列时,是遵循逐个token的顺序预...
Aceryt
0回复
674浏览
模型
开源
斯坦福、Salesforce等开源1万亿tokens多模态数据集
华盛顿大学、斯坦福大学、Salesforce等研究人员联合开源了多模态数据集MINT1T。据悉,MINT1T共包含了大约1万亿个文本标记和34亿张图像,是现有开源多模态数据集的10倍,同时还首次从ArXiv网站中爬取了专业论文,进一步提升了数据质量。这对于开源领域开发GPT4o、Gemini等多模态模型,提供了全面、多元化的数据集。开源地址:https:github.commlfoundationsMINT1TMINT1T数据集包含了多种来源,其中,HTML文档的主要来源于CommonC...
Aceryt
0回复
653浏览
数据
模型
AI界的新宠:揭秘Llama 3.1如何革新AI合成技术
精华
合成数据技术并不是创造全新的信息,而是通过转换现有信息来生成不同的变体。在过去的十多年里,合成数据技术已被广泛应用于提升各类模型的精确度——无论是通过变换图像来优化物体检测模型,还是加强信用卡欺诈检测,亦或是提升BERT模型在自动问答方面的表现。随着大型语言模型(LLMs)的出现,生成合成数据的动力和技术都得到了极大的加强。各行各业的企业正在利用合成数据来微调基础LLMs,以满足各种应用场景的需求,比如:金...
ermulong
0回复
872浏览
AI
合成技术
Llama 3.1
暂无内容
1
81
82
83
84
85
86
87
88
89
客服