51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
WOT技术大会
IT证书
公众号矩阵
移动端
短视频
免费课程
课程排行
直播课
软考学堂
全部课程
厂商认证
IT技术
24年11月软考
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
首页
/
社区头条
社区头条
545
篇优秀内容
2024年11月
下一个十年,互联网将是什么样?雷军、周鸿祎、张朝阳、吴泳铭这些巨头大佬都释放了哪些信号?
原创
出品51CTO技术栈(微信号:blog51cto)11月20日,一年一度的世界互联网大会乌镇峰会拉开帷幕,今年乌镇峰会已经来到了第11个年头,可以说乌镇也开启了一个新纪元。前来赴会的主角自然还是国内知名的互联网厂商,阿里、腾讯、三六零、小米、知乎、蚂蚁、寒武纪等,雷军、周鸿祎、张朝阳、吴泳铭、周源等一众互联网大佬齐聚浙江。想要了解未来中国互联网未来的发展走向,这些大佬们的观点不得不知。1.雷军预告端到端智驾:无需高...
51CTO技术栈
1h前
0回复
12浏览
互联网
周鸿祎
雷军
图解DSPy:Prompt的时代终结者?!
DSPy是一种编程模型,旨在改进语言模型(LM)在复杂任务中的使用方式。传统上,LM使用特定的提示模板(Prompt)进行控制,这些模板是基本前期大量的尝试而找到的预设指令。DSPy通过将LM流水线抽象为文本转化图谱,例如被其他申明模块触发的LM的命令计算图谱。1.PromptEngineering要理解DSPy,需要先理解提示词工程PromptEngineering。提示词工程也称之为上下文提示词或者上下文学习。它指的是在不更新模型权重的情况下引导LLM的...
鲁班模锤1
2天前
0回复
126浏览
DSPy
Prompt
大模型
多模态语言模型实战之音乐转录
原创
本文将以实战方式探讨基于Spotify公司的开源音乐大模型Llark并联合阿里巴巴的语音多模态大模型Qwen2AudioQwen2Audio将音乐转录成乐谱的完整过程。自动音乐转录是将MP3和WAV等音频文件转换为乐谱、吉他指法谱以及音乐家可能想要用乐器学习歌曲的任何格式的过程。本文中,我们将介绍目前用于执行上述操作的最佳工具,这些工具恰好是基于深度学习的,并采用了一种新颖的方法。当前最先进的技术这项任务的当前最先进的技术来自M...
51CTO内容精选
11h前
0回复
61浏览
语音多模态大模型
SOTA模型
Llark
GraphRAG与传统RAG怎么选?二者的融合方案是什么
原创
最近工作比较忙,一直在重构公司现有的RAG推荐系统。在给GraphRAG提交了几个PR并成功合并后,暂时没有继续对GraphRAG做出更多贡献。然而,最近同事和粉丝纷纷私信我,他们最常问的问题有:"什么时候应该使用GraphRAG?","在哪些场景下应该使用传统的RAG"以及"我们目前在公司使用的是传统RAG,那要如何与GraphRAG相结合呢?"。为了系统地解答这些问题,我决定写一篇文章,对这些问题进行详细的探讨。我将先从多个方面解释Grap...
水晶花雨_32
2天前
0回复
205浏览
GraphRAG
RAG
微软、Anthropic正在拉满大模型的情绪价值
原创
编辑星璇出品51CTO技术栈(微信号:blog51cto)再过3天,ChatGPT就要迎来它的第二个生日了,GPT推出也已经6年了。到目前为止,大型语言模型(LLM)一直在有效发展。它们真实、敏捷且足智多谋。甚至可以说它们在检索信息方面接近完美。但是作为“信息传递工具”,又如何呢?在最近接受ReidHoffman采访时,MicrosoftAI首席执行官MustafaSuleyman表示:“AI研究人员通常倾向于忽视信息传递工具的重要性。考虑到理解和响应人类情感...
51CTO技术栈
1天前
0回复
107浏览
微软
Anthropic
ChatGPT
多模态大模型能力评测基准全面综述:理解、推理、生成、应用、趋势
精华
随着人工智能的快速发展,多模态大型语言模型(MLLMs)已经成为理解视觉数据和语言上下文的关键技术。这些模型能够处理和生成结合文本、图像和其他模态的内容,但如何有效评估它们的性能一直是个挑战。本文通过全面回顾现有的多模态基准测试,为研究人员提供了评估MLLMs性能的工具和方法,这对于推动人工智能技术的发展具有重要意义。多模态大型语言模型(MLLMs)的快速发展为人工智能带来了重大进步,显著增强了理解和生成多模...
十一月雨_55
4天前
0回复
580浏览
多模态
大模型
生成
LangChain-RAG必备:向量数据库如何CRUD
今天我将带领大家,以最为基础的CRUD入手来看看向量数据库应该如何使用。考虑到目前市面上的向量数据库众多,每个数据库的操作方式也无统一标准。「本文将基于LangChain提供的VectorStore类中的统一操作方法,以chroma向量数据库作为示例进行演示。」向量数据库新增LangChain的VectorStore类是一个通用的向量数据库的接口,它可以对接不同的底层向量数据库,如chroma、faiss、annoy等,实现统一的操作方法和API。VectorStore类...
ermulong
3天前
0回复
174浏览
LangChain
CRUD
数据库
解密心智理论:从人类社会到人工智能的集体智慧提升之路
精华
集体智慧(CollectiveIntelligence,CI)在许多领域都扮演着至关重要的角色。无论是在经济学、进化理论,还是在神经网络和社会性昆虫的研究中,集体智慧都展现出了其广泛的应用前景。在经济学中,市场行为往往可以被视为一种集体智慧的表现,个体的决策汇聚成市场的集体行为,这种现象在信息传播、价格形成等方面尤为明显。在进化理论中,集体智慧则体现在物种的协同进化过程中,例如蚂蚁和蜜蜂的群体行为,这些社会性昆虫通过...
xuxiangda
3天前
0回复
280浏览
人工智能
优化群体
系统
深入理解预训练与微调,为什么需要预训练,什么是微调?
原创
“大模型需要先经过模型设计和实现,然后再进行预训练获得通用能力,最后通过微调强化能力”在上一篇文章中介绍了预训练为什么要使用无监督学习,并简单介绍了预训练与微调;而在之前的文章中也讲过什么是训练和微调,而现在再回头看看发现之前的理解还是太肤浅了。所以,今天我们就来深入理解一下预训练与微调。大模型预训练与微调在之前学习大模型训练和微调的过程中,一直认为预训练就是使用大规模数据训练一个新模型的过...
AI探索时代
4天前
0回复
461浏览
微调
无监督学习
Gemini Exp 1114:有史以来最好的大模型!击败 o1-Preview + Claude 3.5 Sonnet!
GoogleDeepMind的最新版本GeminiExp1114,在ChatbotArena上取得了重要成就,凭借超过6000个社区投票,跃升至总榜第1,并在多个领域表现出色:总排名:3>1数学:3>1难题解答:4>1创意写作:2>1视觉识别:2>1编程:5>3首先,我们要理解LLMArena是什么。LLMArena(或称聊天机器人竞技场)是一个评估LLM的平台,主要目标是促进社区驱动的LLM性能评估。它是最有声望的评估平台之一。从总榜来看,谷歌新模型Gemini(Exp1114)分数直涨...
老蛀虫
4天前
0回复
237浏览
模型
Claude 3.5
LLM
多模态大模型能力评测基准全面综述:理解、推理、生成、应用、趋势
精华
随着人工智能的快速发展,多模态大型语言模型(MLLMs)已经成为理解视觉数据和语言上下文的关键技术。这些模型能够处理和生成结合文本、图像和其他模态的内容,但如何有效评估它们的性能一直是个挑战。本文通过全面回顾现有的多模态基准测试,为研究人员提供了评估MLLMs性能的工具和方法,这对于推动人工智能技术的发展具有重要意义。多模态大型语言模型(MLLMs)的快速发展为人工智能带来了重大进步,显著增强了理解和生成多模...
十一月雨_55
4天前
0回复
580浏览
多模态
大模型
生成
RAG 或 Fine Tume - 为您的用例选择正确方法的权威指南
序幕随着对大型语言模型(LLMs)的兴趣激增,许多开发人员和组织正忙于构建应用程序,以利用他们的力量。但是,当预训练LLMs的开箱即用没有按预期或希望执行时,关于如何提高LLM应用程序性能的问题就来了。最终,我们到了问自己的地步:我们应该使用检索增强生成(RAG)还是模型微调来改善结果?在深入研究之前,让我们揭开这两种方法的神秘面纱:RAG:这种方法将检索(或搜索)的能力集成到文本生成中LLM。它结合了一个检索器...
sulu637
7天前
0回复
197浏览
RAG
权威
LLMs
AI存储:存储系统在优化AI训练中的关键作用
精华
数据加载过程与性能优化数据加载的复杂性数据加载并不仅限于从存储读取数据,它涵盖了解码、格式转换及数据增强等预处理环节。这些步骤通常在CPU上执行,目的是将原始数据转换为GPU可处理的张量格式。数据加载的步骤数据加载流程可以概括为:从存储系统读取数据到系统内存。解码原始数据。应用数据变换和增强操作(如裁剪、尺寸调整)。将处理后的数据传输至GPU。预取器的作用预取器显著提升数据加载效率,它在模型训练需要...
chengganfei
7天前
0回复
291浏览
AI
存储
系统
GPT - SoVITS 如何凭借零样本、少样本及多语言功能解锁语音合成新高度?
在当今人工智能技术飞速发展的时代,语音合成领域不断涌现出令人瞩目的创新成果。其中,GPTSoVITS作为一款具有重要影响力的语音合成模型,自2024年2月18日发布以来,便受到了广泛关注。它以其独特的功能和优势,为语音合成技术带来了新的突破和可能性,有望在多个领域得到广泛应用,为人们的生活和工作带来更多便利。本文将深入探讨GPTSoVITS的技术特点、应用场景以及相关的技术细节,带您全面了解这一前沿的语音合成技术。一、...
穿越时空111
7天前
0回复
169浏览
GPT
多语言
模型
【RAG】浅看引入智能信息助理提升大模型处理复杂推理任务的潜力-AssisTRAG
原创
AssisTRAG通过集成一个智能信息助手来提升LLMs处理复杂推理任务的能力。该框架由两个主要组件构成:一个冻结的主语言模型和一个可训练的助手语言模型。AssisTRAG与之前的RAG对比1.组件主语言模型(MainLLM):负责根据提供的信息生成答案。这个模型是固定的,不进行训练。助手语言模型(AssistantLLM):负责信息管理,包括记忆管理和知识管理。这个模型是可训练的。可以看出,相比之前的RAG,该框架主要创新点是引入一个Assist...
毛毛雨_11
8天前
0回复
224浏览
RAG
为什么预训练大模型要使用无监督学习的方式?
原创
“预训练一般采用无监督的方式进行,而微调一般采用监督学习的方式进行”说到预训练大模型,首先就要先了解一下pretraining(预训练)和finetuning(微调)。什么是预训练?比如说你想做一个图像识别的大模型,这时你需要使用某种神经网络架构(比如Transformer)来设计一个神经网络,然后通过某种初始化方法对神经网络参数进行初始化。然后,你就可以使用大量的训练数据对模型进行训练,也就是不断的调整其参数;直到损失差不断的降...
AI探索时代
7天前
0回复
215浏览
无监督学习
大模型
Claude 3: 从“聊天高手”到“未来生产力工具”的华丽转身
还记得那个能写诗、会编码,甚至还能陪你聊天的AI模型Claude吗?如今,它带着更强大的能力和更清晰的定位,以Claude3的身份重磅回归,目标直指“未来生产力工具”的宝座。更聪明:Claude3的核心能力提升相比前代版本,Claude3在以下几个方面实现了显著提升:更强大的理解能力:Claude3训练数据集规模更大,涵盖更广泛的领域和语言,使其能够更准确地理解用户的意图,并进行更深入的语义分析。无论是复杂的专业术语,还是充满隐...
丢翅膀的鱼
7天前
0回复
233浏览
Claude 3
生产力
工具
LLM-R:基于RAG和层次化Agent落地案例解析
原创
在这个由智能设备主导的时代,维护工作的重要性愈发凸显,几乎成了生产活动的守护神。想象一下,当一台精密的机器在深夜突发故障,而维护手册却像天书一样难以理解,这时,交互式电子技术手册(IETMs)就像一束温暖的灯塔,指引着维护人员安全渡过难关。面对从图形用户界面(GUIs)到自然语言用户界面(LUIs)的转变,以及复杂逻辑关系的梳理,传统的IETMs显得有些力不从心。为了应对这一挑战,一个革命性的方法——LLMR应运而...
恰似惊鸿
7天前
0回复
181浏览
LLM-R
RAG
Agent
更快、更强、更经济!超越GraphRAG的大模型RAG系统LightRAG开源啦!
原创
在这个信息爆炸的时代,我们每天都被大量的数据和信息所包围。对于企业和研究人员来说,如何从这海量的信息中迅速地找到自己需要的针对性数据,已经成为了一个亟待解决的问题。幸运的是,香港大学的研究团队最近推出的LightRAG系统,为我们提供了一个新的解决方案。LightRAG系统是基于RAG(RetrievalAugmentedGeneration)的开源技术,它通过引入先进的双层检索范式和基于图的数据结构,大大提升了信息检索的全面性和效率。更...
水晶花雨_32
8天前
0回复
326浏览
RAG
LLM
知识图谱
【LLM】一文详解MHA、GQA、MQA原理
原创
前言本文回顾一下MHA、GQA、MQA,详细解读下MHA、GQA、MQA这三种常见注意力机制的原理。图1MHA、GQA、MQA一览selfattentionselfattention在自注意力机制中,输入通常是一个统一的输入矩阵,而这个矩阵后续会通过乘以不同的权重矩阵来转换成三个不同的向量集合:查询向量Q、键向量K和值向量V。这三组向量是通过线性变换方式生成:1.查询向量(Q):QXWQ2.键向量(K):KXWK3.值向量(V):VXWVWQ,WK和WV是可学习的权重矩阵,分别对应于查...
毛毛雨_11
8天前
0回复
336浏览
大语言模型
自然语言处理
1
2
3
4
5
6
7
8
9
10
28
客服