ermulong
LV.3
这个用户很懒,还没有个人简介
声望 389
关注 0
粉丝 0
私信
主帖 50
回帖
你好啊,我是小智,今天我将详细解析Hammer模型如何通过函数名和参数名的修改,数倍提升模型在FunctionCalling任务中的准确性。改名提升模型性能,看似玄学也有依据简洁命名的模糊性在大多数编程语言中,函数名和参数名都是对功能的抽象表达。通常情况下,简洁的命名规则便于代码阅读与理解,但当这些简洁的命名被直接作为模型输入时,可能会导致一定程度的模糊性。例如,假设我们有一个名为getdata的函数,该函数可能用于从数...
5天前 132浏览 0点赞 0回复 0收藏
一、什么是Prompt调优?Prompt调优,顾名思义,是通过调整输入给模型的提示词(Prompt),来引导模型生成更为准确、连贯或符合预期的输出。随着大语言模型如GPT系列的出现,Prompt的设计成为了提高模型效果的重要工具。在面试中,解释Prompt调优的第一步是确保面试官理解你为什么要调优,即你遇到了什么问题。二、案例实战从问题出发在构建AI系统时,最初的版本往往会暴露出模型的局限性。以下是阿里云团队发布的客服系统回答质...
9天前 278浏览 0点赞 0回复 0收藏
本文将深入探讨如何为functioncalling任务生成高质量的微调数据,并通过具体例子和实战步骤带领读者逐步理解这一技术核心。大型语言模型在函数调用中的关键能力在functioncalling微调过程中,模型需要掌握以下关键能力:准确的API选择:识别并选择最合适的API执行用户的查询。这要求模型具备强大的理解能力,能够分析用户的自然语言意图,并从多个可选的API中匹配到最相关的一个或多个。精确的参数映射:将用户的自然语言输入映...
2024-12-04 12:07:20 207浏览 0点赞 0回复 0收藏
本篇文章将循序渐进地介绍智能体记忆的概念、类型、更新方式以及其实际应用。通过具体的例子,帮助读者深入了解智能体记忆系统的设计与实现,尤其是如何在实际应用中为智能体添加记忆功能。记忆与存储的区别在日常的编程任务中,存储和记忆经常被混淆。为了更好地理解智能体记忆的工作原理,我们首先需要区分“存储”和“记忆”的概念。存储:通常指数据的保存与管理。程序通过文件系统、数据库或内存等手段来存储数据。存储是...
2024-11-26 15:05:35 415浏览 0点赞 0回复 0收藏
今天我将带领大家,以最为基础的CRUD入手来看看向量数据库应该如何使用。考虑到目前市面上的向量数据库众多,每个数据库的操作方式也无统一标准。「本文将基于LangChain提供的VectorStore类中的统一操作方法,以chroma向量数据库作为示例进行演示。」向量数据库新增LangChain的VectorStore类是一个通用的向量数据库的接口,它可以对接不同的底层向量数据库,如chroma、faiss、annoy等,实现统一的操作方法和API。VectorStore类...
2024-11-19 14:39:27 510浏览 0点赞 0回复 0收藏
客服助手机器人能够帮助团队更高效地处理日常咨询,但要打造一个能够稳定应对各种任务且不会让用户感到烦恼的机器人并非易事。完成本教程后,你不仅会拥有一个功能完备的机器人,还将深入理解LangGraph的核心理念和架构设计。这些知识将帮助你在其他人工智能项目中运用相似的设计模式。由于内容较多,本文将由浅入深,分四个阶段进行讲解,每个阶段都将打造出一个具备以上描述所有能力的机器人。但受限于LLM的能力,初期阶段的...
2024-11-13 14:40:25 538浏览 0点赞 0回复 0收藏
你是否曾经想过,当你在使用ChatGPT这样的AI模型时,你输入的文字是如何影响模型的输出的?你是否知道,有一些特殊的文字,可以像咒语一样,引导模型发挥出最大的能力,甚至让它做出你想不到的事情?你是否想了解,如何与模型有效地沟通,让它成为你的得力助手,而不是你的对手?如果你对这些问题感兴趣,那么本文就是为你准备的。本文将从浅到深,揭示ChatGPT提示词背后的本质,让你了解AI提示词的实用技巧和原则,以及提示词...
2024-11-06 14:23:56 542浏览 0点赞 0回复 0收藏
RAG面临的挑战和问题在当前AI的落地应用中,最火热的应用首推检索增强生成(RetrievalAugmentedGeneration)。它的目的是根据用户的问题,从一个大规模的文档集合中检索出相关的文档,并从中抽取出最合适的答案。RAG的应用场景非常广泛,例如智能客服、知识图谱构建、对话系统等。然而,幻觉是笼罩在RAG应用上,挥之不去的乌云。一般来说RAG会经历,原始数据向量化>语义搜索数据召回>大模型整合输出。RAG因此也面临着一些挑战和...
2024-10-31 14:32:31 575浏览 0点赞 0回复 0收藏
什么是Transformer?Transformer是一种新颖的神经网络架构,它在2017年由Google的研究人员提出,用于解决机器翻译等自然语言处理的任务。Transformer的特点是,它完全摒弃了传统的循环神经网络(RNN)和卷积神经网络(CNN),而是采用了一种称为自注意力机制(SelfAttention)的方法,来捕捉文本中的长距离依赖关系,提高了模型的效率和准确性。今天本文将围绕自注意力机制,介绍Transformer的三个主要概念,位置编码、注意力机...
2024-10-25 14:29:49 314浏览 0点赞 0回复 0收藏
随着AI应用工程的飞速发展,我们不难发现为大语言模型(LLMs)提供额外工具能大大增强其功能。举例来说,GPT3.5版本通过集成Bing搜索和Python解释器实现了能力的跃迁。GPTs则直接将api调用作为工具进行了集成,LLM会决定是直接作出回应,还是先调用它提供的工具。这些工具不仅限于获取额外信息,它们还能发挥其他功能,比如帮用户订餐。尽管OpenAI已经用它的专门模型让我们享受了工具使用的便捷,大多数其他LLM在函数调用和工具...
2024-10-23 10:55:40 394浏览 0点赞 0回复 0收藏
图检索增强生成(GraphRAG)正逐渐流行起来,成为传统向量搜索方法的有力补充。这种方法利用图数据库的结构化特性,将数据以节点和关系的形式组织起来,从而增强检索信息的深度和上下文关联性。示例知识图谱图在表示和存储多样化且相互关联的信息方面具有天然优势,能够轻松捕捉不同数据类型间的复杂关系和属性。而向量数据库在处理这类结构化信息时则显得力不从心,它们更擅长通过高维向量处理非结构化数据。在RAG应用中,结合...
2024-10-18 14:53:25 544浏览 0点赞 0回复 0收藏
在AI的发展中,大规模语言模型已经取得了令人瞩目的成果,然而,随之而来的是模型质量和不确定性的问题。如何衡量和改进模型的质量,一直是我们面临的一个挑战。为了解决这些问题,我们将在这篇文章中,介绍LangChain框架和TruLens工具,它们将帮助我们评估模型的质量,提高模型质量,并能够用量化的方法对抗不确定。什么是TruLensTruLens是面向神经网络应用的质量评估工具,它可以帮助你使用反馈函数来客观地评估你的基于LLM(...
2024-10-16 15:56:13 507浏览 0点赞 0回复 0收藏
你是否想过,有一天,你可以只给一个主题,让AI自动搜集资料并写出一本电子书?你是否想过,有一天,你可以不用动笔,就能成为畅销书作者?你是否想过,有一天,你可以利用AI的智慧和创造力,轻松赚取被动收入?如果你的答案是肯定的,那么恭喜你,你的梦想已经成为现实!今天,我要向你介绍一种最新的玩法,它可以让你利用3个ChatGPT插件,实现AI自动写书的神奇功能。这种玩法不仅简单易用,而且效果惊人,你只需要花费很少的...
2024-10-12 14:36:13 538浏览 0点赞 0回复 0收藏
什么是LangChain?LangChain是一个用于开发基于语言模型的应用程序的框架。我们相信,最强大和最有差异化的应用程序不仅会通过API调用语言模型,而且还会:数据感知:将语言模型连接到其他数据源自主:允许语言模型与其环境交互因此,LangChain框架的设计目标是使这些类型的应用程序成为可能。LangChain框架提供了两个主要的价值主张:组件:LangChain提供了与语言模型工作所需的组件的模块化抽象。LangChain还有这些抽象的实现...
2024-09-29 15:46:51 604浏览 0点赞 0回复 0收藏
上次​​《科普神文,一次性讲透AI大模型的核心概念》​​一文中,我基于结合大量示例及可视化的图形手段给大家科普了AI大模型的相关算法和核心概念。但是收到不少非技术背景的小伙伴反馈,相关的算法内容的解释技术性还是太强,很难完全理解。所以这次,题主从最基础的概念“token”着手,跳过了复杂的算法逻辑,这次一定让你建立起对AI大模型工作原理的清晰认知。什么是token?最小的语义单元你可能会好奇,大规模语言模型是...
2024-09-25 12:41:17 835浏览 0点赞 0回复 0收藏
AI最大的想象力不在手机屏幕,而是接管数字世界,改变物理世界AI技术的发展速度已经超越了历史上的任何时期,但目前我们仍处于AGI(人工通用智能)变革的早期阶段。吴泳铭在演讲中提到,AI的真正潜力不在于创造几个新的超级应用,而在于其能够渗透并接管数字世界,最终改变物理世界。AI技术的发展现状技术迭代速度:AI技术,尤其是大模型技术,正在快速迭代,其可用性大幅提升。大模型已经具备了文本、语音、视觉的多模态能力,...
2024-09-23 10:10:22 597浏览 0点赞 0回复 0收藏
引言随着科技公司及国际竞争的不断推进,AI大模型已经越来越多融入我们的生活。作为一个普通人或许不需要研究高深的AI算法,但想在这次AI浪潮中不被抛弃,必须对LLM原理有一个基本的理解。理解LLM(即LargeLanguageModel,大语言模型)如何生成文本也就意味着理解这些模型为什么是如此通用的认知引擎——以及它们还能帮助创造什么。令牌化和向量化(Token&Vectorization)首先,让我们从令牌化和向量化开始,这一部分内容将为大...
2024-09-11 11:24:58 791浏览 0点赞 0回复 0收藏
你好呀,我是小智!相信大家最近一定都被《黑神话:悟空》刷屏了吧。小智作为一个手残党,也被大头虐的死去活来。游戏已经被讲得很多了,所以我们聊点别的。此次我们聚焦在一个特别的故事上——全盲女玩家诺子喵呜挑战《黑神话:悟空》。她依靠实时弹幕指导和听声辨位的方式,成功击败了游戏中的第一个Boss。这一事件不仅引发了社会广泛关注,也提出了一个新的问题:在AI技术日新月异的今天,我们能否利用AI为视障玩家提供更好的...
2024-09-06 14:58:23 687浏览 0点赞 0回复 0收藏
大多数人以为写清楚指令是再简单不过的事情,但其实绝大部分人都无法正确描述自己的想法和意图。这对于使用OpenAI的GPT4这样的强大的语言模型来说,是一个很大的障碍。GPT4是一个可以接受文本和图像输入,输出文本的多模态模型,它可以解决很多困难的问题,比我们之前的任何模型都更准确,这得益于它更广泛的常识和先进的推理能力¹。如果你想让GPT4帮你完成一些创造性或技术性的写作任务,比如写歌、写剧本、或者学习你的写作...
2024-09-04 11:51:19 505浏览 0点赞 0回复 0收藏
正如飞行员、医生、卡车司机和运动员通过在低风险环境中练习技能而提升表现,学生在被赋予探索、犯错并调整策略的机会时,也能更有效地学习。角色扮演情境,即学生扮演特定角色并尝试解决商业问题,提供了丰富的实践机会。这样的情境为学生提供了一个无风险的环境,让他们能够测试自己的知识和练习做出关键决策。然而,市面上现有的角色扮演材料,无论是线上还是纸质的,可能与我们课程的具体学习目标不完全一致,也无法适应不...
2024-08-26 00:44:13 592浏览 0点赞 0回复 0收藏
获得成就
已积累 9392 人气
获得 0 个点赞
获得 0 次收藏