51CTO内容精选
LV.9
官方
汇聚51CTO网站AIGC方向的优秀原创和译文内容
声望 3052
关注 0
粉丝 5
私信
主帖 201
回帖
Meta发布的BLT架构为大模型扩展找到又一条出路,也开启了用patch方法取代token的全新可能性。开篇先提问:我们为什么非得把文本拆分成token?直接用原始字节怎么就不行?要回答这个问题,我们得先从大语言模型的文本处理方式入手。它们需要用关于常用词块的规则将文本拆分成一个个token,而这个标记化过程也一直面临质疑。无论模型的其余部分在训练期间如何学习和适应,标记化阶段的初始规则都始终保持不变。因此一旦相关语言的...
6h前 65浏览 0点赞 0回复 0收藏
本文将和你探讨量子扩展的基本概念,它在机器学习中的优势,以及我们将如何从中获益。现如今,机器学习的速度比以往任何时候都快得多,也能够解决那些曾被认为完全无法解决的问题。将来,在量子计算潜力的驱动下,人工智能(AI)模型会越来越大、越来越强,甚至会超越我们对其训练的工具。说到模型训练,其计算和能源的消耗成本日趋高启。GPT4及其继任者的大规模训练所消耗的电力已与一个城市相当。此外,据报道,OpenAI的GPT3...
1天前 193浏览 0点赞 0回复 0收藏
本文首先探索当前热门的大语言模型推理框架llama.cpp的内部架构,然后使用此框架实现了一个基本形式的聊天程序。简介当前,llama.cpp框架以其简单性被业界广泛采用,彻底改变了LLM推理领域。它支持企业和个人开发人员能够在从SBC到多GPU集群的各类型设备上部署机器学习大型语言模型。尽管llama.cpp的语言绑定方式使其使用方式变得容易,但是对于性能敏感或资源受限的情况,使用CC++编程方案可能是一个更为可行的选择。本文旨在...
2天前 87浏览 0点赞 0回复 0收藏
推荐系统自1992年基于用户的协同过滤算法诞生以来,经历了一波又一波的革新大潮,发展至今,已经形成了一套体系完善,理论严密的技术领域。随着越来越多的基于深度学习的推荐系统模型诞生,该领域关于准确率的追求似乎已经不再吸引人们的眼球。相反,越来越多的人开始关注其他热点技术,比如大模型算法。2023年,来自澳大利亚RMIT大学的YueqingXuan等研究人员在arXiv上公布了一篇题为MoreIsLess:WhenDoRecommendersUnderperform...
5天前 177浏览 0点赞 0回复 0收藏
AI 运维的新时代:从 MLOps 到 LLMOps深度解析
原创
头条 社区头条
热门内容榜 • TOP2
摘要文章围绕LLMOps(大语言模型运维)展开,详细解析了企业如何使用大语言模型(LLMs),以及LLMOps在优化LLM开发、部署和管理中的核心作用。文章首先介绍了提示词工程(PromptEngineering)、检索增强生成(RAG)和微调(Finetuning)等常见LLM应用场景,并深入探讨了这些方法的挑战和局限性。随后,通过对比MLOps和LLMOps,突出了后者在管理复杂模型生命周期中的独特价值。文章还列举了Agenta、Deeplake、MLflow、Dify和Heli...
6天前 423浏览 0点赞 0回复 0收藏
图数据库的剪枝通过删除不必要的信息并加以改进,可以使LLM更快、更高效,同时节省电力和资源。大型语言模型(LLM)通过从庞大的数据集中学习复杂的语言模式,极大地推进了自然语言处理(NLP)的发展。然而,当这些模型与结构化知识图谱(用于表示实体之间关系的数据库)结合在一起时,可能面临一些挑战。知识图谱在提供结构化知识方面非常有用,可以增强LLM对特定领域的理解。随着图谱的不断扩大,它们往往会变得庞大笨重,从...
7天前 253浏览 0点赞 0回复 0收藏
本文介绍了语音控制前端应用程序的自然语言处理(NLP)方法,以及语音识别、自然语言理解(NLU)等方面的最新进展。由于智能设备、虚拟助手和免提界面的日益普及,语音控制前端应用程序获得了更多的关注。自然语言处理(NLP)是这些系统的核心,能够实现类似人类的理解和语音生成。本白皮书介绍了语音控制前端应用程序的NLP方法的深入研究,阐述了语音识别、自然语言理解和生成技术的最新技术,以及它们在现代Web前端中的架构集...
8天前 341浏览 0点赞 0回复 0收藏
本文使用基于阿里通义千问团队开源Qwen2.57BInstruct大模型的代码代理开发一个本地多代理RAG系统的完整过程。引言大型语言模型已经展现出令人印象深刻的能力,并且随着每一代新模型的发布,它们仍在稳步改进。例如,聊天机器人和自动摘要器等应用程序可以直接利用LLM的语言能力,因为这些LLM只要求生成文本输出——这也是该类模型的自然设置。此外,大型语言模型还表现出了理解和解决复杂任务的令人印象深刻的能力,但是只要它...
9天前 260浏览 0点赞 0回复 0收藏
Suno将使用其AI技能根据你对音乐的特定流派和主题的描述来创作歌曲。你可能已经使用生成式AI来创建文本、图像甚至视频,但有没有用它来创作自己的音乐呢?几种不同的文本转音乐工具可以充当虚拟作曲家,不过值得一试的此类工具是Suno。通过专门的iPhone和安卓应用程序以及微软Copilot插件,Suno可以在网上使用,根据你的输入来创作和播放音乐。你可以描述想要的音乐的主题和风格,选择添加歌词和人声,把你的歌曲作为纯音乐或器...
2025-01-10 07:48:32 408浏览 0点赞 0回复 0收藏
RAG和知识图谱集成可以释放出更大的潜力,实现更深入的理解、推理和准确性。在当今信息驱动的时代,数据是企业、研究人员和个人的重要资源。然而,这些数据通常分散在跨系统的孤岛中,它们是非结构化的,并且无法进行有效的分析。挑战不仅在于拥有大量数据,还在于以有意义的方式理解这些数据。检索增强生成(retrievalaugmentedGeneration,RAG)是一种结合了信息检索和自然语言生成的优势来提取和合成知识的技术。RAG系统从外...
2025-01-09 10:48:30 436浏览 0点赞 0回复 1收藏
AI的兴起极大地影响了编码和开发领域。AI驱动的代码生成器有助于简化编码过程,自动化日常任务,甚至预测和建议代码片段。下面,我们将介绍一些好用的AI代码生成器,包括它们的独特功能,以及它们如何彻底改变你的编程体验。1、​​GitHubCopilot​​GitHubCopilot由GitHub与OpenAI合作开发,代表了AI编程辅助的新水平。这个工具的功能就像一个虚拟的结对程序员,帮助开发人员以更快的速度编写更好的代码。它通过在你键入时提示...
2025-01-08 07:58:05 713浏览 0点赞 0回复 0收藏
摘要TAG(TableAugmentedGeneration)模型通过结合关系型数据库的精准计算能力和大语言模型的语义推理能力,为复杂的自然语言查询提供了高效解决方案。TAG的核心流程分为查询合成、查询执行和答案生成三步,能够灵活处理多数据源的交互式查询任务。通过引入语言模型,TAG不仅可以执行传统SQL查询,还能在情感分析、趋势总结等语义推理任务中展现卓越性能。本文详细解析了TAG的功能和机制,同时引入LOTUS系统作为其具体实现,展...
2025-01-07 08:12:05 475浏览 0点赞 0回复 0收藏
有没有想过机器是如何识别人脸表情或分类物体的?答案在于支持向量机(SVM)。我们在这篇博文中将通过一个分步骤的项目来探究其工作原理。在介绍该项目之前,不妨简要介绍一下SVM。支持向量机支持向量机(SVM)可能听起来像一个复杂的术语,但它却是机器学习领域一种简单而强大的方法。你可以把它想象成一个智能边界划分者,帮助机器对数据进行分类。无论是分类垃圾邮件、识别人脸还是检测情感,SVM都能找到分离不同类别数据的...
2025-01-06 08:32:45 511浏览 0点赞 0回复 0收藏
别再将LLM当成数据库了
原创
头条 社区头条
本文介绍了为什么批处理范式已过时,它如何阻碍AI应用,以及为什么AI的未来需要一种实时事件流平台。想象一下,你戴着耳机驾驶一辆汽车,每五分钟才更新一次路况信息,而不是持续不断地提供当前位置情况的视频流。过不了多久,你就会撞车。虽然这种类型的批处理在现实世界中并不适用,却是当今许多系统运行的方式。批处理诞生于过时的技术限制,迫使应用程序依赖静态的延迟数据。当计算、内存和存储均有限时,这种方法可能是唯...
2025-01-03 08:09:46 521浏览 0点赞 0回复 0收藏
本文旨在探索DDPG算法如何解决连续动作控制难题,从而进一步提升生物工程领域AI驱动的医疗机器人的强大功能。引言想象一下,你正在手术过程中控制着一台机械臂。此机械臂的离散动作可能有:向上移动向下移动抓取或释放这些都是明确、直接的命令,在简单情况下是易于执行的。但是,如果执行精细的动作,例如:将手臂移动0.5毫米以避免损伤组织施加3N的力以压缩组织或旋转手腕15°以调整切口角度该怎么办呢?在这些情况下,你需要...
2025-01-02 08:20:33 451浏览 0点赞 0回复 0收藏
本文介绍了使用LangGraph减少LLM幻觉的简单技巧。如果你使用过LLM,就知道它们有时会产生幻觉。这意味着它们生成的文本要么毫无意义,要么与输入数据相矛盾。这个常见的问题可能会损害基于LLM的应用程序的可靠性。我们在这篇文章中将探讨一些简单的技巧来降低产生幻觉的可能性。遵循这些技巧,你有望提高AI应用程序的准确性。幻觉有多种类型:内在幻觉:LLM的响应与用户提供的上下文相矛盾。响应在当前上下文中是错误的,而且这...
2024-12-31 07:55:30 368浏览 0点赞 0回复 0收藏
本文将提出一种新的PDF文档自动化处理方案,从而成功处理其中的表格、图像、图形或方程式等对象。引言近年来,自动化文档处理成为ChatGPT革命的最大赢家之一,因为LLM能够在零样本设置中处理广泛的主题和任务,这意味着无需域内标记的训练数据。这使得构建AI驱动的应用程序来处理、解析和自动理解任意文档变得更加容易。虽然使用LLM的简单方法仍然受到非文本上下文(例如图形、图像和表格)的阻碍,但是这正是我们将在本文中尝...
2024-12-30 08:29:42 390浏览 0点赞 0回复 0收藏
如果你正在构建一个检索增强生成(RAG)应用程序,就知道其功能有多强大,前提是当它顺畅运行时。但是语义嵌入模型并不是什么魔法。大多数RAG实现依赖语义相似性作为唯一的检索机制,将每个文档放入到向量数据库中,并对每个查询运用相同的检索逻辑。这种方法适用于简单直观的问题,但常常检索上下文无关(但语义相似)的文档。当精准的查询需要精确的答案时,仅语义相似性就会导致混淆或不正确的响应。问题不在于你的模型,而...
2024-12-27 07:53:14 345浏览 0点赞 0回复 0收藏
摘要本文主要介绍2024年AI领域的发展,并展望2025年AI应用技术的发展趋势。首先,文章回顾了2024年AI技术的迭代与突破,重点涵盖了深度学习、大模型、算法创新和模型进化,尤其是大语言模型和多模态模型的迅猛发展。这些技术创新不仅提升了模型在理解和生成多任务、多模态内容的能力,也推动了AI在多个领域的应用。其次,本文分析了2024年AI应用的落地情况,探讨了AI技术如何在行业中得到实际应用,特别是在医疗、自动驾驶和智...
2024-12-26 08:02:47 1133浏览 0点赞 0回复 0收藏
CFO应该理性拥抱Gen-AI
原创
头条 社区头条
随着生成式人工智能(GenAI)铺天盖地的宣传,首席财务官们(CFO)往往按捺不住内心的焦虑,不得不关注GenAI的采用成本或其近期可能产生的影响。但我相信CFO一定会打破传统惯例,并成为组织内GenAI技术倡导者,原因有以下三个方面:CFO的角色正在从财务管理扩展到战略领导层;金融领域已经出现采用GenAI的商业案例;就像云技术那样,如果完全不采用GenAI可能会导致竞争风险,因为GenAI会很快从“个性品”演变为“必需品”。首席...
2024-12-25 08:01:22 397浏览 0点赞 0回复 0收藏
获得成就
已积累 4.3w 人气
获得 5 个点赞
获得 5 次收藏