企业培训

鸿蒙开发者社区

WOT技术大会

IT证书

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程软考华为认证厂商认证 IT技术 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

AIGC观察者

LV.3

专注核心架构领域知识、AIGC干货总结、技术领域趋势跟踪

帖子 18

声望 213

关注 0

粉丝 1

社区头条作者

私信

关注

主帖 18

回帖

Label Studio 数据标注工具详解

原创

LabelStudio是一个开源的数据标注工具，由HumanSignal（原Heartex）推出，主要用于机器学习和数据科学领域，帮助用户对各种类型的数据进行标注和注释，以生成高质量的训练数据。它支持文本、图像、音频、视频等多种数据类型的标注，适用于自然语言处理、图像识别、语音识别等多种应用场景。LabelStudio的特点在于其灵活性、易用性和强大的功能特性，使其成为研究人员和开发者的首选工具。一、功能特性LabelStudio的主要功能包括...

2024-08-28 07:25:43 3416浏览 0点赞 0回复 0收藏

Easy-RAG 一个适合学习、使用、自主扩展的检索增强生成系统

原创

当今时代，人工智能技术的飞速发展为各行各业带来了革命性的变化。在自然语言处理领域，检索增强生成（RAG）系统因其卓越的性能和广泛的应用前景，正成为研究和应用的热点。今天，我要向您推荐的是一个创新的系统——EasyRAG，它不仅易于学习、使用，还具备自主扩展的能力。希望能让您对RAG能更近一步的了解。一、EasyRAG系统概览EasyRAG是一个开放源代码的检索增强生成(RAG)系统，旨在提供一种简便的方式来学习和使用RAG技术，...

2024-08-21 16:33:57 1900浏览 0点赞 0回复 0收藏

LabelU：一个强大且易用的多模态数据标注工具

原创

LabelU是一款开源的多模态数据标注工具，它支持图像、视频和音频等多种类型的数据标注，适用于机器学习和人工智能领域的数据预处理。LabelU提供了丰富的标注功能，包括但不限于图像分类、目标检测、语义分割、音频转录和视频标注等任务。它通过灵活多样的标注工具和直观的操作界面，大大提升了数据标注工作的效率和质量。同时支持本地部署所有数据本地化保证了数据安全性。在线demo标注工具：https:opendatalab.github.iola...

2024-08-20 09:03:21 4367浏览 1点赞 0回复 0收藏

GPT-X 模型训练优化技术设计分析

原创

GPTX模型作为当前自然语言处理领域的代表性模型之一，其训练效率和性能一直是研究的重点。本文将对GPTX模型训练优化的相关技术进行详细的讲解，包括模型架构、算法优化、模型训练策略、算子优化、并行计算和深度学习加速等方面的内容。一、模型架构GPTX的模型架构基于Transformer，这是一种注意力机制的网络架构，能够处理序列到序列的任务，如机器翻译、文本摘要等。Transformer的核心组件是自注意力机制，它能够捕捉序列中的...

2024-08-13 10:38:27 1141浏览 0点赞 0回复 0收藏

常见几种大语言模型压缩技术分析详解

原创

大型语言模型（LLM）在自然语言处理任务中取得了显著的成功，但同时也面临着模型过大、计算需求过高的问题。为了解决这些问题，模型压缩技术应运而生，旨在减小模型大小、降低计算复杂度并提升运行效率。本文将对LLM压缩技术进行详细的分析，包括剪枝、知识蒸馏和量化等关键技术，并结合实际应用案例进行分析。一、剪枝技术剪枝技术是通过删除不必要或冗余的参数或连接来减小模型大小和复杂度的有效手段。剪枝可以分为非结构化...

2024-08-09 20:26:42 1715浏览 0点赞 0回复 0收藏

打造智能私有知识库：开源工具AnythingLLM全解析及实操指南，RAG企业级解决方案

原创

在数据安全和隐私保护日益受到重视的背景下，私有化部署大模型的需求日益增长。MintplexLabsInc.推出的开源项目AnythingLLM，为个人和企业提供了一种安全、高效且可定制的解决方案。该工具基于RAG（RetrievalAugmentedGeneration）模型，允许用户将本地文档转换为可由大型语言模型（LLM）引用的格式，实现对话式问答和知识管理。一、AnythingLLM的主要功能多用户支持与权限管理：支持多用户同时访问，并可设置不同权限。文档管...

2024-07-15 07:30:21 1.6w浏览 2点赞 1回复 0收藏

生成式AI智能革命至今：人机协同的三种模式与未来软件架构范式演进

随着人工智能技术的飞速发展，人机协同工作模式不断演进。本文将深入探讨嵌入（Embedding）、副驾驶（Copilot）和智能体（Agent）三种模式、未来软件架构范式演进，分析它们如何为不同领域的应用塑造AI的未来。一、嵌入（embedding）模式用户通过与AI进行语言交流，使用提示词来设定目标，然后AI协助用户完成这些目标。例如：普通用户向生成式AI输入提示词创作小说、音乐作品、3D内容等。在这种模式下，AI的作用相当于执行命令...

2024-07-15 07:26:57 7556浏览 0点赞 0回复 0收藏

微软 GraphRAG 与传统 RAG 架构设计精髓

原创

在数据洪流不断涌来的今天，如何高效且精准地从浩瀚的信息海洋中提炼出有价值的资讯，成为了自然语言处理领域待解决的关键问题。传统的检索增强生成（RAG）架构，以其独特的检索与生成结合的方式，在一定程度上满足了这一需求，为信息处理带来了便捷。然而，随着应用场景的复杂化，传统RAG在处理全局性、深层次语义信息上的局限性逐渐显现。正是在这样的背景下，微软创新性地推出了GraphRAG（图的检索增强生成）架构，它不仅保...

2024-07-11 13:33:44 4793浏览 0点赞 0回复 1收藏

RAPTOR 检索树再次进一步提升RAG性能的设计思路

原创

大多数现有方法仅从检索语料库中检索短的连续块，限制了对整个文档上下文的整体理解。RAPTOR（RecursiveAbstractiveProcessingforTreeOrganizedRetrieval）引入了一种新方法，即递归嵌入、聚类和总结文本块，从下往上构建具有不同总结级别的树。在推理时，RAPTOR模型从这棵树中检索，整合不同抽象级别的长文档中的信息。RAPTOR（RecursiveAbstractiveProcessingforTreeOrganizedRetrieval）比传统的检索增强型LM性能与绝对准确...

2024-07-11 13:29:27 2449浏览 0点赞 0回复 0收藏

提升RAG系统性能10条策略建议

原创

在大型语言模型（LLM）时代，检索增强生成（RetrievalAugmentedGeneration,RAG）系统通过结合检索与生成技术，显著提升了LLM的回复内容生成质量。然而，优化RAG系统性能是一个复杂的过程，涉及到数据处理、模型选择、算法优化等多个方面。本文将详细介绍10条策略建议，帮助您深度优化RAG系统的性能表现。数据清理数据质量直接影响RAG系统的性能。在预处理阶段，需要对数据进行彻底的清理和规范化，去除噪声和错误信息，确保数据...

2024-07-10 07:09:36 1555浏览 0点赞 0回复 0收藏

OpenAI在RAG技术上的最佳实践与策略

原创

随着人工智能技术的不断演进，大型语言模型（LLM）的性能优化已成为AI领域的热点问题。OpenAI的技术专家团队分享了他们在检索增强生成（RAG）技术、提示工程和微调方面的最佳实践，为提升模型性能提供了宝贵的经验和策略。一、微调技术的最新进展JohnAllard深入介绍了OpenAI在微调领域的最新进展，包括：函数调用数据的微调：通过特定数据集的微调，优化模型对特定函数调用的理解。持续微调：提供了一种机制，允许模型随着时间...

2024-07-10 07:01:28 2268浏览 0点赞 0回复 0收藏

AI大模型技术的四大核心架构演进之路

原创

随着人工智能技术的飞速发展，大模型技术已经成为AI领域的重要分支。本文将深入探讨四种关键的大模型技术架构：纯粹Prompt提示词法、Agent+FunctionCalling机制、RAG（检索增强生成）以及Finetuning微调技术，揭示它们的特性和应用场景。一、纯粹Prompt提示词法：构建直观交互模式纯粹Prompt提示词法是AI大模型交互的直接形式，它通过模拟自然对话，实现用户与AI的即时互动。核心特性：即时性：AI模型能够迅速响应用户输入，提...

2024-07-10 06:56:16 2083浏览 0点赞 0回复 0收藏

RAG技术性能提升之文档分块策略方案

原创

在人工智能领域，尤其是大型语言模型（LLM）的应用中，检索增强生成（RetrievalAugmentedGeneration,RAG）技术正变得越来越重要。RAG技术通过结合检索和生成能力，为模型提供了丰富的外部知识源，从而生成更准确、更符合上下文的答案。本文将深入探讨RAG技术中的文档分块策略，这些策略对于提高检索效率和生成质量具有决定性作用。一、文档分块策略的重要性文档分块是RAG技术中的关键步骤，它影响着模型对信息的检索和理解。合...

2024-07-09 07:20:43 3480浏览 0点赞 0回复 0收藏

AI技术新前沿本地LLM模型推理训练加速

原创

在自然语言处理（NLP）的广阔天地中，大型语言模型（LLM）以其卓越的文本处理能力，引领着智能应用的新潮流。然而，如何高效、安全地在本地环境中部署和运行这些模型，成为了一个待解决的问题。本文将深入探讨七种主流的本地LLM推理框架，评估它们的性能、特性及应用场景，为您提供全面的技术选型参考。一、HuggingFace的transformers是一个Python库，可以简化本地运行LLM的过程。技术特性：提供超过40种模型架构，支持150多种...

2024-07-09 07:18:48 2018浏览 0点赞 0回复 0收藏

再次提升RAG性能：两种高效的Rerank模型实践指南

原创

在高级RAG应用中，检索后处理环节至关重要。Rerank技术通过重新排序检索出的文档块，确保与用户问题更相关的信息排在前面，从而提高语言模型生成答案的质量。在这个环节中，可以做一些诸如相似度过滤、关键词过滤、chunk内容替换等处理。其中，Rerank（重排序）是一种常见的，也是在RAG应用优化中很常见的一种技术处理环节。本文介绍了两种被广泛认可的Rerank模型：CohereRerank模型和bgererankerlarge模型，并提供了使用指南。...

2024-07-09 07:18:13 1.4w浏览 0点赞 0回复 1收藏

深入理解思维树 (ToT)策略提示词设计

原创精华

Prompt的技巧策略应适应LLM大模型框架进行改进，主要框架包括链式思考、思维树和检索增强生成。本文将深入学习思维树，探讨如何建立解决通用问题的语言模型，并使LLM深思熟虑地解决问题。思维树是进化版的提示策略，引入复杂思维结构，以引导模型生成准确、连贯的输出。一、何为思维树(ToT)想象一下，你正在驾驶一辆汽车，没有地图的情况下如何进入正确的路口，找到最佳的路径？在这样的场景下，思维树就像是一张详细的道路地图...

2024-07-08 07:11:54 4228浏览 0点赞 0回复 0收藏

简化大模型微调门槛：运用Ludwig低代码框架的平台技术实战

原创

在人工智能的璀璨星河中，大型语言模型（LLMs）犹如引领方向的灯塔。但要让这些灯塔照亮特定领域，微调技术成为了关键。今天，我们将深入探索Ludwig框架微调与预训练技术，它们正以革新的方式，重塑AI模型微调的领域。一、Ludwig简介在AI的世界里，简单性和灵活性是构建强大模型的关键。Ludwig作为一个开源的低代码框架，用于构建自定义AI模型，如LLM和其他深度神经网络。让这一过程变得像搭积木一样简单。仓库地址：https:...

2024-07-08 07:09:08 1872浏览 0点赞 0回复 0收藏

AI Agent LangGraph：LangChain - AI新时代的构建者

原创

在探索人工智能的无限可能中，构建智能代理（Agents）已成为技术发展的新前沿。LangChain的最新扩展——LangGraph以其独特的技术架构构建方式，为AI领域的创造带来了前所未有的灵活性和控制力。一、LangGraph的架构之美LangGraph的诞生，不是偶然，它是在LangChain坚实基础上的自然延伸。作为一个扩展库，它与LangChain的现有组件水乳交融，共同绘制了AI发展的新蓝图工作流程：通过精确定义图的节点与边，LangGraph将复杂的基于...

2024-07-08 07:03:26 2191浏览 0点赞 0回复 0收藏

获得成就

已积累 1.6w 人气

获得 3 个点赞

获得 2 次收藏