公众号矩阵

移动端

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

zhcs333

LV.3

这个用户很懒，还没有个人简介

帖子 29

声望 263

关注 0

粉丝 0

社区头条作者热门内容榜上榜作者

私信

关注

主帖 29

回帖

身份证识别服务性能优化实践

本文作者为中国移动云能力中心云智团队图像处理算法工程师周华健。身份证识别场景下服务调用量大，往往对于服务的吞吐量要求较高。本文主要从业务逻辑、模型、工程三个层面对身份证识别服务进行优化，取得了较大的性能提升。1.业务逻辑优化一个身份证通常包含了4个模型，身份证检测模型，身份证方向判断模型，身份证文字检测模型，身份证文字识别模型。由于身份证检测与身份证文字检测模型任务类型相似，模型输入图像也可以一致...

2025-03-13 07:05:57 526浏览 0点赞 0回复 0收藏

浅谈国产化AI芯片模型部署实践

社区头条

国产化AI芯片的发展已经成为国内信息技术产业的一个重要领域，它的发展始于对高性能计算需求的崛起，尤其是在人工智能和大数据领域，国内的科研机构和高新技术企业开始投入大量资源用于AI芯片的研发，以满足国内应用的需求。并且随着中国在各个高新领域的不断发力与国外AI芯片技术近年来不断加深的制裁，各个行业的企业也开始合作，以共同推动AI芯片的研发和应用，包括通信、云计算、智能制造、自动驾驶等领域。国内市场对AI芯...

2025-02-28 13:08:32 1139浏览 0点赞 0回复 0收藏

服务器繁忙？动手做：满血版DeepSeek R1+Agentic RAG 构建联网搜索智能体（附源码）

要说当下什么最热，DeepSeek绝对是当仁不让。凭借其强大的语言理解和生成能力，以及免费开放的策略，DeepSeek迅速吸引了大量用户，成为全球关注的焦点。然而，随着用户数量的激增，DeepSeek官网的联网搜索和深度思考功能经常出现“服务器繁忙”的提示，严重影响了用户体验。除了官方，还有办法拥有满血、可联网的DeepSeek吗？答案是肯定的。比如近期移动云就推出了DeepSeek系列模型的免费体验，通过接入云服务商的推理API，用户...

2025-02-20 11:18:07 1993浏览 0点赞 0回复 0收藏

让模型像人一样思考

一、背景2024年9月OpenAI发布的o1preview模型展现出了在解决复杂问题上的强大逻辑思维能力。相比之前传统的Chat类模型，o1类模型在解决问题时会构建出长序列的思维链chainofthought（CoT）进行推理，通过问题拆解、中间步骤验证、思维探索等方法，最终找到问题的正确解答方法。OpenAI对o1模型的介绍中也着重强调了CoT的重要性【1】。类似于人类在回答一个困难问题时可能会思考很长时间，o1在解决问题时也采用了链式思维。通过强...

2025-02-13 12:10:36 937浏览 0点赞 0回复 0收藏

智能体互联网（Agentic Web）

1.引言随着大模型在多模态理解、逻辑推理等方面的进一步发展，Agent或将在2025年迎来大规模落地应用，替代人类自主解决越来越多的日常工作。人工智能（AI）专家普遍认为，2025年将是智能体（agent）爆发之年。2024年底，Gartner也将agenticAI列入了2025年十大技术趋势之一，并预测2028年将至少有15%的日常工作决策由agenticAI自主完成，而这一数字在2024年为0。在CES2025，黄仁勋也强调2025年Agent将会有许多商业化应用。本文从...

2025-02-05 14:22:43 1240浏览 0点赞 0回复 0收藏

人脸识别，你真的了解吗?

社区头条

1.什么是人脸识别？人脸识别技术，是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流，并自动在图像中检测和跟踪人脸，进而对检测到的人脸进行脸部的一系列相关技术，通常也叫做人像识别、面部识别。人脸识别技术主要是通过人脸图像特征的提取与对比来进行的。人脸识别系统将提取的人脸图像的特征数据与数据库中存储的特征模板进行搜索匹配，通过设定一个阈值，当相似度超过...

2025-01-21 12:39:48 1225浏览 0点赞 0回复 0收藏

生成式大语言模型的安全问题

微软“Tay”项目2016年3月，微软发布了一个名为Tay的新项目。微软设计Tay的初衷是为“18至24岁的美国年轻人提供娱乐服务的聊天机器人”。这是一个有趣的名字，代表着早期人工智能实验的轻松尝试。Tay旨在模仿一位19岁的美国女孩的语言模式，并通过与Twitter、Snapchat及其他社交应用上的用户互动来学习。这款聊天机器人是为了进行真实环境下的对话理解研究而开发的。然而，仅在发布几小时后，问题就显现了。TechCrunch评论道：...

2025-01-02 12:09:30 1090浏览 0点赞 0回复 0收藏

分布式框架下的数据处理与模型推理实践

概念Ray是一个开源的高性能分布式计算框架，旨在简化大规模分布式应用的开发和运行。它提供了灵活的任务调度、资源管理以及并行计算能力，使开发者能够轻松实现从单机到多节点的计算扩展。Ray支持多种场景，包括分布式机器学习训练、强化学习、超参数优化、大规模数据处理和实时模型部署等。Ray的核心概念是通过统一的API，使开发者专注于逻辑开发，而不必关心底层的分布式实现细节。通过模块化设计，Ray集成了多个功能强大的库...

2024-12-23 09:25:13 1681浏览 0点赞 0回复 0收藏

910B芯片Swift多模态模型分布式训练实践

一、环境准备1.前置条件首先准备好训练机器和数据，笔者采用了32节点910BNPU，300万网页训练数据。2.环境配置环境安装，首先安装多模态训练框架msswift，安装torchnpu及deepspeed。安装msswift(当前推荐从源码安装,待发版后可直接pip安装)gitclonehttps:github.commodelscopeswift.gitcdswiftpipinstalle'.[llm]'安装torchnpupipinstalltorchnpudecorator安装deepspeedpipinstalldeepspeed完整python依赖版本见文末附录3.环境验...

2024-12-11 10:57:07 2213浏览 0点赞 0回复 0收藏

NLP范式总结 | 拥抱新范式

1.基于传统机器学习的范式（第一范式）在早期的自然语言处理（NLP）研究中，神经网络尚未被引入。在这个时期，NLP处理方法通常需要从自然语言语料库中提取各种特征，例如词性标注、命名实体识别和短语结构分析。然后，使用特定的规则或数学、统计学模型来对提取出的特征进行匹配和应用。例如，可以通过词性标注和短语结构分析提取文本中的关键信息，然后利用数学模型，如隐马尔可夫模型或贝叶斯网络，来执行序列分类和序列标注...

2024-12-03 14:14:10 1097浏览 0点赞 0回复 0收藏

如何进行高效的LLM分布式推理

1.背景这次指的大型语言模型（LLMs）主要说的是采用Transformers架构的模型，该架构在训练阶段具有高度的并行性。然而，在实际应用中，高效地部署这些模型面临一些挑战。这是因为生成推理是逐个token进行的，而每个token的计算都依赖于先前生成的标记。因此，支持大规模训练的模型需要仔细考虑并行布局和内存优化，以实现所需的可扩展性和高效的低延迟推理。从而更好地支持大规模训练的模型在实际应用中实现高效的低延迟推理，...

2024-11-25 15:48:58 1436浏览 0点赞 0回复 0收藏

大模型落地应用指北—大模型能吃吗？

一、大模型概述1.什么是大模型本文的大模型特指的是大规模数据训练得到的预训练模型，对于大模型，2021年8月李飞飞联合100多名专家发布了一份研究报告《OntheOpportunitiesandRiskofFoundationModels》，他们将大模型统一命名为fundationmodel，也可以称之为基石模型，属于深度学习的一种。此外，从命名就可以看出，大模型的研究已经在AI领域形成了里程碑式的影响。那么什么样的模型可以称为大模型，应可以包括3个方面：模型的...

2024-11-05 15:59:11 1368浏览 0点赞 0回复 0收藏

多模态大模型数据分析与实践

精华

数据集是大模型竞争的关键要素之一，AI大模型的突破得益于高质量数据的发展。训练大模型需要大规模、高质量、多模态的数据集，通常需要从各个领域和多个数据源收集数据，这些数据可以是文本、图像、语音、视频等多种形式。大语言模型训练使用的数据集规模爆发式增长。从2018年GPT1数据集约为4.6GB，2020年GPT3数据集达到了753GB，而ChatGPT的数据集为超万亿单词的人类语言数据集（约45TB）。OpenAI并没有公开训练ChatGPT的相关...

2024-09-29 16:43:04 2833浏览 0点赞 0回复 0收藏

AI生态中的云原生组件

1.核心云原生组件容器化技术是云原生的核心，它通过将应用及其依赖项打包到一个轻量级、独立的容器中，确保了应用在不同环境中的一致运行。作为两种主流的容器引擎，Docker和containerd广泛应用于AI模型的开发和部署。Docker提供了简便的容器化工具链，而containerd则作为一个高效、专注的容器运行时，为Kubernetes等平台提供底层支持。容器化AI模型可以在本地开发环境与云端无缝切换，减少环境差异带来的问题。AI应用通常由多...

2024-09-26 15:15:28 1454浏览 0点赞 0回复 0收藏

LLM微调技术调研

ChatGTP、LLaMA2等通用大模型具备优秀的推理性能，但在面对复杂多变的业务场景时，往往难以满足多样化的需求。ChatGPT等通用大模型通常需要经过复杂漫长的训练过程，预训练期间需要巨大的算力和存储消耗，大多场景下从0到1训练一个模型不仅成本高昂，而且没有必要，因此基于预训练的模型并对其进行微调成为有价值的研究方向。微调预训练的通用大模型，不仅可以节约成本，也可以使模型更符合特定领域的需求，变得更定制化、专业...

2024-09-23 11:22:07 1402浏览 0点赞 0回复 0收藏

浅谈视觉Transformer技术

1.标准Transformer经典Transformer模型(如上图所示)，它是由编码器（蓝框）和解码器（绿框）组成，标准VisionTransformer(ViT)[2]主要应用了其中的编码器,编码器模块主要由一个MultiHeadSelfAttention(MHA)和一个MultilayerPerceptron(MLP)组成。2.视觉Transformer标准Transformer编码器的输入是一维embedding，为了能将该编码器应用于图像任务，将尺寸为(H,W,C)的图像切分成尺寸为(P,P,C)的图像块，一共得到个图像块，reshape...

2024-09-04 12:16:07 1831浏览 0点赞 0回复 0收藏

Kubeflow集成Volcano实现高效AI训练

1.概念Kubeflow是一个机器学习平台，旨在简化ML模型的开发、训练、部署和管理。它提供了一系列工具和组件，包括JupyterNotebook、TFJob、Katib（超参数调优）、KFServing（模型服务）等，使用户可以在Kubernetes集群上轻松运行和管理机器学习工作流。Volcano是一个Kubernetes调度系统，专为批处理、HPC、AI和大数据工作负载设计。它通过提供先进的调度策略、资源公平分配和作业管理功能，优化了资源利用率和任务执行效率。Volca...

2024-08-21 11:25:52 2036浏览 0点赞 0回复 0收藏

TensorRT模型推理加速实践

一、TensorRT简介TensorRT是由C++、CUDA、python三种语言编写成的库，有助于在NVIDIAGPU上进行高性能推理。基于目前主流的深度学习框架得到的模型都可通过TensorRT实现推理加速。图1TensorRT转换过程2021年7月，NVIDIA发布了TensorRT8.0版本，新版本极大提升了Transformers结构的推理新能。TensorRT性能优化主要依赖下面两种方式：1、权重与激活精度校准：在推理中使用FP16或者INT8精度计算，通过降低计算精度，提高计算效率，...

2024-07-18 09:52:56 2982浏览 0点赞 0回复 0收藏

AI编程辅助 | 基于代码生成模型的实践

精华

一、编程辅助例子GitHubCopilot[1]基于OpenAI的Codex[2]模型（GPT3[3]的后代）实现，可以在代码编写的时候实时地提供代码补全建议和注释，并且在多个编辑器的插件市场都可以下载使用。不管是从Copilot官网上的例子，还是在互联网上搜索关于Copilot的使用案例，你都可以发现它比一般的代码补全工具更为先进和灵活，它不仅能补全代码，更能创造代码，通过理解使用者简单的自然语言指令，它能够按照这些指令直接构建代码片段，并且...

2024-07-12 10:47:13 2698浏览 0点赞 0回复 0收藏

AI编程辅助 | 基于代码生成模型的实践

精华

2024-07-11 10:03:58 2738浏览 0点赞 0回复 0收藏

获得成就

已积累 1.2w 人气

获得 0 个点赞

获得 0 次收藏