公众号矩阵

移动端

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

pangguiyu

LV.2

这个用户很懒，还没有个人简介

帖子 28

声望 110

关注 1

粉丝 1

社区头条作者

私信

关注

主帖 29

回帖

今日arXiv最热NLP大模型论文：浙大发布歌曲合成工具Prompt-Singer，歌手性别风格均可控！

本项目测试参考歌声，歌词“风吹来的砂冥冥在哭泣，难道早就预言了分离”：3gt夕小瑶科技说12秒提示词“Iwanttolistentoasongwithamanvoice.”生成的歌声：转换男声夕小瑶科技说12秒提示词“I'minthemoodforasongperformedbyamadamartist.”生成的歌声：转换女声夕小瑶科技说12秒引言：自然语言指令在歌声合成中的新突破在数字音频技术的发展历程中，歌声合成（SingingVoiceSynthesis,SVS）一直是一个充满挑战的领域。随着深度...

2024-04-03 09:44:58 3372浏览 0点赞 0回复 0收藏

华盛顿大学撰文反驳微软，我们无法删除大模型关于哈利波特的记忆

引言：探索记忆消除的界限在人工智能的发展过程中，一个引人入胜的议题是机器学习模型是否能够被训练以忘记其曾经学到的信息。近期，RonenEldan和MarkRussinovich在其研究“谁才是哈利·波特？”[1]中提出了一种创新技术，声称能够从LLMs中“抹去”特定数据集的记忆，尤其是针对《哈利·波特》这样的知名作品。他们的方法引发了业界的广泛关注，并被认为是在LLMs“遗忘”技术领域的一大突破。但是，本文将对Eldan和Russinovich...

2024-04-03 09:33:28 1760浏览 0点赞 0回复 0收藏

一眼假！GPT4V可有效识别DeepFake图像！

精华

引言：AI时代的信息真伪辨识在人工智能迅猛发展的今天，我们面临着前所未有的信息真伪辨识挑战。AI技术，尤其是深度学习模型，已经能够生成极其逼真的图片、音频和视频内容，这些内容被统称为DeepFakes。DeepFakes的出现给信息的可信度和数字媒体的信任带来了严重的挑战。因此，识别DeepFakes成为了媒体取证领域中一个紧迫且关键的任务。这篇论文研究了多模态大语言模型（LLMs）在DeepFakes检测上的作用。通过定性和定量实验，...

2024-04-03 09:10:33 2835浏览 0点赞 0回复 0收藏

今日arXiv最热NLP大模型论文：Github万星！北航发布零代码大模型微调平台LlamaFactory

引言：大语言模型的高效微调及其在多样化任务中的应用在人工智能领域，大语言模型（LLMs）已成为推动技术进步的关键力量。它们在理解和生成自然语言方面展现出了卓越的能力，从而在问答系统、机器翻译、信息提取等多样化任务中发挥着重要作用。然而，要将这些模型适配到特定的下游任务中，通常需要进行微调（finetuning），这是一个资源密集型的过程。高效的微调方法因此成为了研究的热点，旨在减少训练成本，同时保持或提升模...

2024-04-03 08:55:52 2830浏览 0点赞 0回复 0收藏

ChatGPT实体化了！手机变身ChatGPT实体机器人，只需一个配件，能说话还会做梦，真的牛！

你有没有想过，如果有一天ChatGPT有了身体，跑到你办公桌上成了你的宠物，这是个多么有趣的场景，LOOI就是这样一款把幻想带进现实的产品不得不说，ChatGPT让具身智能达到了新高度，LOOI便应运而生。LOOI是什么LOOI是一个集成了ChatGPT为大脑的智能桌面机器人，你可以叫它为ˈluːi，类似于英美口音中的“Louie”（路易）。它可以理解复杂的指令，与人类顺畅地沟通。它还能通过视觉模块感知周围的一切，他会想要了解你在做什么，...

2024-04-03 08:47:25 2551浏览 0点赞 0回复 0收藏

OpenAI 推出语音引擎，只需15秒样本，即能重建任何人的声音

OpenAI又带来了一项超酷的进展！周五推出了一项名为VoiceEngine的语音引擎，仅凭一段15秒的声音样本，便能够精准模仿出那个人的声音。VoiceEngine的独特之处在于，它能通过简单的文本输入和短短音频样本，创造出非常接近原始说话者的自然声音。这意味着无论你让它读什么语言的文字，都能以那个人独有的声音风格朗读，效果既逼真又充满感情。总而言之，OpenAI通过这项新技术展示了人工智能复制人声的惊人可能性，接下来让我们一...

2024-04-03 08:32:17 1313浏览 0点赞 0回复 0收藏

震惊！AI生成真人视频毫无瑕疵，台词随意变！HeyGen硬核升级数字人

2024年3月21日，HeyGen5.0正式发布！这款革命性的AIGC产品将AI数字人的魔力融入视频创作，以其简洁易用的特性，让视频制作变得轻而易举。只需几次点击，即可打造出令人惊叹的高品质视频作品！不仅如此，HeyGen支持超过40种语言和多种口音，每一个数字人都是语言大师！如此惊艳！HeyGen5.0生成的数字人不仅可以保持口型同步，克隆语音语调，保留背景声，还能精准的识别和追踪用户的身体动作，如手部移动和手势！让我们看看下面的...

2024-04-03 08:16:36 2556浏览 0点赞 0回复 0收藏

今日arXiv最热NLP大模型论文：天津大学发布大模型数学能力细粒度评价基准FineMath

引言：大语言模型数学能力评估的重要性数学能力的评估对于理解和发展大语言模型（LLMs）至关重要。数学问题不仅涉及对数字的理解和操作，还包括了抽象概念化、逻辑推理等核心能力的考察。因此，一个高质量的数学评估基准对于全面评估LLMs的能力具有重大意义。传统的数学问题数据集，如AddSub和MultiArith（下图），提供了基础的数学词汇问题库，但这些通常只能评估模型在特定数学问题上的准确性。随着中文LLMs的迅速发展，相应...

2024-04-03 08:11:32 2562浏览 0点赞 0回复 0收藏

集体出走的Stability AI 发布全新代码大模型，3B以下性能最优，超越Code Llama和DeepSeek-Coder

StabilityAI又有新动作！程序员又有危机了？3月26日，StabilityAI推出了先进的代码语言模型StableCodeInstruct3B，该模型是在StableCode3B的基础上进行指令调优的CodeLM。StabilityAI表示，StableCodeInstruct3B在代码完成准确性、对自然语言指令的理解以及处理多种编程语言方面都优于同类模型，在3B规模下提供最先进的性能，并且性能媲美Codellama7BInstruct以及DeepSeekCoderInstruct1.3B先让我们来感受一下StableCodeInstruc...

2024-04-03 08:08:05 3081浏览 0点赞 0回复 0收藏

大模型与数据分析：探索Text-to-SQL

当今大模型如此火热，作为一名数据同学，持续在关注LLM是如何应用在数据分析中的，也关注到很多公司推出了AI数智助手的产品，比如火山引擎数智平台VeDI—AI助手、KyligenceCopilotAI数智助理、ThoughtSpot等，通过接入人工智能大模型，提升数据处理和查询分析的效率。智能数据分析助手，采用对话式分析技术，每个普通人都可以与数据进行随时随地的实时交互，根据用户的使用反馈，不断学习，自我迭代找到答案，并在团队内分享对...

2024-04-01 16:24:52 5645浏览 0点赞 0回复 0收藏

手动实现一个扩散模型DDPM

扩散模型是目前大部分AIGC生图模型的基座，其本质是用神经网络学习从高斯噪声逐步恢复图像的过程，本文用python代码从零开始构建了一个简单的扩散模型。一、理论部分DDPM(DenoisingDiffusionProbabilisticModels)是一种在生成对抗网络等技术的基础上发展起来的新型概率模型去噪扩散模型，与其他生成模型（如归一化流、GANs或VAEs）相比并不是那么复杂，DDPM由两部分组成：一个固定的前向传播的过程，它会逐渐将高斯噪声添加到图...

2024-04-01 15:44:23 4176浏览 1点赞 0回复 1收藏

AIGC在天猫商品海报生成上的探索

灵感艺术家项目，旨在通过AIGC绘图能力，联合商家打造低门槛+高趣味性的宣传海报设计大赛，本文分享我们的方案和优化方向。建议对AIGC感兴趣的工程、算法方向的同学阅读。一、项目背景灵感艺术家项目，旨在通过AIGC绘图能力，联合商家打造低门槛+高趣味性的宣传海报设计大赛，为新品进行宣传和造势。同时也是为了给消费者提供参与新品宣发的通道。二、目标拆解GPT部分采用通义千问大语言模型，详见其技术文档。本文重点介绍海报...

2024-03-28 15:30:57 2825浏览 0点赞 0回复 0收藏

大模型应用实践：AIGC探索之旅

随着OpenAI推出ChatGPT，AIGC迎来了前所未有的发展机遇。大模型技术已经不仅仅是技术趋势，而是深刻地塑造着我们交流、工作和思考的方式。本文介绍了笔者理解的大模型和AIGC的密切联系，从历史沿革到实际应用案例，再到面临的技术挑战和伦理监管问题，探讨这一技术浪潮如何引领我们进入一个智能化的未来。一、前言引言：AI时代，未来已来2022.11月30号OpenAI推出ChatGPT后随即爆火，五天注册用户数过百万，2个月用户破1亿，成为...

2024-03-28 15:19:20 4225浏览 0点赞 0回复 0收藏

如何在淘宝人生2一键定制你的专属3D数字人

捏脸玩法是装扮类应用的一个核心功能。本文主要介绍了捏脸的AI相关玩法之一即基于用户上传的照片在淘宝人生2（又名：第二人生）一键生成专属3D数字人，阐述了淘天FC淘宝人生技术团队在图片捏脸上探索的心路历程，核心原理以及技术框架。本文的视角也不局限于图片捏脸本身，也介绍了其他AI类相关玩法在装扮类应用落地的情况，希望能对大家有所启发和帮助。一、背景淘宝人生是国内用户规模较大的装扮类应用之一，在淘宝中扮演了用...

2024-03-28 14:33:29 3300浏览 0点赞 0回复 0收藏

基于参考物体的AIGC图像生成技术在家居导购领域的应用

本文深入探讨了基于参考物体的人工智能图像生成（AIGC）技术的最新进展。首先概述了该类技术如何发展至今，然后着重分析了两篇重要的相关学术论文。随后，文章针对家居导购领域的特殊应用场景，讨论了运用此项技术时遭遇的挑战和取得的最新效果。一、引言随着AIGC技术的快速发展，其中以StableDiffusion模型为代表的的文生图技术已经在内容生成领域产生了应用价值，用户只需要提供一段文本输入，就能通过AI模型快速生成大量美...

2024-03-28 14:15:58 1208浏览 0点赞 0回复 0收藏

什么样才算好图——从生图模型质量度量方法看模型能力的发展

本文总结了近10年来的生图模型论文中用到的评价指标，并尝试解答两个问题不同时期的评价标准都有哪些特点？图片质量的评价如何辅助模型的迭代？一、前言随着各种文生图模型逐渐从toyproject进入到生产链路，在线上实际落地并产生业务价值，同时自研来源模型也进入了快速迭代的阶段。一套直指问题、综合拓展性和复用性的评价指标变得尤为宝贵，从效果上来讲，如果说数据质量决定了模型效果的上限，那么指标的好坏直接决定了模...

2024-03-28 14:10:44 4629浏览 0点赞 0回复 0收藏

AIGC图像技术在淘宝人生2的探索和应用

淘宝人生2（又名：第二人生）是淘宝的一个虚拟人装扮类应用，承担了用户在淘宝的第二个人生的作用。我们旨在通过AI为淘宝人生2的用户提供丰富有趣的可玩性内容，随着最近火热的AIGC技术的发展，我们也进行了相关尝试和落地，目前已经上线了AI拍照风格化、AI写真馆、AI服饰涂鸦等项目。本文主要以AI服饰涂鸦为例介绍我们在AIGC图像领域的探索和应用，希望能够对大家有所启发和帮助，也欢迎大家建议和合作。一、项目背景为了能够...

2024-03-28 13:29:40 4632浏览 0点赞 0回复 0收藏

52个AIGC视频生成算法模型介绍

基于Diffusion模型的AIGC生成算法日益火热，其中文生图，图生图等图像生成技术普遍成熟，很多算法从业者开始从事视频生成算法的研究和开发，原因是视频生成领域相对空白。一、AIGC视频算法发展现状从2023年开始，AIGC+视频的新算法层出不穷，其中最直接的是把图像方面的成果引入视频领域，并结合时序信息去生成具有连续性的视频。随着Sora的出现，视频生成的效果又再次上升了一个台阶，因此有必要将去年一年到现在的视频领域进...

2024-03-28 13:20:37 4089浏览 0点赞 0回复 0收藏

今日arXiv最热大模型论文：清华把大模型用于城市规划，回龙观和大红门地区成研究对象

引言：参与式城市规划的新篇章随着城市化的不断推进，传统的城市规划方法面临着越来越多的挑战。这些方法往往需要大量的时间和人力，且严重依赖于经验丰富的城市规划师。为了应对这些挑战，参与式城市规划应运而生，它强调不同利益相关者，包括官员、专业人士、开发商、当地居民和公众的积极参与。这种包容性的方法旨在通过精心设计的程序、讨论、小组会议或研讨会，将多样化的视角纳入规划和决策过程中。然而，参与式规划的传...

2024-03-28 12:56:24 1954浏览 0点赞 0回复 0收藏

今日arXiv最热大模型论文：超越LoRA，北京大学提出预训练模型非梯度优化法

引言：探索大型语言模型中低秩适应的新方法在自然语言处理领域，大语言模型（LLMs）的迅猛发展带来了前所未有的性能提升。然而，随之而来的是模型参数数量的激增，这不仅导致了调优成本的线性增长，也给在常规硬件上进行微调带来了挑战。为了解决这一问题，研究者们提出了一系列参数高效的调优方法，如LoRA，它们通过只调整模型中一小部分参数来实现与全参数微调相当的性能。尽管这些方法能够降低约30%的GPU内存需求，但仍需要...

2024-03-28 12:51:45 1701浏览 0点赞 0回复 0收藏

获得成就

已积累 1.8w 人气

获得 1 个点赞

获得 2 次收藏