51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
WOT技术大会
IT证书
公众号矩阵
移动端
短视频
免费课程
课程排行
直播课
软考学堂
全部课程
厂商认证
IT技术
25年5月软考
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
我的关注
全部帖子
默认
发布时间
热度
原创
精华
热门标签
AI
人工智能
智能体
最新研究提出混合动态剪枝方法,升级Transformer推理效率
精华
自2017年Transformer模型问世以来,它在自然语言处理(NLP)和计算机视觉等领域取得了显著进展。Transformer模型通过其独特的自注意力机制,能够捕捉输入序列中的长程依赖关系,从而在机器翻译、文本分类、问答系统等任务中表现出色。与传统的循环神经网络(RNN)和长短期记忆网络(LSTM)相比,Transformer模型在处理长序列数据时具有更高的效率和准确性。Transformer模型的成功也带来了新的挑战,由于其复杂的计算结构和高内...
xuxiangda
0回复
1256浏览
混合
动态
剪枝
国内八大AI模型无障碍使用,教你如何轻松上手
受限于网络以及产品内测未开放的原因,国内的很多朋友可能对AI大模型早就耳熟能详,但至今却仍没能有机会上手使用一番。但是好消息来了,在接近半年的酝酿后,国内第一批通过审核的AI大模型正式上线,今天我将给大家简要介绍下这八个模型,并在文末附上这八个模型的体验地址(都是国内注册即可使用的哦,快来玩耍起来吧)。首批上线的AI大模型来自八家不同的公司:百度(文心一言)抖音(云雀大模型)智谱AI(GLM大模型)中科院...
ermulong
0回复
1092浏览
AI
模型
研发
如何通过压缩提示降低GPT-4的成本
原创
如果使用得当,LLMLingua可以降低使用高级LLM的成本,并使更广泛的用户和应用程序可以使用LLM。像GPT4和Claude这样的大型语言模型(LLM)可以通过良好的提示工程学习新任务。然而,较长的提示会增加使用这些模型的成本,并且还会减慢它们的运行速度。LLMLingua是微软公司开发的一项新技术,通过消除无关部分来压缩提示。值得注意的是,LLMLingua可以在不影响模型响应质量的情况下将提示的规模压缩高达20倍。如果使用得当,LLMLing...
51CTO内容精选
0回复
1007浏览
GPT-4
LLMLingua
大型语言模型
超越所有NeRF方法!快速和高质量的3D编辑和身份保持新策略:DreamCatalyst
论文链接:https:arxiv.orgpdf2407.11394github链接:https:dreamcatalyst.github.io亮点直击:本文通过将DDS解释为SDEdit过程,提出了一种3D编辑的一般公式,并提出了一种用于快速编辑和质量改进的专门公式。在一般的3D编辑任务中采用了递减时间步采样,这是一种在3D生成任务中常用的加速训练速度的采样算法,解决了以往工作中面临的挑战。首次引入FreeU用于3D编辑,以增强可编辑性,克服重新加权编辑目标公式中固有的权衡。编...
angel
0回复
1276浏览
3D
生成
YYDS!数字人终于实现穿、脱衣自由!上大、腾讯等提出3D服装合成新方法:ClotheDreamer
精华
文章链接:https:arxiv.orgpdf2406.16815项目地址:https:ggxxii.github.ioclothedreamer高保真度的基于文本的3D服装合成对于数字化人物创建是可取的,但也具有挑战性。最近基于扩散的方法,通过评分蒸馏抽样(SDS)实现了新的可能性,但要么与人体紧密耦合,要么难以重复使用。本文引入了ClotheDreamer,这是一种基于3D高斯的方法,用于从文本提示生成可穿戴的、适合生产的3D服装资产。本文提出了一种新颖的表示方法,称为解耦...
angel
0回复
1364浏览
数字人
3D
谷歌发布专用于个人健康的大语言模型PH-LLM
随着智能手表、健身追踪器等可穿戴设备的普及,使得我们能持续监测健康状况,包括睡眠质量、日常活动、心率和血压等。但如何有效利用这些数据,并从中找出一些健康问题,对于普通用户来说却很难。所以,谷歌的研究人员在Gemini模型的基础之上,微调出了专用于个人健康的大语言模型PHLLM。用户通过将健康数据与PHLLM相结合,就能快速获取个性化健康建议、日常疾病问答、健康报告预测等专家级医疗咨询服务。论文地址:https:arxiv...
Aceryt
0回复
894浏览
模型
生成
提升5.69倍,高效RAG上下文压缩方法COCOM
GPT4、Llama等开闭大模型通过预训练的方式将海量数据积累成一个庞大的知识库,再通过文本问答的形式为用户生成各种内容。但这种方法仅局限于训练数据集,为了扩大输出范围允许模型通过检索额外的数据来丰富生成内容,RAG(知识检索增强)成为了必备功能之一。RAG也有一个明显的缺点,就是随着上下文信息量的增加,模型的解码时间显著延长,严重影响用户获取答案的效率。所以,阿姆斯特丹大学、昆士兰大学和NAVER实验室的研究人...
Aceryt
0回复
722浏览
数据
压缩
登顶新SOTA!阿里新开源语音模型Qwen2-Audio ,实测优于 Gemini-1.5-pro,网友:离GPT-4o只差一步
原创
SOTA水准的Qwen2家族又迎来了新成员!阿里云发布并开源语音模型Qwen2Audio。GitHub:https:github.comQwenLMQwen2Audio论文:https:arxiv.orgpdf2407.10759作为大规模的音频语言模型,Qwen2Audio能够接受各种音频信号输入,并执行音频分析或根据语音指令直接进行文字响应。很妙的是,在Qwen2Audio支持的语音聊天(但没有音频输出)和音频分析这两种交互模式之间,模型可以自主判断,并在这两种模式之间智能地切...
51CTO技术栈
0回复
1150浏览
GPT-4o
模态
语音
OpenAI正式打响海外价格战,GPT-4o mini成地表最强小模型,百万tokens仅需60美分
精华
OpenAI于7月19日凌晨推出了一款新品——GPT4omini,立即在科技圈引发热议。这款被誉为"小而精"的AI模型,是GPT4o的精简版本,旨在为用户提供更高性价比的AI体验。OpenAI在7月19日凌晨发布GPT4omini据OpenAI介绍,GPT4omini支持128k、16k输入tokens,包括图像和文本。在定价方面,每百万输入tokens收费15美分(约1.09元人民币),每百万输出tokens收费60美分(约4.36元)。这一价格策略使得GPT4omini比GPT3.5Turbo便宜60%以上,...
InfonityAI智推星
0回复
1002浏览
OpenAI
GPT-4o
模型
如何用ai生成宠物图片?一键实现ai宠物图片创作自由!
如何用ai生成宠物图片?科技创新时代,ai技术的发展,可以说是大大便利了我们的日常生活。现在市面上的很多ai软件,我们在使用的时候,会发现其中的一些功能,甚至可以帮助我们生成图片、视频。那么如何用ai生成宠物图片呢?下面教大家一招。一、如何用ai生成宠物图片1.打开AI小聚:https:www.ii.cnlyseo51cto选择AI绘画功能。2.输入图片的描述词,然后选择图片尺寸、图片的风格。3.点击立即生成,等待AI小聚创作图片。二、ai小...
行走的小非
0回复
1819浏览
AI小聚
AI绘画
AI图片生成
基于Mamba架构的,状态空间音频分类模型AUM
Transformer凭借强大的自注意力机制,成为文本、音频、视频等模型的基础架构之一。但其计算复杂度随着序列长度的增加而呈指数级增长,这在处理长序列数据时会出现严重的效率问题。韩国高等科学技术院的研究人员受最新的Mamba架构启发,开发了首个没有自注意力机制纯粹状态空间的音频分类模型AudioMamba(下面简称“AUM”)。状态空间是Mamba架构的核心功能之一,这是一种用于描述和预测系统状态随时间变化的数学模型,通过维护...
Aceryt
0回复
861浏览
架构
模型
13.11 和 13.8 到底哪个大?超过一半 AI 大模型回答错误,强如 GPT-4O 也翻车了
这个话题主要是由《歌手2024》栏目引发的,孙楠与外国歌手的微小分数差异,引发了网友关于13.8%和13.11%谁大谁小的争论。很多网友给出了自己认为13.11>13.8理由,看似合理,实则漏洞百出。这个小学四年级的知识点,一下子就成为了全民热议的话题。很多网友还举例AI给出的结果也是13.11大,一下子激起我的兴趣,这么简单的问题,AI竟然回答错误了。国内模型测试Kimichat:通义千问:腾讯元宝:文心一言:智谱清言:讯飞星火:商...
wsp_ping
0回复
1534浏览
AI
大模型
GPT-4O
Unstructured专家分享RAG应用中文档分块(Chunking)的最佳实践
近日,MariaKhalusova在Unstructured官方博客分享了有关分块的最佳实践。Unstructured成立于2022年9月,致力于解决自然语言处理(NLP)和大型语言模型(LLM)应用中的数据预处理问题。公司总部位于美国,专注于将非结构化数据转化为LLM可以处理的格式,当下流行的pdf解析库就来自于它们,它们在数据预处理方面拥有非常前沿的技术和经验。分块是文档处理的一个步骤,当各种格式的文档被解析变成文本文档后,接下来就需要对文档进...
Syrupup
0回复
2022浏览
RAG
应用中文
chunking
几何视角下的大语言模型推理
一、结论写在前面论文标题:ReasoninginLargeLanguageModels:AGeometricPerspective论文链接:https:arxiv.orgpdf2407.02678大语言模型在实际应用中的进步关键取决于其推理能力的提升。论文在此介绍了DNN和LLMs几何学的一些方面,特别是展示了由MLP利用其分段线性公式引起的输入空间划分的重要性。DNN的适应性划分在其逼近能力中起着巨大的作用。事实上,与传统的样条相比,MLP在其输入空间中引起的区域是数据依赖的,...
sbf_2000
0回复
681浏览
语言
模型
几何
万字综述:全面梳理 FP8 训练和推理技术
精华
一、背景随着ChatGPT的横空出世,LLMAIGC领域迎来空前的关注,各类大模型如雨后春笋般出现,科技公司对AI算力的需求也呈爆发式增长。在这样的背景下,如何在有限资源内提升模型训练和推理效率成为研究的热点。而在众多的方向中FP8逐渐成为研究热点,FP8的应用落地也是一个极具潜力的方向。FP8的重要性日益凸显,很大程度上得益于NVIDIAHopper架构和AdaLovelace架构对FP8的硬件支持。最新发布的Blackwell架构更是进一步拓展了低...
amei2000go
0回复
4752浏览
FP8
训练
技术
无需代码,使用LangFlow轻松创建LangChain大模型应用
精华
人工智能领域因大型语言模型如ChatGPT的出现而焕然一新。这些模型能模拟人类语言,迅速被广泛采纳。ChatGPT在发布后仅两个月便吸引了1亿用户,彰显了巨大的影响力。要将这些模型的潜力转化为实际应用,需要特定的工具,LangChain和LangFlow正是为此而生。1LangChain:构建智能应用的强大框架LangChain是一个开源的Python工具,为开发者提供了强大的平台,可以将大型语言模型(LLMs)与众多工具和功能无缝对接。LangChain不仅是...
小虎哦哦
0回复
2522浏览
代码
LangFlow
模型
SpreadsheetLLM:微软对Excel编码的“摊膀伏”
原创
精华
1.SpreadsheetLLMExcel的特点是二维数据格式、灵活的布局和多样化的格式选项。微软最近引入了SpreadsheetLLM,开创了一种高效的编码方法,用于释放和优化LLMs在电子表格上的强大理解和推理能力。最初研究人员提出一种包含单元格地址、值和格式的普通序列化方法。但是这种方法受到LLMs上下文长度的约束,为此微软推出了SheetCompressor(下图绿色部分),它是一种创新的编码框架,可以有效地压缩电子表格。左边为文档输入,经过S...
鲁班模锤1
0回复
959浏览
微软
Excel
编码
少或零样本异常检测最新研究跟踪
少或零样本异常检测旨在给定少量几张正常样本或不给定任何样本实现对未见类别的异常检测。该方向的很多研究成果发表在最近一年内,主要得益于视觉语言模型(CLIP)的强大泛化能力。基于视觉语言模型的方法CVPR2023,WinCLIP该方法首次证实视觉语言的基础模型在零样本异常检测任务上仍然保持强的泛化性。该方法首先为正常和异常分别设计了多个文本提示,将该提示表征对和图像表征计算相似度然后以softmax归一化获得图像级的异常得...
angel
0回复
1554浏览
视觉
模型
虚拟试衣&人像合成新SOTA!IMAGDressing-v1:ControlNet和IP-Adapter的最佳拍档
文章链接:https:arxiv.orgpdf2407.12705github链接:https:imagdressing.github.ioDemo试用:https:sf.dictdoc.site亮点直击为商家引入了一项新的虚拟试衣(VD)任务,并设计了一个综合亲和力测量指数(CAMI)用于评估生成图像与参考服装之间的一致性。提出了IMAGDressingv1,其中包括一个用于提取细粒度服装特征的服装UNet和一个带有混合注意力模块的去噪UNet,以平衡服装特征与文本提示控制。在所有评估指标上表现优于其他...
angel
0回复
1486浏览
虚拟
AI
探究大语言模型(LLM)漏洞和安全优秀实践
原创
你可能已听说过LLM强势亮相,至少ChatGPT就是代表。大语言模型(LLM)指语言处理模型。这类模型经过训练,可以执行各种各样的语言任务:翻译、文本生成和问题回答等。有几个LLM家族和架构,最著名的是GPT(生成式预训练Transformer)。每种LLM都有各自的特定功能,但本文侧重介绍LLM普遍固有的安全问题。随着越来越多的公司集成LLM以增强用户体验或简化和加速内部流程,这种类型的集成特有的新漏洞随之出现。我们在本文中将介绍与...
51CTO内容精选
0回复
926浏览
大语言模型
LLM
安全
暂无内容
1
89
90
91
92
93
94
95
96
97
客服