51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
WOT技术大会
IT证书
公众号矩阵
移动端
短视频
免费课程
课程排行
直播课
软考学堂
全部课程
厂商认证
IT技术
25年5月软考
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
我的关注
全部帖子
默认
发布时间
热度
原创
精华
热门标签
DeepSeek
AI
大模型
人类如何通过机器智能增强认知过程和行为
原创
计算逻辑以各种形式出现,就像其他类型的逻辑一样。本文将重点介绍计算逻辑中的溯因逻辑编程(ALP)方法,并将论证ALP代理框架,它将ALP集成到代理的操作周期中,为解释性推理和规范性推理提供了一个具有说服力的模型。ALP代理框架作为一个解释性模型,它以生产系统为例;而作为一种规范性模型,它不仅包括经典逻辑,而且与传统的决策理论相一致。ALP代理框架的双重性性质包括直觉推理和审慎推理,将其归类为双过程理论。与其他...
51CTO内容精选
0回复
732浏览
ALP代理框架
机器智能
解释性模型
FoundTS:时间序列预测基础模型的全面统一测评基准
今天给大家介绍一篇华东师范大学联合丹麦奥尔堡大学和松鼠AI发布的时间序列模型统一评测基准FoundTS,这是一个针对时间序列预测基础模型的基准测评框架,旨在利用不同领域和特征的数据集对不同的时间序列预测基础模型进行全面、公平的测评。该论文在统一评测结果的基础上,分析了现有时序预测基础模型的优缺点,并为基础模型的提升提出一些可行的方向。论文标题:FOUNDTS:COMPREHENSIVEANDUNIFIEDBENCHMARKINGOFFOUNDATIONMODEL...
海因斯DK
0回复
1502浏览
FoundTS
时间序列
模型
超简单!手把手从零构建神经网络
这是网友Sumanth077在网络上的分享整理而成,他手把手教你如何从零开始用Python构建神经网络,过程清晰简洁,非常适合对初学者学习。Sumanth077介绍了一个包含两个层的神经网络结构:一个隐藏层和一个输出层。初始化在初始化阶段,需要设定层的大小、权重和偏置。同时,定义sigmoid激活函数及其导数。以下是相关的代码示例:前向传播前向传播是将输入数据通过神经网络,最终得到预测输出。这一步可是神经网络的心脏哦!反向传播...
Syrupup
0回复
654浏览
神经网络
初始化
前向传播
Bitnet.cpp:微软开源1比特推理框架,CPU跑100B模型
精华
Hi,这里是Aitrainee,欢迎阅读本期新文章。前两天,微软开源了Bitnet.cpp,这是一个重磅消息。简单来说,这意味着你现在可以在CPU上运行像72B甚至更大的超级大模型。原因是这些模型的精度已经降低到1位。Bitnet.cpp是一个超级高效的1位LLM推理框架,你可以在本地设备上以高达六倍的速度运行100B模型,并且能耗降低82.2%。Bitnet.cpp未来还会支持NPU和GPU,它在ARMCPU上能让模型速度提高1.37到5.07倍,同时能耗降低55.4%至70%。...
老蛀虫
0回复
3293浏览
微软
开源
模型
5 个必备的命令行 AI 工具,让你的终端更强大!
人工智能(AI)正在全球范围内改变着各个行业。据预测,美国AI市场将在2032年达到5940亿美元,从2023年开始以19%的复合年增长率增长。这一增长突出了AI在推动创新和效率方面的作用。如果你还没将AI应用到工作流程中,你可能错过了巨大的机会。AI对于保持竞争力至关重要。那些采用AI工具的人将站在技术进步的最前沿。在这篇文章中,我将向你展示5个提高了我工作效率的工具。你不需要是软件开发人员或IT专业人员才能使用这些工具...
丢翅膀的鱼
0回复
1282浏览
AI
工具
OpenAI
微软10大商用智能体一锅出!Agent要重塑办公了!实绩可查:500强企业六成都在用,有公司一年省出5000 万!
原创
精华
出品51CTO技术栈(微信号:blog51cto)智能体元年是不是要来了?前脚Salesforce刚刚发布其Agentforce平台,CEOMarcBenioff还顺便踩了脚微软Copilot是Clippy2.0(微软90年代推出的广受诟病的Office助手)。图片一周的时间,微软就展开了反击,一口气宣布了两个大事!图片首先,CopilotStudio可以自己“捏”Agent了!这项功能将在下个月进行公开预览。其次,微软在Dynamics365中直接重磅推出十个新的商业智能体,用AIAgent赋能销...
51CTO技术栈
0回复
976浏览
微软
智能体
AI
RAG遇上知识冲突,Google祭出终极大招!
论文笔记分享,标题:AstuteRAG:OvercomingImperfectRetrievalAugmentationandKnowledgeConflictsforLargeLanguageModels,来自googlecloud在RAG的时候,再好的recall+rerank+筛选策略,都会出现知识冲突,或query无关的候选知识的情况。文中称这种现象为“不完美检索”。通常,当检索精度不低于20%时,RAG是有帮助的。当检索精度接近0时,带有RAG的模型的表现要比没有RAG的模型差。添加更多的检索段落并不一定导致更好的性能,...
NLP前沿1
0回复
780浏览
RAG
Google
检索
人工智能新高度:GLM-4-Plus,智谱AI打造媲美GPT-4o的基座大模型
在当今人工智能飞速发展的时代,各种先进的大模型不断涌现,为我们的生活和工作带来了前所未有的变革。今天,让我们一同走进智谱AI推出的GLM4Plus大模型,深入了解它的独特魅力和强大功能。一、GLM4Plus简介智谱GLM团队重磅发布了新一代基座大模型——GLM4Plus。作为智谱全自研GLM大模型的全新版本,GLM4Plus充分彰显了智谱AI在通用人工智能领域的深度耕耘,有力地推动了大模型技术的独立自主创新。GLM4Plus是对以往模型持续优...
穿越时空111
0回复
2742浏览
GLM-4-Plus
GPT-4o
模型
我的“七年之痒”-变与不变:从LSTM到RAG、大模型
蓦然回首,从18年开始接触NLP(自然语言处理)开始,已经7年有余。机缘巧合的情形下,让自己和NLP有了第一次邂逅。从未接触NLP相关研究的自己,凭着年轻的热血投递搜狗的实习,那时候“不计后果”,不去考虑是否能行,直接“打火车”从天津到了北京,迎来人生的第一次(实习)面试。犹记得面试官的一个问题,“武汉市长江大桥”有几种分词方式,这个NLP中最典型的问题打开了我的NLP之路,实习的面试不难,当天面完当天又急匆匆...
芝士AI吃鱼
0回复
791浏览
LSTM
RAG
大模型
如何编写出色的生成式AI提示?
原创
生成式人工智能(GenAI)已经成为一种提高生产力和处理日常任务的强大工具。这种工具可以根据收到的输入创建新的内容,包括文本、图像甚至代码。虽然这种工具大有潜力,但有效地发掘它们的力量却需要一种特定的技能,即编写优秀提示的能力。提示是我们赋予AI工具的指令,以指导它们的输出。可以把提示看作是现代版的计算机代码,只不过用自然语言编写。就像传统编程一样,有一些有效和无效的方法来创建提示。不妨探索提示编写之...
51CTO内容精选
0回复
724浏览
人工智能
GenAI
生成式AI
OpenAI新发布的canvas和Claude的Artifacts,哪个更好?
原创
整理言征出品51CTO技术栈(微信号:blog51cto)近日,OpenAI推出了canvas,这是一个可以在ChatGPT中直接编写和编码项目的新界面。许多人想知道它是否比ClaudeSonnet3.5Artifacts更好。答案是否定的。原因也很明显:canvas使用GPT4o,而4o模型的编码并不比ClaudeSonnet3.5好。虽然canvas为开发人员提供了一些很好的功能,例如用户协作和版本控制,但它缺乏代码预览等关键功能。许多人现在都在使用Claude创建他们的第一个应用程序...
51CTO技术栈
0回复
844浏览
OpenAI
canvas
Artifacts
奥特曼野心升级,要做「世界之王」?开发“眼球”给全人类做身份认证,千倍疯狂扩张,数亿人可注册
原创
编辑伊风怎么证明你是人类?或许这不是一个大问题,毕竟你只在网页验证的对话框弹出时,才短暂地感受过“确定自己是真人”的那种荒谬——不过,准备成为AI「世界之王」的奥特曼却不这么想。在他眼中,我们很快就会——或者可能已经——需要一种方法来区分人类与机器。所以,当他的OpenAI公司飞驰在追逐AGI的路上,一路狂踩着油门,高歌猛进的时候。奥特曼的另一家更少为人所知的初创公司,也在琢磨一个同样宏大、甚至更疯狂的AI...
51CTO技术栈
0回复
706浏览
奥特曼
开发
AI
大语言模型中自我发现的苏格拉底方法
原创
今天我们介绍来自普林斯顿NLP组的一篇很有意思的博客,作者提出了大语言模型中自我发现的苏格拉底方法。一、核心内容(一)多智能体协作解决问题(有人类参与)智能体角色分配文中提到在涉及基于大型语言模型的智能体和人类参与的多智能体协作解决问题领域十分引人关注。通过给大型语言模型赋予如“分析员”或“校对员”等不同角色,能够有效利用它们各自的优势,增强整体解决问题的能力。这种角色分配就像是在一个团队中,每个...
AIGC最前线
0回复
1046浏览
大语言模型
一文梳理大语言模型编程框架
原创
大语言模型(LLMs),以及一般的语言模型(LMs),催生了一种新的编程方式,其中“指令”不再是明确的应用程序编程接口(APIs),而是像英语这样的自然语言语句。该领域(一个被称为提示工程的新领域)的专家通过组合特定的关键词、提示格式,甚至认知模型来对他们的语言模型进行编程——或者从语言模型中引出特定行为。过去两年表明,语言模型可以产生广泛的变革性影响,但在无缝集成到更大的程序环境方面存在固有局限。它们对...
AIGC最前线
0回复
734浏览
大语言模型
苹果重磅开源俄罗斯套娃扩散模型!MDM:多任务高分辨率生成又快又好!
文章链接:https:arxiv.orgpdf2310.15111项目链接:https:github.comapplemlmdm亮点直击提出了MatryoshkaDiffusionModels(MDM),通过联合处理多个分辨率的输入,避免了级联或潜在扩散方法的复杂性,并引入了NestedUNet架构,嵌套不同尺度的特征和参数,提升了高分辨率生成的效果。采用了多分辨率损失,显著加速了高分辨率去噪的收敛速度,同时使用渐进式训练策略,从低分辨率开始逐步引入高分辨率内容,实现了训练成本和生成质...
angel
0回复
737浏览
AI
模型
Agent memory大揭秘:记忆从哪儿来?
嘿,大家好!这里是一个专注于AI智能体的频道!今天开始我们来详细看看智能体的大脑——记忆模块的内部,主要从三个方面来扒一扒:记忆从哪儿来,记忆长啥样,以及怎么用记忆。今天我们主要聊聊记忆来源这个话题!首先,我们得明白,记忆对Agent来说,就像是它们的知识库和经验集,能让它们在处理任务时更加得心应手。记忆来源,就是指智能体记忆内容的出处。这里,我们主要关注三种类型的记忆来源:内部任务信息(InsidetrialI...
探索AGI
0回复
1576浏览
Agent
模块
知识库
矛盾之争,AI合成数据可以骗过大模型吗?中山大学联合上海AI Lab提出合成检测基准LOKI
文章链接:https:arxiv.orgpdf2410.09732项目链接:https:opendatalab.github.ioLOKI数据&代码:https:github.comopendatalabLOKI总结速览引入了LOKI基准,以全面评估LMMs在区分合成数据上的表现。LOKI基准的亮点包括:全面模态评估。收集了近期热门合成模型生成的高质量多模态数据,涵盖视频,图像,3D数据,文本,音频等多个模态。异构数据覆盖。数据集中包括28个不同模态的细致分类,包括有专业的卫星,医学等图像,哲学,文...
angel
0回复
871浏览
模型
数据
“左脚踩右脚”提升文生图模型综合能力!清北牛津普林斯顿联合发布IterComp
精华
文章链接:https:arxiv.orgpdf2410.07171项目链接:https:github.comYangLing0818IterComp亮点直击提出了第一个基于奖励控制的迭代组合感知框架IterComp,以全面提升基础扩散模型的组合性。精心挑选了模型库,并开发了一个高质量的组合感知模型偏好数据集,该数据集包含大量图像排序对。使用了新的迭代反馈学习框架,逐步增强奖励模型和基础扩散模型。与之前的SOTA方法进行的大量定性和定量比较表明,本文的方法在组合生成能力...
angel
0回复
1225浏览
图像生成
模型
一文读懂OpenGVLab带来的最新视觉预训练框架
大模型技术论文不断,每个月总会新增上千篇。本专栏精选论文重点解读,主题还是围绕着行业实践和工程量产。若在某个环节出现卡点,可以回到大模型必备腔调或者LLM背后的基础模型重新阅读。而最新科技(Mamba,xLSTM,KAN)则提供了大模型领域最新技术跟踪。若对于具身智能感兴趣的请移步具身智能专栏。技术宅麻烦死磕AI架构设计。当然最重要的是订阅“鲁班模锤”。在过去的十年中,ImageNet预训练的视觉模型显著提高了...
鲁班模锤1
0回复
674浏览
OpenGVLab
预训练
框架
VisRAG:清华大学&面壁智能提出了一种新的RAG思路,效果提升明显
1.为啥要提出VisRAG?检索增强生成(Retrievalaugmentedgeneration,RAG)已经成为解决LLM幻觉和知识更新的经典方案,典型的RAG流程是基于文本的(以下简称TextRAG),以分割后的文本作为检索单元。但是在真实场景中,知识往往以多模态的形式出现,比如教科书、手册等。这些文档中的文本与图像交织在一起。为了从这类数据源中提取文本,通常需要一个解析阶段,这包括布局识别、光学字符识别(OCR)和文本合并等后处理步骤。虽然...
大语言模型论文跟踪
0回复
1126浏览
VisRAG
VLMs
场景
暂无内容
1
67
68
69
70
71
72
73
74
75
客服