51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
WOT技术大会
IT证书
公众号矩阵
移动端
短视频
免费课程
课程排行
直播课
软考学堂
全部课程
厂商认证
IT技术
25年5月软考
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
我的关注
全部帖子
默认
发布时间
热度
原创
精华
热门标签
AI
人工智能
模型
经典论文ReAct精读
原创
人类智能的一个独特特征是能够将面向任务的行为与语言推理(或称作内心独白)无缝结合。理论上,这被认为是人类认知中的重要一环,能够实现自我调节或策略化并维持工作记忆。以在厨房烹饪一道菜为例,在任何两个具体行为之间,我们可能会:(1)用语言进行推理以跟踪进度(例如“现在一切都切好了,我应该把水壶里的水加热”);(2)处理异常情况或根据情况调整计划(例如“我没有盐,所以让我用酱油和胡椒代替”);(3)意识...
AIGC最前线
0回复
809浏览
ReAct
大模型技术在AIGC领域所面临的主要问题
原创
“怎么打造出一款具有市场竞争力的AIGC产品?”AIGC——人工智能生成内容,是大模型技术目前的一个主要应用方向,简单来说大模型就像一个擅长某个领域的人,比如绘画,写作,设计等;而这种内容创作的领域就属于AIGC。但AIGC虽然发展得如火如荼,但其还面临着诸多问题。AIGC所面临的问题技术方面AIGC作为一项人工智能技术的应用场景,其技术是第一个需要解决的问题,否则一切都无从谈起。但AIGC在技术方面还面临着很多问题,比...
AI探索时代
0回复
909浏览
大模型
AIGC
从openAI最新模型GPT-o1再谈思维链(Cot)技术,大模型该怎么提升其逻辑推理能力?
原创
“推理能力是大模型迈向AGI的必经之路”最近openAI发布了号称史上最强模型——o1,其具有强大的逻辑推理能力,号称能达到人类的博士生水平。而从o1模型的评测来看,o1模型在数学竞赛,编码,科学问答等方面表现良好,甚至高出了GPT4o一大截。而且,o1在物理,化学,生物,逻辑学等其它领域,相比GPT4o都得到了巨大的提升。而据介绍o1模型之所以具有如此强大的逻辑推理能力,就是因为使用了思维链技术;当然,目前官方并没有公布...
AI探索时代
0回复
2785浏览
大模型
思维链
什么时候需要训练和微调属于自己的大模型——小微企业必须要明白的问题
原创
“从问题出发,先有需求再有解决方案”老板和员工在思维方式上有一个很大的差别就是,作为老板他们喜欢寻找现有的解决方案,如果现有的解决方案无法满足的情况下,才会自己设计一个解决方案。而作为员工来说特别是技术人员,大都有一种技术至上的心态,比如说很多技术人员找工作会特别在乎公司用的技术是否足够牛逼,足够高大上。之所以产生这种现象的原因是因为,技术人员的心态是学会牛逼的技术,走到哪里都不怕。而老板的心...
AI探索时代
0回复
641浏览
大模型
人工智能
麻省理工创新模型:用2D视频扩散,生成 3D 视频
精华
传统的3D视频生成主要有两种方法,一种是通过2D视频模型和静态3D场景模型的分类器指导来优化动态3D视频场景表示,不过这种对算力的需求极大,生成一个3D视频需要数小时;另一种是通过变形初始3D场景表示来实现,但需要严格的时间结构并且需调整复杂的参数。为了解决这些难题,麻省理工、Databricks马赛克科研所和康奈尔大学联合推出了创新模型Vid3D。该模型假设无需明确建模3D时间动态,通过生成2D视频的时序动态轮廓,然后独立...
Aceryt
0回复
1057浏览
3D
视频生成
不要沉迷大模型的技术与理论,学习大模型的方法——从做一个小应用开始
原创
“在应用中学习技术,而不是沉迷于技术本身”不知道大家都是怎么学习大模型技术的,但从个人的经验和公众号的反馈来看,有些人在学习大模型技术时转进了牛角尖,导致很多东西学不明白,事倍功半。今天就从个人的学习历程出发,来讨论一下关于大模型技术的学习方法。学习大模型技术的方法应该跟很多人一样,之所以学习大模型技术是因为大模型技术的爆火,以及大模型技术在未来的发展潜力,更重要的一点是不了解和学习大模型以后...
AI探索时代
0回复
1023浏览
大模型
OpenAI o1引发的思维链思考:思维链提示启发大模型推理
摘要:我们探索了生成一个思维链(一系列中间推理步骤)可以怎样显著提高大型语言模型执行复杂推理的能力。特别是,我们展示了这种推理能力是如何通过一种称为思维链提示的简单方法,在足够大的语言模型中自然出现的,其中提供了一些思维链演示作为提示的示例。在三个大型语言模型上的实验表明,思维链提示可以提高一系列算术、常识和符号推理任务的性能。经验收益可能是惊人的。例如,用只有八个思维链示例来提示PaLM540B在数...
angel
0回复
1142浏览
语言模型
AI
超全两万字长文详解视频扩散模型的最新进展
精华
最近,AIGCer在使用一些视频生成工具,对其中的技术点有了强烈兴趣,正好搜索到了这篇视频扩散模型综述,方法果然浩如烟海,读下来感觉受益良多,分享给大家。人工智能生成内容(AIGC)浪潮在计算机视觉领域取得了巨大成功,扩散模型在这一成就中发挥着关键作用。由于其出色的生成能力,扩散模型逐渐取代了基于GAN和自回归Transformer的方法,在图像生成和编辑以及视频相关研究领域表现出色。然而,现有的调查主要集中在图像生...
angel
0回复
2098浏览
AI
生成
Open-Sora 1.1 解读:完全开源的高效复现类Sora视频生成方案!
项目链接:https:github.comhpcaitechOpenSoraOpenSora1.1是ColossalAI开发的开源视频生成模型的最新迭代,标志着在这个快速发展的领域取得了实质性的飞跃。在其前身OpenSora1.0的基础上,该版本在功能、训练效率和整体灵活性方面进行了显著改进。OpenSora项目是一项致力于高效制作高质量视频,并使所有人都能使用其模型、工具和内容的计划。通过采用开源原则,OpenSora不仅实现了先进视频生成技术的低成本普及,还提供了一个精...
angel
0回复
775浏览
视频生成
技术
使用人工智能增强 IaC以提高下一代基础设施的效率
原创
本文探讨了人工智能正在重塑IaC运营的一些重要领域,并讨论了未来可能会发生的情况。在当今的技术领域中,人工智能(AI)几乎在每个领域都产生了深远的影响。基础设施即代码(IaC)的爱好者一直在探索人工智能如何推动IaC生态系统的下一场变革。正如人们所看到的,人工智能在提升DevOps和平台能力方面发挥着重要作用。而且很明显的是,人工智能将成为未来IaC实践的核心。以下将探讨人工智能正在重塑IaC运营的一些重要领域,并讨...
51CTO内容精选
0回复
604浏览
人工智能
IaC
AI
OpenAI文本嵌入模型入门指南
原创
这篇综合指南介绍了如何使用OpenAI文本嵌入模型在GenAI应用程序中嵌入创建和语义搜索。向量嵌入在AI中至关重要,它可以将复杂的非结构化数据转换成机器可以处理的数值向量。这些嵌入捕获数据中的语义和关系,从而实现更有效的分析和内容生成。ChatGPT的创建者OpenAI提供了各种嵌入模型,这些模型提供高质量的向量表示,可用于包括语义搜索、聚类和异常检测在内的各种应用。这篇指南将探讨如何利用OpenAI的文本嵌入模型来构建响...
51CTO内容精选
0回复
997浏览
OpenAI
ChatGPT
向量嵌入
RAG高级优化:一文看尽Query的转换之路
原创
准确地找到与用户查询最相关的信息是RAG系统成功的关键,如何帮助检索系统提升召回的效果是RAG系统研究的热门方向,之前的文章介绍了在分块阶段的优化方法:RAG高级优化:基于问题生成的文档检索增强。本文将介绍三种query理解的方法,以增强检索增强生成(RAG)系统中的检索过程:查询重写:重新定义查询,使其更加具体和详细。Stepback提示:生成更广泛的查询,以获得更好的上下文检索。子查询分解:将复杂查询分解为更简单的...
恰似惊鸿
0回复
1052浏览
RAG
Query
一款好用的开源工具,高效实现Reranker
原创
Reranker是任何检索架构(RAG、Agent等)的重要组成部分,但它们通常也比PipeLine中其他部分更模糊。有时,甚至很难知道该使用哪一个。每个问题都是不同的,使用X的最佳模型不一定与使用Y的模型相同;新的重新排名方法不断涌现,该如何兼容他们呢?今天介绍一款高效扩展工具rerankers:设计目标新的重新排名方法不断涌现:例如,RankGPT使用LLM对文档进行重新排序,就在去年出现,取得了非常有希望的零样本基准测试结果。所有不同...
恰似惊鸿
0回复
1342浏览
开源工具
Reranker
支持大模型流式输出的JSON提取工具
原创
在我们日常处理大模型的输出时,经常希望输出的结果为结构化的(例如输出json格式),这样有助于我们进行结果的后处理。但是在模型输出超过限制和流式输出时就会遇到问题了,由于答案没完全输出,转json就存在问题。大型语言模型(LLMs)产生结构化输出的原因包括:提高可读性:结构化输出使得信息以一种逻辑清晰、易于理解的方式呈现,提高了信息的可读性和用户体验。便于处理:结构化数据可以更容易地被机器读取和处理,有助于...
恰似惊鸿
0回复
1190浏览
大模型
JSON
RAG高级优化:基于问题生成的文档检索增强
原创
我们将在本文中介绍一种文本增强技术,该技术利用额外的问题生成来改进矢量数据库中的文档检索。通过生成和合并与每个文本片段相关的问题,增强系统标准检索过程,从而增加了找到相关文档的可能性,这些文档可以用作生成式问答的上下文。实现步骤通过用相关问题丰富文本片段,我们的目标是显著提高识别文档中包含用户查询答案的最相关部分的准确性。具体的方案实现一般包含以下步骤:文档解析和文本分块:处理PDF文档并将其划分...
恰似惊鸿
0回复
927浏览
RAG
增强问答文本检索的排序(RAG)模型,你学会了吗?
引言:文本检索在信息检索系统中的重要性文本检索是信息检索系统的核心组成部分,它在搜索引擎、问答系统和推荐系统等多种应用中发挥着至关重要的作用。随着技术的发展,文本检索已经从简单的关键词匹配演变为利用复杂的算法理解和匹配文本的语义。特别是在问答系统中,文本检索技术能够从大量数据中找到与用户查询最相关的信息,这对于提高系统的准确性和用户满意度至关重要。近年来,随着深度学习技术的发展,基于神经网络的...
AI论文解读
0回复
1196浏览
文本检索
排序
RAG
OpenAI发布新模型:o1系列模型,更像理科生的模型
精华
本来今天准备发一篇金融相关的Agent论文结果一大早上,各大群就都开始流传着各种聊天记录原来是凌晨OpenAI发布了新的o1系列模型(以下简称o1模型或o1),所以迫不及待的找了些资料赶紧学习下。图片看上去,这个o1系列模型在数学、编码、科学等一系列理科生擅长的事情上,表现比GPT4还好。目前,各大微信群的讨论大致分为两种观点:•o1太牛逼了,GPT5来了,AGI立马到来!•o1这不就是个Workflow+Agent吗?收集了各方的【小道消...
大语言模型论文跟踪
0回复
1549浏览
OpenAI
模型
o1 系列
在长上下文LLM的时代,RAG是否仍然必要?
一、结论写在前面论文标题:InDefenseofRAGintheEraofLongContextLanguageModels论文链接:https:arxiv.orgpdf2409.01666克服早期生成式大型语言模型(LLMs)的有限上下文限制,检索增强生成(RAG)在过去一直是基于上下文的答案生成的可靠解决方案。最近,长上下文LLMs的出现使得模型能够整合更长的文本序列,使得RAG变得不那么吸引人。最近的研究表明,长上下文LLMs在长上下文应用中显著优于RAG。与现有倾向于长上下...
sbf_2000
0回复
739浏览
LLM
SELF-ROUTE
RAG
知识图谱与大模型的深度结合策略剖析
原创
1、知识图谱与大模型的特点和互补性知识图谱的独特性:知识组织:它由实体及其相互间的联系构成的三元组网络,有效地描绘了知识的框架。数据可信度:知识图谱所包含的信息普遍具有高度的准确性和信赖度。解释性:知识图谱的架构更贴合人类的认知方式,它为知识的解释和逻辑推理提供了途径。大模型的优势:语言理解力:这些模型能够深入理解庞大的文本资料,具备强大的上下文学习及跨领域适应能力。零样本学习能力:在自然语言处...
玄姐聊AGI
0回复
1582浏览
知识图谱
大模型
百度CEO李彦宏就当前业界对大模型的认知误区发表了自己的看法
在近期的一次内部员工交流会上,百度创始人、董事长兼CEO李彦宏就当前业界对大模型的认知误区发表了自己的看法。他的讲话涵盖了大模型竞争、开源模型效率以及智能体趋势等热点话题,引发了广泛关注。李彦宏认为,未来大模型之间的差距可能会越来越大。他指出,大模型的潜力和天花板非常高,目前的发展水平距离理想状态还有很大差距。因此,模型需要不断进行快速迭代、更新和升级。这需要企业能够持续数年乃至十几年如一日地投入资源,...
InfonityAI智推星
0回复
802浏览
百度CEO
模型
李彦宏
暂无内容
1
61
62
63
64
65
66
67
68
69
客服