51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
WOT技术大会
IT证书
公众号矩阵
移动端
短视频
免费课程
课程排行
直播课
软考学堂
全部课程
厂商认证
IT技术
24年11月软考
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
首页
/
社区头条
社区头条
618
篇优秀内容
2024年12月
Y Combinator:垂直领域AI Agent的市场规模将是SaaS的十倍
文字:使用阿里通义效率进行总结,感谢勘误。部分文字内容来源于华尔街见闻,侵权删。播客来源:https:www.ycombinator.comlibraryLtverticalaiagentscouldbe10xbiggerthansaas.在YC最新一期访谈《VerticalAIAgentsCouldBe10XBiggerThanSaaS》中,YC四位资深投资人Gary、Jared、Harj和Diana从SaaS行业的发展历程出发,结合了大量实例,深度分析了为何垂直领域AI代理将成为下一个创业风口。随着AI模型不断快速改进并相互竞争,一...
AIGC新知
2天前
0回复
470浏览
AI
Agent
SaaS
一文彻底搞懂机器学习 - K均值(K-Means)
原创
K均值(KMeans)是一种无监督的聚类算法,广泛应用于数据挖掘、图像分割、基因表达数据分析等领域。KMeans算法旨在将n个数据点划分为k个聚类,使得每个数据点都属于与其最近的聚类中心所代表的聚类。每个聚类都有一个质心(即聚类中心),这些质心最小化了其内部数据点与质心之间的距离。KMeans一、无监督学习无监督学习(UnsupervisedLearning)是什么?无监督学习是从未标记的数据中发现隐藏的模式、结构和关系的机器学习技术...
架构师带你玩转AI
2天前
0回复
254浏览
机器学习
LLM合集:微软开源新一代视频token化方法VidTok,打造高性能视频Token化解决方案
1.VidTok:AVersatileandOpenSourceVideoTokenizer将视频内容编码为紧凑的潜在token已经成为视频生成和理解中的一个基本步骤,这是为了应对像素级表示中固有的冗余问题。因此,随着以视频为中心的研究日益重要,对高性能、开源视频token化工具的需求也在不断增长。我们推出了VidTok,这是一种多功能的视频Tokenizer,在连续和离散token化方面都提供了最先进的性能。VidTok相较于现有方法引入了几个关键改进:模型架构方面采用了...
AIPaperDaily
2天前
0回复
100浏览
LLM
Token
高性能
人工智能预测,全球大部分地区的气温将比之前预期的上升速度快得多,达到 3°C
“欧米伽未来研究所”关注科技未来发展趋势,研究人类向欧米伽点演化过程中面临的重大机遇与挑战。将不定期推荐和发布世界范围重要科技研究进展和未来趋势研究。三位顶尖气候科学家结合了10种全球气候模型的观点,并在人工智能(AI)的帮助下得出结论,区域变暖阈值可能比之前估计的更快达到。近期研究发表在IOP出版社出版的《环境研究快报》上,预测到2040年早些时候,政府间气候变化专门委员会(IPCC)规定的大多数地区可能会超...
欧米伽未来研究所
2天前
0回复
238浏览
人工智能
预测
技术
推进可解释性自然语言生成(NLG):技术、挑战和应用
原创
结合XAI技术可以帮助开发人员改进模型,发现偏差,并确保可靠和公平的NLG应用程序。自然语言生成(NLG)是从会话代理到内容创建等应用程序的核心。尽管取得了进步,但NLG系统经常像“黑匣子”一样运行,让开发人员和用户对其决策过程摸不着头脑。可解释性人工智能(XAI)通过使NLG模型更具可解释性和可控性有效地弥补了这一缺口。本文探讨了增强NLG系统透明度的实用技术和工具,提供了详细的代码片段和逐步的解释,以指导开发...
51CTO内容精选
2天前
0回复
174浏览
人工智能
自然语言生成
NLG
一文彻底搞懂机器学习 - 随机森林(Random Forest)
原创
随机森林是机器学习中的一种集成学习方法,通过构建多个引入随机性的决策树来进行分类或回归预测,以提高模型的准确性和泛化能力。随机森林集成多个决策树,每个决策树基于自助采样数据集构建,分裂时随机选特征,最后投票(分类)或平均(回归)整合预测,提升准确性与泛化力。RandomForest一、集成学习集成学习(EnsembleLearning)是什么?集成学习是一种机器学习技术,它通过将多个学习器的预测结果进行组合,以提高整体的...
架构师带你玩转AI
3天前
0回复
468浏览
机器学习
手把手教你如何用扣子(COZE)打造一个企业级的知识库机器人
什么是AI大模型(LLM)?大型语言模型(如GPT4或BERT)是基于深度学习的模型,它们通过分析大量文本数据学习语言的统计规律,从而能够完成翻译、摘要、对话等多种语言任务。这些模型通常没有特定的目标或任务,而是根据输入的文本生成相关的输出。什么是AIAgent?AIAgent是指可以自主执行任务或目标的系统,它可以是软件,也可以是智能机器。这些系统通过感知环境并在此基础上做出决策。AIAgent集成了多种技术,包括AI大模型(L...
风云2002_1
3天前
0回复
214浏览
机器人
AI
COZE
推进医疗人工智能:评估 OpenAI 的 o1-Preview 模型并优化推理策略
原创
01、概述近年来,人工智能在医疗领域的应用迎来了新的突破。传统上,高性能的专业领域模型需要大量的领域特定预训练,例如PubMedBERT和BioGPT。然而,随着GPT4等通用大模型的崛起,这一模式正在被打破。尤其是像Medprompt这样的运行时引导策略(runtimesteering),在无需重新训练模型的情况下,就能让通用模型在特定领域内达到媲美甚至超越专业模型的表现。本文将带你深入了解Medprompt及其背后的运行机制,同时揭示OpenAI最新...
Halo咯咯
3天前
0回复
187浏览
医疗人工智能
OpenAI
大模型
10.1k高星 GitHub 库:告别JSON错误:Outlines如何提升大模型的结构化输出
在人工智能和大语言模型(LLM)的应用中,如何高效、可靠地从模型输出中提取结构化数据,成为了一个至关重要的课题。本篇文章将介绍GitHub高星开源库Outlines,并分析它如何帮助开发者解决大模型在生成结构化数据时面临的挑战。我们将探讨大模型的非结构化输出给AI应用带来的问题、结构化输出的好处,以及Outlines如何有效地提升模型的可靠性和性能。在这里插入图片描述1.大模型的非结构化输出带来的问题1.1问题大语言模型(LLM...
凝固的雨_1
3天前
0回复
236浏览
JSON
大模型
结构化
马斯克明显是个恶霸!不会完全放弃非营利性质!奥特曼罕见采访曝猛料:马斯克喜欢到处干架
原创
编辑伊风出品51CTO技术栈(微信号:blog51cto)震惊了!家人们。在马斯克今天第四次诉讼OpenAI,阻止后者向盈利公司转型时。昨天,在外媒TheFreePress的采访中,奥特曼突然一改口风!在采访中犀利攻击马斯克“是个恶霸,而且很喜欢与人发生冲突("clearlyabully"wholikestopickfightswithpeople)”、“在推特上表现得很糟糕”。对于被马斯克记恨上了这件事,奥特曼的应对显得无奈又幽默,他说“过去他与贝索斯、盖茨、扎克伯格...
51CTO技术栈
2天前
0回复
138浏览
马斯克
马斯克
AI
谷歌再次反打OpenAI!
原创
出品51CTO技术栈(微信号:blog51cto)大洋彼岸马上就要“过年”了,OpenAI和谷歌都在抢着在年前秀一秀自己压箱底的AI大作。在通向AGI的道路上,谷歌似乎已经反超了OpenAI,夺回了领先地位。前几天,两家几乎同时发布的Sora但效果上的显著差异,再次让外界看到了谷歌的实力回归。不止视频赛道,Google再次甩出了一个大招。今天凌晨,Google推出Gemini2.0FlashThinking,可以说来了一波反打OpenAIo1。1.谷歌版o1发布,榜上第一皮...
51CTO技术栈
2天前
0回复
100浏览
OpenAI
ChatGPT
Canvas
图像修复和编辑大一统 | 腾讯&北大等联合提出BrushEdit:BrushNet进阶版来了
文章链接:https:arxiv.orgpdf2412.10316项目链接:https:liyaoweistu.github.ioprojectBrushEdit亮点直击提出了BrushEdit,这是先前BrushNet模型的高级迭代版本。BrushEdit通过开创基于修复(inpainting)的图像编辑方法,扩展了可控图像生成的能力。该统一模型支持指令引导的图像编辑和修复,提供了用户友好的、自由形式的、多轮交互编辑体验。通过集成现有的预训练多模态大语言模型和视觉理解模型,BrushEdit显著提高了语言...
angel
4天前
0回复
257浏览
AI
模型
一文看懂:四种多Agent范式哪种最好
精华
MultiAgentLargeLanguageModelsforConversationalTaskSolving在单个大型语言模型多年来主宰人工智能领域的时代,多智能体系统在对话任务解决中崭露头角。此前的研究虽已展现出其在推理任务和创新尝试方面的潜力,但对于其在对话范式方面的局限以及个体智能体的影响,却缺乏分析。多智能体讨论在不同复杂程度任务中的表现怎样,以及这些对话的结构如何影响进程,都尚不明确。为填补这一空缺,本文对各种讨论范式下的多智能体系统...
大语言模型论文跟踪
5天前
0回复
386浏览
Agent
范式
人工智能
ICLR 2025惊现满分论文,ControlNet作者再出佳作
精华
近日,ICLR2025评审结果揭晓,一篇论文脱颖而出,获得了罕见的[10,10,10,10]满分成绩。这篇论文便是ControlNet作者张吕敏的新作ICLight。在平均分仅为4.76的ICLR会议中,满分论文的出现无疑引起了学术界和业界的广泛关注。论文标题:ScalingIntheWildTrainingforDiffusionbasedIlluminationHarmonizationandEditingbyImposingConsistentLightTransport论文链接:https:openreview.netpdfidu1cQYxRI1H项目成果展示在向ICLR投稿前...
AI论文解读
5天前
0回复
357浏览
编辑
模型
性能
实测!最新端侧全模态大模型Megrez-3B-Omni
精华
模型概述Megrez3BOmni是由无问芯穹研发的端侧全模态理解模型,基于无问大语言模型Megrez3BInstruct扩展,同时具备图片、文本、音频三种模态数据的理解分析能力,具体模型参数如下表所示。Megrez3BOmni在并未牺牲模型的文本处理能力的前提下,在三个模态上相较于同等参数模型,均取得较好的效果。图源:https:internvl.github.ioblog20241205InternVL2.5注意:下面的文本、图像、语音评测均基于https:huggingface.cospacesInfini...
NLP工作站
5天前
0回复
540浏览
全模态
大模型
SLMs
一文彻底搞懂机器学习 - Softmax回归(Softmax Regression)
原创
Softmax回归是机器学习中的一种分类算法,特别适用于多分类问题。它是多分类问题的逻辑回归推广,通过线性模型将输入特征映射到类别得分上,并利用Softmax函数将得分转换为概率分布,以实现对多类别数据的分类,同时使用交叉熵损失函数优化模型。SoftmaxRegression一、Softmax回归Softmax回归(SoftmaxRegression)是什么?Softmax回归是一种多分类算法,通过线性模型将输入特征映射到每个类别的得分上,并使用Softmax函数将这...
架构师带你玩转AI
5天前
0回复
267浏览
机器学习
实测来了!Kimi发布k1视觉思考模型,实力颠覆K12教育赛道,涌现能力强得可怕,免费可用!网友:国产之光!
原创
编辑言征出品51CTO技术栈(微信号:blog51cto)Kimi最近太猛了!所有的教育产品感觉都要被颠覆了。今天,Kimi上线发布一款相当炸裂的AI功能——视觉思考模型k1。可以说颠覆了“K12赛道”的传统搜题解题的产品!小编惊呼:有了Kimi,学生们还需要手机里安装各种拍照搜题找答案的软件吗?可以预想到,从幼儿园到大学,整个教育赛道恐怕要掀起一股惊涛骇浪!Kimi,果真越来越“学霸”了!话不多说,直接上干货。光看这个名字“k1”...
51CTO技术栈
6天前
0回复
285浏览
Kimi
模型
token
一文彻底搞懂机器学习 - 决策树(Decision Tree)
原创
决策树(DecisionTree)是一种基础且直观的分类与回归技术,它借鉴了人类的决策过程。该技术通过逐步拆分数据集,并根据特征选择建立规则,从而实现对数据的分类和预测。以下是对决策树的深入解析,内容涵盖其训练与可视化方法、类概率的估计,以及CART(分类与回归树)训练算法等关键方面。DecisionTree一、训练和可视化决策树(DecisionTree)是什么?决策树是一种用于分类和回归任务的监督学习算法。它通过一个树状结构,将...
架构师带你玩转AI
6天前
0回复
679浏览
机器学习
解锁Agentic RAG,使用LangChain和OpenAI进行实践
AgenticRAG技术是一种新兴的智能体驱动解决方案,能够应对复杂的多文档问答挑战。这项技术通过智能化手段,不仅提升了我们处理文本数据的效率,还极大地增强了问答系统的准确性和深度。本文带大家来了解这项技术,阐述其如何提升信息检索和分析的效率与准确性。1AgenticRAG简介AgenticRAG是由智能体驱动的技术,能够灵活处理多文档问答任务。这项技术不仅能比较文档、总结内容,还能对多个摘要进行对比分析。正因如此,我们不完...
小虎哦哦
9天前
0回复
374浏览
Agentic
RAG
OpenAI
商业化大前端在性能优化领域的探索与实践
原创
一、背景介绍1.1页面性能优化的价值与意义在业务迅猛发展的时代,用户体验已成为企业成功的关键因素之一,而页面性能则是塑造用户体验的核心要素。早在十多年前,亚马逊就已经意识到页面加载速度对商业成果的深远影响:亚马逊支付页面每增加100毫秒的延迟,可能减少1%有效转化。页面加载时间的延长和交互操作的不流畅性,不仅会损害用户体验,还可能导致转化率下降和用户流失等后果。在快手商业化团队,我们深知页面性能对提升...
快手技术
9天前
0回复
341浏览
快手
大前端
性能优化
用户体验
商业化
1
2
3
4
5
6
7
8
9
10
31
客服