公众号矩阵

移动端

视频课免费课排行榜短视频直播课软考学堂

全部课程软考华为认证厂商认证 IT技术 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

老蛀虫

LV.3

这个用户很懒，还没有个人简介

帖子 22

声望 288

关注 0

粉丝 1

社区头条作者热门内容榜上榜作者

私信

关注

主帖 23

回帖

A2A + MCP = AI Agent 完全体？AI Agent 既能 “单挑” 工具，又能 “群殴” 任务

精华

社区头条

热门内容榜 • TOP2

Google正式下场定义Agent协作新规矩：Agent2Agent(A2A)开放协议来了。AIAgent单打独斗的时代要过去了？GoogleCloud联合超过50家技术和咨询大佬(包括Cohere,Langchain,MongoDB,等等一票重量级选手)正式推出Agent2Agent(A2A)协议。这玩意儿要干啥？简单说，就是给不同厂商、不同框架下构建的AIAgent提供一套标准的沟通语言和协作方式，打破信息孤岛，让它们能真正“组队打怪”，提升效率。与MCP的关系？A2A与MCP是兼容互补的Googl...

5天前 1748浏览 0点赞 0回复 0收藏

阿里Qwen家族又添猛将！Qwen2.5-Omni能看能听能说能写，性能超越Gemini，视频实时互动

社区头条

Hi，这里是Aitrainee，欢迎阅读本期新文章。阿里Qwen家族添新丁：Qwen2.5Omni，一个真正的“Omni”全能模型。这款新模型号称能看、能听、能说、能写，还能实时响应。文本、图片、音频、视频，一个模型全搞定。自家QwenChat也用上了，还能语音、视频直接聊，跟真人似的。体验地址：https:chat.qwen.ai社区也热赞，虽然也有人说离GPT还差点，但这波开源全能操作确实很顶。更重要的是，团队把Qwen2.5Omni7B开源了，用的A...

2025-03-28 10:07:12 935浏览 0点赞 0回复 0收藏

Mistral杀回来了！Small 3.1开源发布，性能完胜Gemma 3，RTX 4090就能跑

社区头条

Mistral又搞了个“小而美”的狠货：MistralSmall3.1发布并开源：号称“小3.1”，但能力不“小”。多模态、开源Apache2.0协议，关键是性能还杠杠的，直接PK掉Gemma3和GPT4omini。看Benchmark图：横坐标是速度，越小越快；纵坐标是知识，越大越强。MistralSmall3.1，直接霸榜左上角，速度、知识双Buff加持。Mistral官方列出了Small3.1的关键特性和能力：•轻量级：能在RTX4090或32GB内存的Mac上运行，适合本地部署。•快速响应：...

2025-03-18 08:26:13 1545浏览 0点赞 0回复 0收藏

接入 Deepseek 能让百度文库焕发第二春吗？

前段时间比较火的Deepseek+多维表格大家应该都有了解：图片来源机器之心：飞书中的每个表格都相当于一个prompt输入框，你可以把需求和背景当作一列数据粘贴进去，DeepSeekR1就能按这个队列全自动处理了。那么你有没有想过Deepseek（满血版）+画布呢？OpenAI研究主管KarinaNguyen所说，‘我心目中的终极AGI界面是一张空白画布（Canvas）’，它随着人类的偏好不断演变，自我变形，给予用户无限的创作空间和自由度，让交互方式更加...

2025-03-06 09:35:51 1315浏览 0点赞 0回复 0收藏

沸腾了！新的推理模型编码能力爆表！是的，那个王，他又回来了！

精华

圣诞节在二月，Claude扔了个王炸！看来爆料者的信息还挺准的：明天：Claude4没等到，Claude3.7要来了？不是嘛，哈哈哈。Anthropic官方有个毛病，他们通常不会做任何的预发布，大半夜他给你扔出来了个王炸：这次的新模型叫：Claude3.7Sonnet，它带来了一种新的思维方式。它不再把快速回答和深度思考割裂开来，而是像人类大脑一样，在同一个模型中实现两种能力。Claude3.7Sonnet既能快速回答问题，也能在需要时进行深度思考，给用...

2025-02-26 14:08:03 1746浏览 0点赞 0回复 0收藏

Windsurf Wave3：MCP协议让AI直接读取控制台错误，自动化网页调试不用复制粘贴了！Tab智能跳转、Turbo模式

社区头条

Hi，这里是Aitrainee，欢迎阅读本期新文章。就在昨天，Windsurf又推出了一波新版本更新。他们显然把这个批次里面的新版本都称为Wave，这次是Wave3。Wave2的更新：Memories功能很贴心。自动记住对话内容，方便后续引用。想记住什么，随时提醒它。记忆面板里能看到所有内容。可以用命令面板打开，也能删除不要的记忆。这个不花信用点。还有些小更新，修了bug，改进了细节。好了，回到Wave3，官方表示为了沉浸式编码，你可以使用一...

2025-02-18 12:18:12 4184浏览 0点赞 0回复 0收藏

谷歌三款新模型齐发，Gemini-2.0-Pro免费、跑分超o1登顶第一，适合编码、处理复杂提示！

Hi，这里是Aitrainee，欢迎阅读本期新文章。Gemini2.0的故事，正在加速展开。12月的Flash实验版，为开发者带来低延迟、高性能的工作模型。今年初，2.0FlashThinkingExperimental在GoogleAIStudio更新，通过结合Flash的速度和增强的推理能力，进一步提升性能。上周，更新版2.0Flash已在Gemini桌面和移动应用全面上线。今天，三个新成员同时亮相：迄今为止在编码和复杂提示方面表现最佳的模型Gemini2.0Pro实验版，性价比之选2.0Fl...

2025-02-07 14:38:54 1891浏览 0点赞 0回复 0收藏

DeepSeek-R1 + RooCline：极佳的强化学习AI编码代理！对标o1、蒸馏小模型本地部署

Hi，这里是Aitrainee，欢迎阅读本期新文章。DeepseekR1正式发布。不是之前的Light版本，而是完整的R1。性能与o1相当，还采用MIT开源协议，可以商用。现在能在Deepseekchat平台用，也提供API。模型分两个版本：主力R1，和面向研究的R1Zero。R1Zero没有监督微调，直接RL，是一个未经过对话偏好对齐监督微调的版本，专门为研究人员或希望自行微调模型的人提供。正式发布的R1还是用了SFT阶段。R1是671B参数的大模型，激活参数只有37...

2025-01-23 11:11:42 3008浏览 0点赞 0回复 0收藏

OpenAI Agent来了！让 ChatGPT 自动执行你的想法，向代理时代迈出的小小一步！

今天，OpenAI在ChatGPT中推出了名为“Tasks”（任务安排）的新功能。简单理解，就是允许模型在指定时间或周期，主动给我们推送消息或执行预先设定的对话逻辑。比如，每天9点提醒你关注某条新闻，或每周日生成一份“膳食规划”。•功能入口：需要先切换到“GPT4owithscheduledtasks”的对话，再发出“创建任务”请求。•用法示例：1.让ChatGPT每天早上检查股价并发送给你2.每天9点半提醒我锻炼:3.每周发送全球新闻简报，获取每日...

2025-01-15 11:39:13 2198浏览 0点赞 0回复 0收藏

三分钟带你看完Lovable，这款全新的AI全栈APP构建器击败了Bolt吗？

社区头条

Hi，这里是Aitrainee，欢迎阅读本期新文章。以前漏了一个Lovable没说，现在他更新迭代的更好了，我们来讲讲。Hi，这里是Aitrainee，欢迎阅读本期新文章。以前漏了一个Lovable没说，现在他更新迭代的更好了，我们来讲讲。这也是一个AI全栈应用程序构建器。他现在和Bolt一样，除了能够通过自然语言生成全栈Web程序之外，现在也能与Superbase集成《Bolt+Supabase：1分钟实现APP的登陆功能、连接数据库（Bolt、Cursor、BaaS、AI全栈...

2025-01-06 12:16:53 2718浏览 0点赞 0回复 0收藏

ChatGPT实时视频通话功能全量开放，AI终于睁开了"眼睛"

"ChatGPT又崩了……""期末论文怎么办？""工作报告还没写完啊！"这是昨天ChatGPT宕机4小时时，推特上此起彼伏的哀嚎。而就在24小时后，当我第一次通过摄像头与ChatGPT"面对面"时，这种感觉，说实话，有点奇妙。Openai给我们带来了一个重磅更新ChatGPT的实时视频通话功能全量开放了。这个功能最让人惊叹的地方在于它的实时视觉理解能力。ChatGPT不仅能看到你，还能实时理解你的一举一动。比如，你在镜头前展示一道数学题，它能立...

2024-12-26 13:43:43 4829浏览 0点赞 0回复 0收藏

TEN Agent 一键让 Coze Bot 开口说话，这下AI助手终于能跟我聊天了

最近在刷技术社区的时候,发现了一个超级有意思的更新TENAgent悄悄地支持CozeBot了!它可以让CozeBot直接开口说话了！这个消息对我来说是意外之喜。之前我写过一个文章是搭建实时语音助手，用到的实时语音助手官网也是有工作流和知识库支持的，但扣子这个AI智能体平台无疑是当前NO.1。TENAgent与Coze结合是一个很好的选择，落地方向有很多。现在,不需要复杂的代码,不用纠结技术细节,只要简单三步就能搞定。只需要在TENAgent界面输...

2024-12-18 11:04:42 2132浏览 0点赞 0回复 0收藏

Llama 3.1 70B AQLM-PV版发布！大模型压缩后可在24GB显存GPU上本地运行！！

Llama3.170B参数模型无疑是一个非常优秀的模型。不仅是基准测试证明了这一点，现实世界中的应用也毫无疑问地证明了它的表现与封闭源的知名模型相媲美，比如OpenAI的GPT4、Anthropic的Claude和Google的GeminiPro。这也是为什么我看到有许多组织努力将这个70B参数的模型移植到普通GPU上，特别是那些显存为24GB或以下的设备。在这篇文章中，我将向大家展示一个全新的微调模型，叫做MetaLlama3.170BInstruct，使用了AQLM。如果你还...

2024-12-06 08:13:59 2261浏览 0点赞 0回复 0收藏

Aider（已升级）：Aider利用双模型架构做到85% SOTA得分！

Hi，这里是Aitrainee，欢迎阅读本期新文章。令人振奋的是，Aider最近推出了一种新模式，名为“使用一对ArchitectEditor模型以提升编码效果”。这个更新旨在通过协同工作，优化编码过程，使开发更高效。将代码推理和编辑分开架构师模型首先描述了如何解决编码问题，包括设计思路和步骤。然后，将该解决方案传递给编辑器模型，后者负责生成具体的代码编辑指令。这一架构师编辑器的方法显著提升了多个模型的基准分数，相较于之前的...

2024-11-29 14:34:22 2366浏览 0点赞 0回复 0收藏

Qwen2-VL (2B、7B、72B)：迄今为止最好的开源视觉模型！！（击败 Claude 和 GPT-4o）

阿里Qwen团队推出了一些很棒的NewVision语言模型，第一个模型是Qwen2VL2B，然后是8B，然后是72b。在这三个模型中，只有2B和8B模型目前是开源的，而72b模型尚未开源，这有点令人失望，但我认为这没关系，因为我们这些凡人无论如何都无法运行它，72b模型可以通过API获得：https:dashscope.console.aliyun.com我给了一个这样的图片：这是他的结果Qwen2VL72B：这是一张展示图像转换前后的对比图。图片的左上角有“Ide...

2024-11-21 14:29:17 3551浏览 0点赞 0回复 0收藏

Gemini Exp 1114：有史以来最好的大模型！击败 o1-Preview + Claude 3.5 Sonnet！

GoogleDeepMind的最新版本GeminiExp1114，在ChatbotArena上取得了重要成就，凭借超过6000个社区投票，跃升至总榜第1，并在多个领域表现出色：总排名：3>1数学：3>1难题解答：4>1创意写作：2>1视觉识别：2>1编程：5>3首先，我们要理解LLMArena是什么。LLMArena（或称聊天机器人竞技场）是一个评估LLM的平台，主要目标是促进社区驱动的LLM性能评估。它是最有声望的评估平台之一。从总榜来看，谷歌新模型Gemini（Exp1114）分数直涨...

2024-11-18 16:58:01 1843浏览 0点赞 0回复 0收藏

Qwen2.5：13个新模型来袭！开源通用、编码、数学模型全解读，72B超越Llama 405B - 本地安装测试

精华

Qwen发布了13个新模型，这些新模型被称为Qwen2.5。这次发布有三种类型的模型：通用任务模型、编码模型和数学模型。通用任务模型有七种尺寸：0.5B模型、1.5B模型、3B模型、7B模型、14B模型、32B模型和72B模型。编码模型有1.5B和7B尺寸，未来还会推出32B版本，但目前尚未提供。与此同时，数学模型有1.5B、7B和72B尺寸。这些模型都是开源的，并根据Apache2.0许可发布，除了3B和72B版本。他们还发布了Qwen2.5Plus和Turbo版本，这些...

2024-11-15 15:43:52 3814浏览 0点赞 0回复 0收藏

Crawl4AI：AI驱动的网页抓取神器，结合LLM实现自动化数据提取与处理

精华

我们将介绍Crawl4AI以及如何利用它来从不同网站或互联网上的其他任何地方爬取和抓取数据，只要该网站支持抓取或爬取功能。当我们与ChatGPT一起工作，构建可以连接互联网外部数据源的Rag系统时，爬取和抓取数据就变得非常重要，因为你需要抓取并获取外部数据、实时数据或现实世界的数据，我们通常在这一过程中遇到困难。我将介绍一个名为Crawl4AI的开源工具，这是一个GitHub上的开源项目，任何人都可以使用，只需几行代码，你就...

2024-11-11 16:18:38 4155浏览 0点赞 0回复 0收藏

AI电话Agent时代到来！！语音克隆与情感理解、企业电话的未来？

Hi，这里是Aitrainee，欢迎阅读本期新文章。大家应该都有接到过某某运营商或者某某银行的电话AI助理，它们的语气已经很接近真实人类的声音。但是与我们对话的交互点比较局限，以至于听了头一两句就知道对方是——AI。似乎缺少智能体的特征...BlandAI的这个对话AI智能体，可以集成到公司系统、从公司文档知识库中检索知识+必要时转人工。BlandAI有时甚至假装是人类，此外，它利用通话数据训练训练迭代自己。视频中展示了BlandAI...

2024-11-05 15:18:30 1786浏览 0点赞 0回复 0收藏

ComfyUI Party：将LLM与图片工作流集成，图片、语音、文本、视觉一体！（graphRAG、ollama）

Hi，这里是Aitrainee，欢迎阅读本期新文章。我们正在使用一些Agent平台如FastGPT和Dify，他们注重于快速生成文本内容，知识库问答，提供自定义能力和与现有系统的集成性。同时，在AI绘画方面，我们原来使用SD，后来使用ComfyUI。虽然ComfyUI被广泛用于将文本转化为图像（文生图），但它实际上是一种生成式AI内容（AIGC）的工具，其功能不仅限于此。它还能够处理文本生成（文生文），因此可以实现多种内容的生成。Dify中也有提供...

2024-10-31 14:04:47 2773浏览 0点赞 0回复 0收藏

获得成就

已积累 1.3w 人气

获得 0 个点赞

获得 1 次收藏