鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 25年5月软考 PMP项目管理免费题库

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

智谱大秀肌肉！CogAgent 2.0让大模型接管一切！GLM-PC首创隐形屏幕，人类监工AI不远了原创

发布于 2024-11-29 14:04

浏览

0收藏

编辑 | 伊风

出品 | 51CTO技术栈（微信号：blog51cto）

智谱 Agent OpenDay，手机上的自动驾驶正式升级为全家桶！

AutoGLM、AutoGLM-Web、GLM-PC，分别在手机、浏览器和电脑端可用！

这下终于全员能体验一把 AI 助手「会操作」的魅力了。此前推出的 AutoGLM 因为苹果生态的限制，只有安卓版，让许多用户都没能走到申请内测的那一步。

现在最快能上手的就是已经上线的 Web插件了，无需申请内测！

智谱大秀肌肉！CogAgent 2.0让大模型接管一切！GLM-PC首创隐形屏幕，人类监工AI不远了-AI.x社区

智谱大秀肌肉！CogAgent 2.0让大模型接管一切！GLM-PC首创隐形屏幕，人类监工AI不远了-AI.x社区

在演示 demo 里，智谱大秀肌肉，展现了一把 AutoGLM 从小红书搜索火锅食材，到小象超市下单的共 53 步的操作。（这么想想一个简单的食材采买，其实也是非常繁琐的事。）

智谱大秀肌肉！CogAgent 2.0让大模型接管一切！GLM-PC首创隐形屏幕，人类监工AI不远了-AI.x社区

智谱大秀肌肉！CogAgent 2.0让大模型接管一切！GLM-PC首创隐形屏幕，人类监工AI不远了-AI.x社区

更多AutoGLM、GLM-PC的神奇操作，可以看看官方放出的视频，让人直呼魔法。

1.GLM-PC ，第一个提出了隐形屏幕

CogAgent 如何学会操作设备的呢？

技术负责人潘立航解释，目前主要有三大类学习方案。

先是被动模仿，让 AI 观察我们人类是如何使用计算机的，让 AI 了解各种操作。

第二步是交互学习，在这一步中，人类做导师，AI 在指导下操作计算机。

第三步则是主动探索，计算机能自己琢磨研究，完成提升。

智谱大秀肌肉！CogAgent 2.0让大模型接管一切！GLM-PC首创隐形屏幕，人类监工AI不远了-AI.x社区图片

不过，AI 目前的操作还有很多限制，完成任务的效率也相对较慢。

例如，Claude 3.5，他在操作电脑进行编程时，就被研究人员发现 AI 竟然偷偷摸鱼，浏览器了黄石公园的照片。

智谱大秀肌肉！CogAgent 2.0让大模型接管一切！GLM-PC首创隐形屏幕，人类监工AI不远了-AI.x社区图片

而且，在 AI 接管电脑的时候，人类就不能并行做事了。这就使得 AI 用电脑的效率很低。

在这次发布会里，GLM-PC 提出了隐形屏幕，让人眼前一亮！

也就是说，未来人和 AI 能同时使用一台电脑工作，AI 不再抢占屏幕和键盘鼠标。当然了，我们还可以继续监工 AI，把它的屏幕放在小窗，随时查看，但又互不干扰。

潘立航说，GLM-PC 有计划让 AI 分身，创造多个隐形屏幕，一个打工人，就是一支队伍。

隐形屏幕预计明年 Q1 推出，看来 2025 年的 AI圈也会非常精彩。

智谱大秀肌肉！CogAgent 2.0让大模型接管一切！GLM-PC首创隐形屏幕，人类监工AI不远了-AI.x社区图片

2.上手实测：教 AI 比自己做累多了

AutoGLM 很酷，但就像我们用的一系列 AI 功能一样，离完成品还有非常远的路要走。

看到消息，我迫不及待的体验了一把，下载即用的浏览器插件，AutoGLM-Web。

谷歌浏览器插件地址：https://chromewebstore.google.com/detail/%E6%99%BA%E8%B0%B1%E6%B8%85%E8%A8%80%EF%BC%9Achatglm-autoglm-%E5%B7%A5%E4%BD%9C%E5%AD%A6%E4%B9%A0/mnpdbmgpebfihcndnpgdaihnkmloclkd

首先，目前在插件中，AutoGLM 支持的网站比较有限。

智谱大秀肌肉！CogAgent 2.0让大模型接管一切！GLM-PC首创隐形屏幕，人类监工AI不远了-AI.x社区图片

更重要的是，AutoGLM 的意图识别还不够“智能”，需要写更详细地prompt来指导 AI，而它的响应也需要等待。

实测开始，我在百度主页看到一个羽绒服的热搜，因为标题在卖关子，就让 AI 帮我看看是个啥事。

智谱大秀肌肉！CogAgent 2.0让大模型接管一切！GLM-PC首创隐形屏幕，人类监工AI不远了-AI.x社区图片

使用 AutoGLM 帮我查看，在优化 prompt 后，AI 成功点开了相应的热搜，但却没能进一步点开搜索结果就进行了总结。

视频经过二倍速处理。

智谱大秀肌肉！CogAgent 2.0让大模型接管一切！GLM-PC首创隐形屏幕，人类监工AI不远了-AI.x社区

由于没有点击搜索结果（可能因为搜索结果不在支持网站的范围，另外，第一条结果是个视频，对于 AI 来说理解视频也具备困难），总之，AutoGLM 的总结和新闻主要信息中的「假羽绒以次充好」「旧羽绒服翻新」有所出入。

智谱大秀肌肉！CogAgent 2.0让大模型接管一切！GLM-PC首创隐形屏幕，人类监工AI不远了-AI.x社区图片

在隐形屏幕出现后，我或许会尝试将更多的任务外包给 AutoGLM。

这些 demo 更像对不久的未来的一种预言。我们能体会到 demo 中 AI 助手的神奇与实用，产品的设计面向了实打实的生活场景，可以预见这些 AI 功能将在未来给我们节省大量的时间和精力——可能不是现在。

本文转载自51CTO技术栈，作者：伊风

©著作权归作者所有，如需转载，请注明出处，否则将追究法律责任

标签

已于2024-11-29 15:57:49修改

赞

收藏

回复

举报

回复

相关推荐

让智能体直接控制键盘、鼠标，与一切软件交互

zhangyannni • 2096浏览 • 0回复
大模型不是AI的尽头，联想杨元庆称真正意义的AI PC应该具备5大特征

liutao988 • 1310浏览 • 0回复
在全面“本地化”前，所有AI PC都是“伪AI PC”？

liutao988 • 1038浏览 • 0回复
CVPR 2024 | 分割一切模型SAM泛化能力差？域适应策略给解决了

轻薄滴假象 • 1672浏览 • 0回复
商汤科技Copilot技术应用负责人张涛：大模型不能解决一切，AI产品需要领域知识

51CTO技术栈 • 1775浏览 • 0回复
人类偏好就是尺！SPPO对齐技术让大语言模型左右互搏、自我博弈

轻薄滴假象 • 1360浏览 • 0回复
清华&智谱AI发布最新Inf-DiT模型

angel • 4081浏览 • 0回复
直播首秀 AI大模型的存储之道

数字化助推器 • 993浏览 • 0回复
国内大模型文心一言、通义千问、豆包、混元大模型、讯飞星火、Kimichat、智谱清言，到底该用哪个？

wsp_ping • 1.2w浏览 • 0回复
「分割一切」进化2.0！一键跟踪运动物体，代码权重数据全开源

angel • 915浏览 • 0回复
4090单卡可跑，6秒直出电影级画质，智谱版Sora正式开源！

duhorse • 779浏览 • 0回复
智谱AI联合清华发布CogVideoX | 技术报告解析

angel • 1495浏览 • 0回复
【智汇金秋创造季】智汇成海，致敬开发者的“超级码力”！

AI.x社区官方账号 • 32.8w浏览 • 148回复
人工智能新高度：GLM-4-Plus，智谱AI打造媲美GPT-4o的基座大模型

穿越时空111 • 2588浏览 • 0回复
微软研究院新突破：如何让AI在专业领域更靠谱？

Halo咯咯 • 471浏览 • 0回复
7大顶尖AI修bug系统大PK，谁才是"代码医生"？ | 法语版BERT CamemBERT 2.0让AI更懂"法式幽默"

sbf_2000 • 537浏览 • 0回复
突发，美国开始拉黑国产大模型公司！智谱官方回应：手握全链路大模型核心技术，无实质影响！

51CTO技术栈 • 508浏览 • 0回复
大模型生成内容靠谱吗？CRAAP测试告诉你

云原生AI百宝箱 • 253浏览 • 0回复
Gemini 2.0：针对代理时代的新AI模型

Halo咯咯 • 696浏览 • 0回复

这个用户很懒，还没有个人简介

帖子

声望

粉丝

关注

最近发布

热门推荐

国家队出手！DeepSeek上线国家超算互联网平台，免注册开箱即用！ 0回复

DeepSeek R1横空出世，超越OpenAI o1，教你用Ollama跑起来 0回复

一文说清楚"知识蒸馏"（让“小模型”也能拥有“大智慧”） 0回复

手把手教你在本地部署 DeepSeek R1，并集成到 Dify 中，建议收藏！ 0回复

DeepSeek + 本地知识库：真的太香了！保姆级教程，建议收藏！ 0回复

上一篇：大模型“投毒”实习生起诉已受理：索赔800万！公开道歉！知情人：曾报警称自己被诬陷

下一篇： Kimi把自家底层推理架构都开源了，开源贡献阵容相当豪华：清华、阿里、华为、AISoft、面壁智能

社区精华内容

目录

Copyright © 2005-2025 51CTO.COM 京ICP证060544版权所有未经许可请勿转载