鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 25年5月软考 PMP项目管理免费题库

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

对标GPT-4o！不锁区、支持手机、免费使用，Moshi来啦！

发布于 2024-7-5 10:07

浏览

0收藏

7月4日凌晨，法国知名开源AI研究实验室Kyutai在官网发布了，具备看、听、说多模态大模型——Moshi。

Moshi功能与OpenAI在5月14日展示的最新模型GPT-4o差不多，可以听取人的语音提问后进行实时推理回答内容。但GPT-4o的语音模式要在秋天才能全面开放使用，而Moshi已经提供使用了。

「AIGC开放社区」已经亲自测试，Moshi不锁区，填写一个邮箱地址就能直接使用，无需任何等待。值得一提的是，Moshi是支持手机移动端使用的，只不过对普通话支持较差，最好使用英语提问。

此外，Kyutai可能很快就会开源Moshi，公布代码、模型权重和论文。

免费体验地址：https://moshi.chat/?queue_id=talktomoshi

对标GPT-4o！不锁区、支持手机、免费使用，Moshi来啦！-AI.x社区

Moshi的使用流程非常简单，1）登录https://moshi.chat/?queue_id=talktomoshi

2）填写一个邮箱地址，然后点击join。如果是手机登录，系统会提示使用你的麦克风，因为这个产品对语音是一个硬性要求。如果你是PC端使用，也必须有麦克风，不然没法使用。

对标GPT-4o！不锁区、支持手机、免费使用，Moshi来啦！-AI.x社区

「AIGC开放社区」的真实使用过程

3）开始语音输入，你想提问的内容就行了。

对标GPT-4o！不锁区、支持手机、免费使用，Moshi来啦！-AI.x社区

下面这个是官方展示的案例，根据多轮语音连续对话，主要让Moshi用法语来一首关于巴黎的诗；接着用窃窃私语的方式描述一个神秘故事。

Moshi完成的很出色，其拟人化语气是一大特点机器味很少，这一点和GPT-4o有点像。

对标GPT-4o！不锁区、支持手机、免费使用，Moshi来啦！-AI.x社区

这个是模拟星际战舰指挥官与航程的故事，主要询问了一些到达目标航程，周围环境等内容。（由于听译的可能理解的不太全~~）

对标GPT-4o！不锁区、支持手机、免费使用，Moshi来啦！-AI.x社区

「AIGC开放社区」也体验了一下，主要问了Moshi几个简单问题：第一个，法国巴黎有哪些著名景点？Moshi：埃菲尔铁塔。

接着问，卢浮宫博物馆有哪些著名的展览物品？Moshi：世界名画蒙娜丽莎的微笑。

又问了，巴黎有哪些标志性建筑？Mosh：凯旋门，这是一个拥有悠久历史的建筑。

对标GPT-4o！不锁区、支持手机、免费使用，Moshi来啦！-AI.x社区

由于Moshi的论文还没有发布，「AIGC开放社区」就说一说自己的亲身使用体验吧。

1）响应速度超级快，本次测试使用的是国区线路，而Moshi的demo服务器在欧洲和美国，但当你用语音提问完问题后，几乎0延迟就能马上响应你的提问。Moshi官方给出的理论延迟是160毫秒。

对标GPT-4o！不锁区、支持手机、免费使用，Moshi来啦！-AI.x社区

2）不支持中文普通话，这一点还是能理解的，毕竟Moshi面向的国外用户群体，主流语言还是英语，同时也支持法语。

3）回答内容有限，Moshi虽然是语音输出内容，但详细程度比ChatGPT那种纯文本差好多，回答的内容只能是轮廓大概，相信以后产品会迭代更多。

4）使用方便快捷，几乎没有繁琐的注册流程，你只需要提交一个邮箱即可，马上就能帮助你非常方便。

5）Moshi听和说的能力有了，看的能力还没展示出来，这个功能估计以后也会添加吧，这样整个输出模式将更加完善。

6）这类产品对家教、教育行业是起到颠覆性作用，例如，让家教老师帮你反复讲解一道高数题，估计两遍人就比较恼了，而AI可以帮你循环讲解无数次，这对于教育帮助是巨大的。

7）期待国产类似的GPT-4o、Moshi产品出现，最好再支持一些闽南话、粤语、四川话、东北话等有特色的地方语言，就像汽车导航那样一定会非常有意思。

对于Moshi的发布，网友们还是相当兴奋的，在我们苦等GPT-4o的语音模式时，Moshi横空出现，期待他们更好的表现。

对标GPT-4o！不锁区、支持手机、免费使用，Moshi来啦！-AI.x社区

在推理延迟方面，Moshi似乎比GPT-4o更好。这一点从实际操作来看，确实是很快的。

对标GPT-4o！不锁区、支持手机、免费使用，Moshi来啦！-AI.x社区

刚试了一下Moshi的产品，其高效的推理响应以及低延迟，令人印象深刻，这就是我一直期待的产品。

对标GPT-4o！不锁区、支持手机、免费使用，Moshi来啦！-AI.x社区

继续称赞Moshi的低推理延迟。如果使用功能更高级的模型，即便推理时间长一些也没问题。确实现在，Moshi的回答内容还是太宽泛了。

对标GPT-4o！不锁区、支持手机、免费使用，Moshi来啦！-AI.x社区

已经有人急的不行，开始要源代码了，你们可是开放AI研究实验室啊~

对标GPT-4o！不锁区、支持手机、免费使用，Moshi来啦！-AI.x社区

本文转自 AIGC开放社区，作者：AIGC开放社区

原文链接:https://mp.weixin.qq.com/s/4ri32qsP8VgB9GeC-TK6Sw

标签

赞

收藏

回复

举报

回复

相关推荐

OpenAI震撼推出GPT-4o：开启全球免费AI服务的新篇章

xuxiangda • 2818浏览 • 0回复
OpenAI颠覆世界：GPT-4o完全免费，实时语音视频交互震撼全场，直接进入科幻时代

轻薄滴假象 • 1574浏览 • 0回复
GPT-4o：实现跨越文本与视觉的智能交互

51CTO内容精选 • 2365浏览 • 0回复
Sam Altman：GPT-4o幕后揭秘，GPT-5会很特别

Aceryt • 1286浏览 • 0回复
GPT-4o 的数学又双叕进步了？来 MathBench 看看新版 GPT-4o 到底强在哪！

恋恋青鸟 • 1885浏览 • 0回复
GPT-4o做Code Review可行吗？

51CTO技术栈 • 1875浏览 • 0回复
天下武功唯快不破，GPT-4o真的牛

ermulong • 967浏览 • 0回复
速度秒杀GPT-4o！Mistral开源首个22B代码模型破记录，支持80+编程语言

duhorse • 1837浏览 • 0回复
现在，所有人都能免费用GPT-4o了！

duhorse • 2630浏览 • 0回复
如何使用GPT-4o函数调用构建一个实时应用程序？

51CTO内容精选 • 2403浏览 • 0回复
GPT-4o背后可能的语音技术

鱼虫子 • 1322浏览 • 0回复
性能对标GPT-4o

duhorse • 1468浏览 • 0回复
GPT-4o不香了

Crystalcxt • 1673浏览 • 0回复
终于来了，OpenAI测试GPT-4o高级语音模式！

Aceryt • 860浏览 • 0回复
谷歌发布Gemini Live：对标GPT-4o，让每一个人都有贾维斯

Aceryt • 827浏览 • 0回复
LLM合集：港大利用GPT-4o生成QA对，打造大规模多模态视频思维链（COT）数据集

AIPaperDaily • 809浏览 • 0回复
微软发布Phi-4，最强小模型！参数极小、超GPT-4o

Aceryt • 548浏览 • 0回复
GitHub Copilot免费了，可无条件使用GPT-4o 和Claude 3.5 Sonnet等高级模型

Syrupup • 2696浏览 • 0回复
Cline 3.2 重磅更新：免费调用 Claude Sonnet 3.5 和 GPT 4o，开发效率直接拉满！

凝固的雨_1 • 5692浏览 • 0回复

这个用户很懒，还没有个人简介

帖子

声望

粉丝

关注

最近发布

高盛：DeepSeek等中国大模型，加速AI对全球GDP贡献 3天前发布
清华、中南开源3D交互实体AI Agent LEGENT 4天前发布

热门推荐

带你一文读懂爆火的 DeepSeek-R1 新模型技术，为何震动了全球 AI 圈 1回复

手把手教你在本地部署 DeepSeek R1，并集成到 Dify 中，建议收藏！ 0回复

一文说清楚"知识蒸馏"（让“小模型”也能拥有“大智慧”） 0回复

国家队出手！DeepSeek上线国家超算互联网平台，免注册开箱即用！ 0回复

被 DeepSeek 带火的蒸馏到底是啥 0回复

上一篇：微软开源GraphRAG：极大增强大模型问答、摘要、推理

下一篇：哈佛、麻省推出面向医学多模态助手—PathChat

社区精华内容

目录

Copyright © 2005-2025 51CTO.COM 京ICP证060544版权所有未经许可请勿转载