本系列文字是一位创业者的投稿《面向NLP的AI产品方法论》,老曹尽量不做变动和评价,尽量保持系列文章的原貌,这是第一篇。
这是一个创业者的复盘,主要内容分为两个部分。
- 一个创业者成长的心路历程——心路日记
- 如何寻找语音交互业务场景——干货思考
绘声绘色地讲故事和枯燥严谨地深度思考,觥筹交错,最终为标题服务——如何寻找语音交互的业务场景。
一个创业者成长的心路历程——心路日记(1)
笔者进入AI领域,从事NLP相关的工作,已经超过18个月的时间了。如果算上我们的真9-9-6强度,走过的弯路,做过的那些项目经验广度与深度,没法算。
刚切入AI行业,耳濡目染熟悉了语音交互的优势和特性,比如:
- 解放双手,懒人最爱;
- 使用门槛低,会普通话就能用;
- 交互自然,没有什么学习成本;
- 一句话就能搞定需求;
- 如果一句话不行,那就两句?三句?
彼时外部环境也特别好,彼时各媒体,产业,融资层面的大环境,一片欣欣向荣,此处也不累述了。
从实际的发展趋势上来看,未来注定是万物互联的世界,几乎任何硬件都可以搭配麦克风、扬声器和WIFI模块三件套,且可穿戴智能硬件出货量特别大……语音是最为自然的交互形态,一定会出现在我们生活中,一切都似乎特别美好。
过往18个月,大家定期就会围坐一个圈,开头脑风暴会议,思考有哪些场景适合语音交互?从普罗大众的高频刚需到特定行业的细分场景,大家轮流发言,想到哪里是哪里,不打断不评价,每时每刻都在寻找创业场景。
过往18个月,头脑风暴了上百个想法,推演过程中拍死了几十个想法,留下几十个,因为各种原因半途而废掉十几个技能,最后留下了十几个技能,一看后台数据,有些表现好,有些表现糟糕。
过往18个月,每当有新的语音交互技能被做出来,便迫不及待的在自己的朋友面前吹牛逼,秀产品DEMO,“Hey,这是我新做出来的东西,要不要看看!”
当我在朋友面前如同开发布会一样的一波嘴炮铺垫以及熟练操作之后,我非常欣赏且享受对方面部流露出来那种wow的惊奇感,对方兴奋的表情停留在我的脑海中至今难忘,以我对朋友的了解,他情商一般般且没有讨好我的必要,且并不是表演专业,且无需做出照顾我心情的表现,由此我推断这是一个真实的表情流露,朋友的这种表现像鸡血一样刺激我又回到办公室疯狂努力加班。
心中想着,“尼玛创业就是要比快,哥们要赶快做出来,颠覆!革命!划时代!改变世界!让我们为梦想窒息!”
有的时候我在想,是不是自己的销售能力比较强,就我那个朋友给我的表现来看,我开发布会在演示产品环节的部分一定给力,差不离也有锤子科技发布会的那种“wow,!再来一遍!理解万岁!”的效果。
当技能上线后,一看数据,相当多的技能用户尝鲜完毕后,就搁置在那里,就是无法形成使用习惯,甚为不解的我,自然是开展了用户面对面的访谈调研工作,拿到的反馈是,这个刚开始确实是感觉挺新鲜,有点意思,但是后续我就是忘记使用了。
熟悉不?尝鲜型体验,还是根本就是个仅能打动自己的伪需求?
心中的疑惑,由“做什么技能”改成了“为什么我们做出的技能,演示的时候挺有意思,但是后续用户不会用?”
单单用“用户习惯难以改变,很多人接受不了新的东西”来为自己开脱,恐怕太偷懒。
过往18个月,笔者面对投资人科普、演示、教学、展望如果给我什么什么条件那么我们就极其有机会做到怎样怎样可谓经验丰富,附带各种销售话术,投资人也会在我的话术套路下,流露出我前面朋友一样wow的惊奇感和兴奋感,只求对方能够给我们投钱扩张,如果不着急投钱等等看的话,那么能连接一些合作资源也成啊。
给B端客户演示的时候,效果也差不多,虽然他们比较兴奋,我也一度享受,可是时间长了,我也有点疲劳,这些事做久了提升的是自己的销售能力,对自己的专业精进并没有太大的用,说得多了自己就会陷入禀赋陷阱,即,手里拿着锤子看什么都是钉子。
现在回顾过往,那些半途而废的,那些上线后数据不好的,都是财富。即,我能给很快的判断出:哪些业务场景需要语音交互,哪些业务场景根本就是伪需求。
如何寻找语音交互业务场景——干货思考(1)
创业自然是从找方向开始,一开始是做产品分析及市场调研。
分析竞品功能,分析友商情况,分析各种硬件的出货量,分析自己的优势劣势,分析国内外的各个语音技能有哪些,什么受欢迎,什么技能可以直接带来钱的回报,或用户增长等等,分析各个技能的实现方案,我们能做到什么程度,人力、资源投产比……
当然最重要的是,总得确立方向,做出点东西来。
笔者MECE之后,总结归类,市面上所有的语音交互技能都分为下面四个大类别。
【语音&工具】门槛太低,且几乎没什么技术含量。巨头做了,小公司还跟着做,那是一点机会都没有。
实际上,我们练手了几个工具型的技能,有一些交互设计上的微创新,但是微创新没有用,你会接受投资人那个老套而经典的拷问,如果大厂开始抄你,你怎么办?且用户也不会因为工具上的微创新而买单。
【语音&内容】技术含量较低,即搜索、点播、操控行为,本质上拼得是接口资源,用户根本不在意是使用语音还是点触找到内容,内容才是核心。
实际上,我们能够做到更好的数据表现,即用户怎么说,AI都能理解,但是没有接口给我们调用,因为没有播放版权,用户根本不买账。
【语音&游戏】本质上也是一种互动性较强的内容,依赖个人天赋,游戏创作能力,添加语音交互的这一新的操控维度,未来拥有比较多的想象空间。
实际上,猜歌词、成语接龙属于伪多轮,就算发明出几种变种模式,抄袭也容易没有什么壁垒。而语音互动小说,也苦于没有好剧本创作(这事拼天赋),好声优太贵成本太高,一直没怎么投资源,内部属于试验品。另外的和传统手游结合的这里不方便展开讲,没做的原因是资源投入过大,一直未动手。
【语音&服务】才是真正意义上的多轮表现,非内容创业,不过分依赖天赋,容易找到高频刚需,比较考验对自然语言处理的理解,拥有一定的技术门槛。
唯有语音连接服务,各种条件考量下来,C端B端G端均有需求,故而成为了我们选择的方向。敲黑板,划重点,简单总结:
【语音&游戏】成本高,依赖禀赋的内容生意,投产比风险较大。
【语音&服务】相对而言,是更为广阔,落地容易且稳妥的选择。
所有的单轮都没太大机会,大厂跟进抄袭太容易。所有做内容搬运,但交互形式不创新的,都没机会。只有多轮,巨头还没做到的,跟进较难,才是创业公司的出路所在。
第一轮筛选确定方向后,接下来是第二层筛选,选择哪个细分领域。
一个创业者成长的心路历程——心路日记(2)
往前推演十几年,智能手机未普及的时候,大家都是使用键盘和鼠标寻求服务。移动互联网的从兴起到如今,人类目前高频刚需几乎已经被各个APP占用了,他们共同的交互方式是点触的形式。而在未来,语音交互由于其特性,一定存在一席之地。
有相当一段时间里,心中也是抱着,使用新的语音交互体验方式,去颠覆一切旧的用户行为的心态。
至今自己做什么事,或者观察其他人做什么事,也在琢磨,能不能让语音发挥作用,这种习惯保持至今。
过往我们走了太多的弯路,现在看起来很愚蠢的讨论,这些方案点子试错,曾经花费了我们太多的时间,而这些东西如今在我看来,几乎很快就能通过知识框架推演出有无机会,实现难度几何。
几乎每个行业的从业者都会为自己的领域找到价值,而每个从业者都能随随便便列举各种语音交互的优势,但是光认知优势没有用,明白局限才是我们的筛选漏斗,否则即使你做出来,局限处理不好,用户也不会买单。
在某些大会上,某些路演上,看着台上的人举例子说语音交互的场景。
我早上出门比较着急,一边收拾小孩手忙脚乱的,这个时候我可以用语音叫个车。我一边开车,想到公司就能喝到热咖啡,这个时候我可以用语音搞定。刚刚下飞机,双手拎着东西,想通过语音发微信,打电话。
这种例子,完全是基于自己的角度,先把自己置入一个困境强行制造需求,然后提供解决方案。上述的三个业务场景真要抬杠,太容易了,但没必要。
解决方案是好,但是用户一定会用么?进入了困境用户会想起这种解决方案么?习惯如何培养?想要成为一个内行,不光是要看优势,还要理解局限,才能够运用自如,而不是一味强求使用语音解决。
搁在以前的我们,只能提炼出“卧室、客厅、车内”这三种场景,提炼出“双手被占用”,因为行业就是这样做的,且如此提供服务的。这种不够抽象,且无法体现出提炼语音交互关键点的描述,只会固化我们的思维。
我们应该了解语音交互的特性后去筛选适合的业务场景,而不是先制造困境场景然后寻找语音解决。
如何寻找语音交互业务场景——干货思考(2)
下面是我总结出来的语音交互对比图形界面交互的优势和缺陷。
其中白色块是特点,绿色块是优势,灰色块是缺陷。
而且,理解缺陷非常非常非常重要!他能帮助你避开无数业务设计大坑。有兴趣的,可以看我的另外一篇文章《一篇文章深入理解VUI和GUI的优劣对比》,我会把链接放在文末。
结合语音交互的优势和缺陷,下图是我提供的一个业务场景筛选漏斗:
基于上述,我们可以得出的使用场景有:卧室、客厅、厨房、卫生间、车内、私人办公室、滑雪场、隧道内、病床上……
然后是具体场景最常用做什么事情,语音交互能够带来更好的方案。而不是具体的场景强行做某事,基于此进行发散。(卧室、客厅、车载不列举了,没啥意思)
- 跑步的时候,骑车的时候,想切歌,接或者打电话。
- 厨房里面有点播做菜视频,买厨房用品的需求。
- 医院的卫生间和病床上,病人移动不便,使用语音交互是没有压力的。
- 滑雪场上穿着滑雪服,相当多时候需要用到通讯设备进行交流。
- 光线不好的隧道内,甚至是地下管道,穿着工作服,使用手机不方便时。
- 快递/外卖小哥,骑车和送货,双手经常被占用,公共场合使用语音无压力。
这样类似的场景完全符合上面的筛选漏斗里面提炼的条件。
而不仅仅是大家一窝蜂做的“卧室、客厅、车内”。
具体容易固化思维;抽象易于发散思考。希望各位读者能够明白其价值。
用户使用语音的前提。一个是不得不,一个是更便捷。我更希望大家从更便捷的角度去考虑,而不是不得不,所有的不得不,人类都有办法。
通过第一层场景选择后,第二层是业务选择,判断哪些更合适。
用户非常熟悉,简单明确的业务,意味着“闭着眼睛就能搞定”,简单明确,不需要图形界面确认。
一句话需求就能够返回结果,是最爽的语音交互状态。
决策压力小,相对标准的服务,意味着很多的默认选项,用户可接受度较高。
我们来看下面几个案例:
厨房买蔬菜就不太合适,是因为蔬菜是非标品,品类和新鲜程度存在太多的人为主观接受及条件筛选。但买酱油就可以,最多加一个品牌作为复合查询条件,并且商品的尺寸大小无所谓,决策压力较小。很多的人买其他的调料(醋、盐、鸡精等)几乎也没什么品牌需求,能用就行。即标准品,用户接受默认选项。
同理,订麦当劳/KFC/汉堡王、星巴克/瑞幸,喜茶/奈雪/一点点,甚至是烟和酒等标准品服务就相对容易,因为决策压力小,品质和服务可控。
同理,出行相关的服务,酒店之间的服务差别实在太大,飞机次之,火车最容易,就相对而言更容易立即呈现结果。
订机票/酒店的业务还算好,至少流程明确,决策路径较短,最难搞的就是,用户不知道自己要什么。用马爸爸好几年前的话说“每晚有1700万人逛淘宝,啥都不买。”
衣服鞋帽或者外卖餐食就属于典型的用户需求不明确,一句话虽然能够搞定结果,但是展示的结果,用户一定不满意,除非你拿到用户的个人数据,和过往的喜好选择,那么才可以提升精准度。如果不精准,而用户使用语音换来换去,效率就非常低了。
在有些事情上,用户本来就是挑挑拣拣的心态。用《梁宁产品思维30讲》的话来说,“大明”用户明确需求,而“笨笨”用户不明确,需要逛来逛去,还喜好挑挑拣拣,这种情况,就不太适合使用语音交互。
所以。电商是存在语音交互的可能性的,但是要有这个层面的理解,才方便做筛选,否则就会出现尴尬。同理,出行,金融,教育,医疗,游戏、线下生活服务同样可以基于此筛选场景。笔者负责任的说,任何业务都可以有语音交互的解决方案,只是看合适不合适。
综上,创业公司在选择业务场景的时候,通过上述条件要素筛选,更容易筛选机会。
阶段性小结
笔者基本上已经对得起当初文章标题所述,如何选择语音交互的业务场景。
首先是,如何做大方向选择,每个方向都没错,但是要结合自身公司的优势去判断,比如,喜马拉雅,做【语音&内容】绝对是自身禀赋。
接下来使用2层筛选清单去选择做什么场景,基于场景选择做什么业务。
具体容易固化思维;抽象易于发散思考。做到精准的抽象,又很难,希望各位读者能够明白其价值。
场景和业务明确后,也还存在如何交付的过程,毕竟产品设计方案有太多种,只要是从业者就能给出方案,但方案之间也存在优劣好坏。
故后面的命题是:如何通过语音交互革新体验,提升用户使用价值。
出于文章定位原因,本文阶段性结束。
我们都知道那个著名的公式:用户价值=(新体验-旧体验)-替换成本。前段时间读《俞军产品方法论》时,更是加深了理解。
我们如何释放AI的能力去革新体验,尽量提升(新体验)的价值。同时用户(替换成本)是什么,如何降低?如何两头用力,最大化创造用户价值?
引用本文开头提及的:“过往18个月,头脑风暴了上百个想法,推演过程中拍死了几十个想法,留下几十个,因为各种原因半途而废掉十几个技能,最后留下了十几个技能,一看后台数据,有些表现好,有些表现糟糕。”
有些技能是再怎么折腾,也还会糟糕的,有些则是通过一些调整,可以使其变得更好。
一个语音技能,能被C端B端G端所认可接受,一定会经过大量的筛选迭代,留存下来的是价值,那些没留存下来的,推理过程中被拍死的,半途而废的,数据表现糟糕的技能,经过思考,总结、复盘也会积累财富。
这个财富有一个别名,叫做认知。
认知不够,就算发现某些场景,也会认为司空见惯理所当然,跟那些被苹果砸中的果农没有任何区别。
【本文来自51CTO专栏作者“老曹”的原创文章,作者微信公众号:喔家ArchiSelf,id:wrieless-com】