马宁:如何开发一个有趣的Kinect应用
作为有史以来销量最快的电子设备,Kinect从2010年10月开始近用5个月时间,销量就突破了1000万部。马宁以一个关于奥巴马是否因为肤色的问题会导致Kinect识别率降低,而涉嫌种族歧视的笑话开场。当然,事实证明这个问题只是个笑话而已。马宁以特有的诙谐幽默的演讲方式,为我们介绍了Kinect是什么?有那些SDK?Kinet的发展历史等。
马宁在讲关于奥巴马的笑话
Kinect是一个XBox 360的外接体感设备,不需要任何道具就可以完成整个动作识别和捕捉。有两个功能是它做的,一个是动作识别和动作捕捉,还有一个是3D立体语声识别。Kinect最多可以支持4个人的识别,但是真正有效可视识别最多是两个人,且两个人的位置不能够交叉。Kinect的好处是可以用低廉的成本就能够完成动作识别和动作捕捉等技术。
Kinect SDK是由微软研究院来做,支持C++,C#,和VB.NET。目前有两个,一个针对Windows,另一个是针对微软机器人开发组件,都是非商业授权许可,商业授权将在下一个版本中提供。建议使用在Windows 7下使用Visual Studio 2010 Express以上版本进行开发。
张彤:用大脑控制你的应用——脑际接口技术的应用与前景
BCI技术,是一种脑际接口技术。是指用我们大脑和电脑、或者是计算机设备之间打开一条直接通路,因此可以作为控制、监测、训练等方面的应用。神念科技所使用技术是一种新型单芯片混合电路芯片技术,不同于医院等大型企业所采用的同类设备,做到将工业化设备带入民用领域。只用一个单电传导器,而不需要做任何导电胶的处理,或者在头上做任何东西,只要简单一个点就可以提取精度非常准的脑电数据。
神念科技的全球总部位于美国硅谷,其脑波传感器在玩具,游戏,教育,健康和汽车等行业都得到广泛的应用。神念科技以60多年的医学研究为基础,将脑电波(EEG)技术转化并开发成适用于大众市场的应用,并使其更加易用和高效。 神念科技的开放接口支持Windows、iOS和Android三大平台,SDK中同时包含免费包和收费包。张彤还透露,神念科技和应用开发者之间的模式是二八分成,公司拿二合作者拿八。
张彤介绍BCI技术的原理
这个技术很神奇,随着BCI技术的快速发展,应用也日趋广泛。张彤现场邀请观众上台演示了一款叫做mindFlex的应用,通过头上特定的耳机,观众可以用意念来控制在容器中的小球上升下降的高度,意念越强小球上升越高。所有现场观众集体见证了奇迹发生的时刻,大家都为这个产品带来的神奇体验惊喜不已。
现场观众见证奇迹的时刻
最后张彤播放了一段视频,一个女生戴着装有BCI模块的可爱猫耳朵,当她见到帅哥的时候,头上的猫耳朵会感知到脑波变化,迅速的立起来,而当女孩心情低落的时候就会耷拉下来,引来现场阵阵欢笑声。
中场休息期间现场观众围观见证奇迹的神物
江涛:语音输入交互你的应用——移动互联网时代的语音云
讯飞语音的中英文核心技术国际领先,牵头制定国家标准并拥有主流市场80%以上的市场份额;是中国语音产业唯一的国家规划布局内重点软件企业,并且是唯一的“语音上市公司”。江涛首先将语音技术目前的发展状况进行了介绍,接着介绍了开放给合作伙伴的云语音平台是什么状态,以及什么样的合作模式。最后针对在场开发者,介绍了智能语音交互硬件开发接口。
江涛介绍科大讯飞的“语音云”以及开发SDK
现场演示中,讯飞语音在语音识别方面的正确率非常高,甚至可以根据句子的内容自动添加标点符号。比如“去TUP吗”程序就会在后面自动补上“?”。他们的语音合成技术也已经非常成熟,通过一段对比视频我们可以看到,即使是合成中央电视台著名主持人的标准普通话波音,也几乎可以达到以假乱真的效果。
讯飞语音提供两类接口,一类是C风格API接口,具备最广泛的平台覆盖性,以及灵活性,这是比较底层的接口;另外为快速开发提供可视化接口,降低开发难度。目前支持的平台有Android、iPhone和Symbian。
讲到商务模式,江涛称对初创期的创业公司全免费,包括免费获得开发包和技术服务。在推广阶段,初创企业没有挣到钱就不收钱,科大讯飞通过以下三种模式获得回报:技术服务费,按使用量付费和合作分成。如果只有流量,资源互换也可以。
圆桌论坛主持人刘江 , 从左至右分别是江涛 、蒋涛、张彤、马宁
接下来,CSDN &《程序员》创始人蒋涛和3位嘉宾一起,在圆桌论坛环节和在场观众进行了互动。
最后,CSDN &《程序员》总编刘江对本次TUP活动进行总结:今天介绍都是相对比较前沿的技术,需要突破固有的一些思维。以前很习惯的东西可能不对,需要改变。回归到自然状态,技术进步和应用为了释放更多人。