微软亚洲研究院博士:往返于研究与开发之间

企业动态
研究院技术战略总监张益肇博士回忆他往返于研究与开发之间的故事。

在微软亚洲研究院,有很多研究成果成功转化为产品的例子,让我们在期待今年技术节盛会之前,看看研究院技术战略总监张益肇博士回忆他往返于研究与开发之间的故事:

在微软亚洲研究院成立八个月之际,我带着妻儿举家来到北京开始了我研究生涯中的一个转折;2003年,在研究院成立五周年之际,我来到了由研究院孵化出的微软亚洲工程院,在一个全新的环境从事以前在微软未曾涉猎过的产品开发类工作;2008年,在研究院将要迎来它十周年生日的当儿,我又重新回到了它的怀抱,继续享受在研究过程中的乐趣。

给盖茨作报告

在1999年7月加入微软亚洲研究院的时候,我的主要工作之一就是组建语音组的研究团队,2000年我们招募了初敏加入语音组,次年又招募了Frank  Seide加入,他们俩的加盟很快地就带动起了整个组在语音合成和语音搜索上的研究局面。TTS (Text to Speech, 简称TTS) 是语音组的重要项目之一,当时由初敏研究员主要负责,再加上彭煳,赵勇,赵晟,杨红云,王庆等年轻同事的全力投入,很快地作出一个中文语音合成系统。也正因为这个项目,让我经历了三年的“BillG Review”(向盖茨作报告)。

2001年,研究院第一年向盖茨汇报中文语音合成技术的成果,语音的自然度和流畅感与传统技术比起来要进步很多。盖茨听了汇报之后感觉一切都还不错,但是他摇摇头非常惋惜地说:“很可惜,我听不懂中文。”因此,盖茨对此无法給出针对性的意见,不过他仍建议我们是否可以把其他语言也做起来,2003年10月左右,浩大的Vista项目看中了我们研发的中英文语音合成引擎,并意欲转换进Vista中。那个时候正好微软亚洲工程院成立,于是语音合成项目成为了工程院成立时的最初七个项目之一。因此,那一年研究院和工程院组成的研发团队一起给盖茨集体做了一场项目汇报。当盖茨得知我们这个项目正筹划着做进微软新一代操作系统时,他急切地关心起开发流程的时间表,可见他对这个技术的早日面市是何等得期待!

随着TTS在Vista系统中的落地开花,Frank Soong博士带领着语音组为更加平滑的语音合成技术而努力着,同时一个稳定的TTS开发团队也在微软中国研发集团的成长并逐渐茁壮,当初只有四五人的项目团队如今已经发展成为二十多人,从事着除中英文之外的德文、西班牙文、法文、意大利文等其他二十几种语言的语音合成系统的开发,主要侧重于服务器上的语音交互方面的应用。让我们倍感欣慰的是,TTS技术无论是从最初的算法模型设计、原型系统建立,还是到后来的产品转化与现在更大规模的在服务器端的应用,语音合成技术的研究和开发,都是北京的研发团队自发完成的,这充分证明了中国研究团队的创造力和协作力。

盖茨说过,微软研究院的最大使命是使未来的计算机能够看、听、学,能用自然语言与人类进行交流。其实,这十年,我们都是围绕着这个愿景展开着研究,也取得了阶段性的成果,但是仍然还远未达到人工智能的程度,所以研究是一个长期的过程,需要有探索的心态,并不断拓展延伸的可能。TTS这个项目从初敏2000加入研究院开始到2006年底正式随着Vista发布,从最初的中文语音合成,接着到英文,再到后来的中英文双语合成,经历了一个较长时间的探索过程,而这种摸索和坚持都要投诸于长期的耐心。

工程的魅力

随着最后一次给盖茨做汇报的落幕,我的职业角色也从一个单纯的研究者向一名工程管理者转变,2003年底我经历了一次鲤鱼跳龙门似的跨越,微软亚洲工程院副院长的职务让我重新认识了另一种职业的魅力。

张亚勤曾经说过研究是一种气象开放、思维扩散的事业,而工程是一个不断去粗取精,直到发现非做不可的事情为止的过程。这是研究和工程所体现出来的两种不同的视野。研究和工程两者唇齿相依,研究要以实现工程转化为理想,而工程实践也离不开研究的指导,这就像中国的太极一样,虽然在工程需要有了一定的偏向,但是不能太规矩,以至于没有新的设想和新的创造进行自我完善。它们之间如何拿捏得好确实是一项很大的挑战。

无论是研究还是工程,制定明确的指标是激励自己的团队一个非常有效的方式。倘若在研究领域,我们可能用国际高水平论文的质量和数量、技术转换的多寡等重要方面去激励研究员们的学术创想,而在工程领域,我们则更多地通过参与新功能开发的数量以及对新产品发布的贡献等方面来衡量一个工程师的价值。

除了激励之外,如何在错误和失败中吸取教训也是研究和工程中都需要经常面对的一个问题,因为在这两者中,挫败是太寻常不过的家常便饭了。作为研究员或者工程师,我觉得树立长向的思维非常重要,这样能避免被一时的失败而打击。年轻时候的大起大落,从一段时间之后看来都是很小的变化,所以要用平常心对待,才能适应各种不可预知的挑战。

从我个人而言,“保持乐观的态度,做好悲观的准备”的心态,是我在工作过程中勉励并且安慰自己的一个非常实际的做法。凡事都要先给自己一个信心和动力,但是我们也要做好勇敢地面对可能出现的失败结局。

作者介绍:

张益肇,麻省理工学院计算机博士毕业。1999年7月加盟微软亚洲研究院任语音组主任研究员,从事自然语言理解方面的研究工作。之后在微软亚洲工程院任副院长,带领团队参与开发了Windows Mobile 和Windows Vista 的产品。2008年6月重新回到微软亚洲研究院任技术战略总监。他曾是 Nuance Communications 公司研究部的创始人之一,也是电信领域自然语言界面研究的先驱。在此之前,他还曾在麻省理工学院林肯实验室、东芝ULSI研究中心、美国通用电气研究院担任研究工作。他一直以“苟日新,日日新,又日新”来激励自己每天的生活。

原为链接:http://blog.sina.com.cn/s/blog_4caedc7a0100cht3.html

【编辑推荐】

  1. 盖茨自称善用每1分钱 李嘉诚30岁以后再理财
  2. 盖茨抛售200万股微软股票 套现3770万
  3. 盖茨出资1250万美元 赞助20个手机转账项目
责任编辑:张攀 来源: 新浪博客
相关推荐

2009-04-21 14:36:44

微软女性职场

2009-02-17 11:52:44

2015-12-18 11:54:20

微软亚洲研究院图数据库

2015-11-11 14:01:26

微软开源分布式

2022-01-24 17:47:10

微软AIOps智能运维

2014-10-30 09:24:08

VMware

2018-11-06 15:46:57

微软物联网计算

2014-06-19 13:49:41

微软加密库JavaScript加

2017-02-10 16:44:39

微软人工智能深度学习

2023-12-01 13:54:00

训练AI

2021-02-01 09:51:35

IBM中国研究院

2021-06-25 09:47:06

KDD Cup Graphormer

2011-03-11 13:22:16

2020-10-19 10:08:03

微软斜屏技术

2013-02-26 10:41:29

微软研究院数据挖掘奥斯卡

2018-04-24 14:39:07

微软航运人工智能

2022-04-22 11:22:47

达摩院阿里巴巴

2017-12-29 14:37:54

云计算

2018-01-31 16:06:36

培生微软人工智能

2019-05-14 10:33:35

人工智能教育部微软
点赞
收藏

51CTO技术栈公众号