张宏江:多媒体计算重在“融合”

企业动态
这一天,在日本奈良举办的2012ACM多媒体学术年会上,张宏江接过了由国际计算机学会(ACM)颁发的2012年度多媒体计算领域杰出技术成就奖,他由此成为迄今为止唯一一位获得美国电气和电子工程协会(IEEE)和ACM两大计算机专业协会颁发的技术成就奖的华人科学家。

[[103141]]

■本报记者 计红梅

2012年10月31日,对张宏江来说,是一个难忘的日子:他二十多年的学术生涯从此划上了一个完美的句号。

这一天,在日本奈良举办的2012ACM多媒体学术年会上,张宏江接过了由国际计算机学会(ACM)颁发的2012年度多媒体计算领域杰出技术成就奖,他由此成为迄今为止唯一一位获得美国电气和电子工程协会(IEEE)和ACM两大计算机专业协会颁发的技术成就奖的华人科学家。同时,作为这两大协会的双料院士(Fellow),张宏江也成为了名副其实的计算机多媒体研究领域的“大满贯”得主。

在得知获奖消息后,这位金山软件首席执行官,原微软亚太研发集团首席技术官、微软亚洲工程院院长接受了《中国科学报》记者独家专访,阐述了自己对于多媒体计算研究的独门秘诀。

“半路出家”的开山鼻祖

1991年,当张宏江博士毕业到新加坡国立大学系统科学研究院工作的时候,还没有想到自己会走进多媒体计算这一殿堂。

此前,他在丹麦科技大学选择遥感图像处理作为自己博士期间的研究方向时,也没有想到自己会由此与视频及图像内容分析结下不解之缘。

“那时候,新加坡国立大学有三个岗位供我选择,一个是电子工程系,一个是物理系,还有一个就是系统科学研究所。”张宏江回忆说。

当时的张宏江一心只想搞科研,因此他毫不犹豫地选择了可以全身心投入于研究的系统科学研究所,殊不知冥冥中也为自己从事多媒体计算选择了一条正确的路径。

“我在丹麦读博士的时候,有许多时间是在处理格陵兰岛的遥感图像,那时我很遗憾的是看了这么久的格陵兰图片却没有亲自到格陵兰看一看。” 张宏江说。

渴望参与实践,投身真实的生活,张宏江对于人生的选择决定了他所从事的研究必将与应用有紧密的关联,也就不奇怪他会“半路出家”,从遥感图像处理转而进行视频分析。

在新加坡国立大学,张宏江领导了视频和图像内容分析与检索、计算机视觉和信息系统等多个研究课题。1993年6月,他在《多媒体系统》杂志的创刊号上发表了他在这一领域的第一篇论文,建立了现代视频检索和内容查询的一个基本框架。多年以后,还不断有人向张宏江索要这篇文章,它已成为现代多媒体研究的一篇经典文献。

1994年,张宏江写作的《多媒体系统中视频和图像的处理》一书在美国出版,成为该领域的第一本专著。随后,他开发出了一套视频检索系统并获得了专利许可,柯达、英特尔等知名公司纷纷购买这项专利,并将该技术应用到一系列的产品研究和开发实践中。在美国,甚至有数家公司在张宏江开创的理论框架下创业成功。张宏江由此成为该领域名副其实的开山鼻祖。

计算领域的“思考者”

时至今日,检索张宏江的H指数(H-Index),会发现其排名已处于全球计算机科学家的第26位,在华人科学家中则高居第二位。

H指数是由美国加利福尼亚大学圣地亚哥分校统计物理学家乔治·赫希(J. E.Hirsch)教授在2005年发明的衡量科学家个人成就的一个评价指标。该指标是指一个人或一个机构有N篇论文分别被引用了至少N次,而张宏江的H指数达到了84,这意味着他所发表的论文中至少有84篇被引用了至少84次,远远高于一般科学家的水平。

张宏江是如何取得这一成就的呢?

他告诉《中国科学报》记者, 多媒体计算是指能够对音频、视频及文本等通信信号进行获取、生成、存储、分析、管理和传输等综合数字化处理的计算机系统。与某一项单一的计算技术,如声音识别相比,多媒体计算的特点是“融合”,即多媒体计算会在更高的层面对各项单一技术加以整合利用,而声音识别、图像处理等技术只是被整合的单元之一。

在张宏江看来,多媒体计算研究最困难的地方在于首先要对一个问题有充分的认识和定义,并给出一些初步的解决办法。“因此,该研究考验学者的是其发现新问题的能力,以及解决这一问题的水平和方法。”

从这个意义上来说,多媒体计算的研究者们更像是计算领域的“思考者”,要从错综复杂的迷宫中寻找到一条“阿里阿德涅金线”。张宏江认为,要寻找这一金线,“最好的做法是用融合的、系统的方法从事这项研究”。

进入“名人堂”之后

在10月31日的颁奖仪式上,ACM对于张宏江的学术成就给予了高度评价,认为其在“多媒体计算,包括基于内容的多媒体分析和检索以及其他应用方面,取得了开创性的成就”。

而评价自己所取得的成果,最令张宏江自豪的有两点:一是他在推动中国多媒体计算研究方面所取得的成绩;二是他所培养的一大批优秀学生。

1999年,张宏江回国参与创建微软中国研究院(之后升级为“微软亚洲研究院”)的时候,当时中国学者能够在ACM多媒体学术年会这样的高端会议上发表文章的机会几乎没有。然而,在他的带动下,2000年、2001年微软亚洲研究院分别有两篇文章入选了该年会,2002年四篇,2003年六篇。“以至于到了后来,ACM大会不得不制定和颁布了新的规则,对同一个研究机构年均发表论文的数量作出了限制,以免某个研究机构过于‘一枝独秀’。”张宏江略微有些得意地说。

11月1日,他特别发表微博称,“今年ACM多媒体年会,中国背景的团队大获全胜,拿了最佳论文、最佳演示和最佳挑战三个大奖,值得庆祝呀!”而对于他的获奖则只字未提。

此外,张宏江还是中国科技大学博士生导师以及清华大学和哈尔滨工业大学的客座教授。他向记者透露了自己培养学生的心得:“第一次见面,我会问我的博士生是否对学术研究有兴趣,因为兴趣才是科研的根本动力。其次,我要求他们一定要做有创意的研究,而不是为了追逐名利去‘硬凑数’。”

此次获奖后,张宏江为自己在学术圈的未来“盖棺定论”:“我算是彻底进入了 ‘名人堂’,年轻人也将因此获得更多机会。”他笑着说。

从新加坡国立大学起步,历经美国惠普实验室、微软亚洲研究院、微软亚洲工程院和微软亚太研发集团,按照张宏江的话说,他“一直在追求刺激”。

在这份精彩的人生履历里,“金山将是我最后一份全身心投入的全职工作。”张宏江说。

 

责任编辑:守望幸福 来源: 51CTO.com
相关推荐

2021-03-31 11:33:21

人工智能的未来

2011-10-19 15:11:15

微软亚太研发集团CTO

2011-10-25 09:42:02

张宏江金山微软

2010-10-27 11:12:39

2021-09-13 10:24:48

人工智能大模型

2010-05-05 21:56:37

融合通信

2013-08-28 16:08:19

多媒体Windows8.1

2011-06-09 10:07:28

Qt phonon

2010-06-30 10:38:05

2011-09-05 10:07:03

多媒体融合通信智能化

2013-12-17 13:29:04

iOS开发多媒体

2010-10-27 11:27:50

MAS视频监控H3C

2013-12-17 11:18:53

iOS开发多媒体API

2009-12-25 17:02:33

WPF多媒体

2012-02-24 15:52:19

金山快盘云存储

2020-12-20 09:05:30

腾讯多媒体5G

2011-08-02 10:36:02

iOS开发 SDK 多媒体

2018-02-07 15:35:04

2009-12-22 16:29:51

Linux多媒体软件
点赞
收藏

51CTO技术栈公众号