也许一直在一线的程序员们对这个标题呲之以鼻,特别是全栈工程师们。这篇文章主要是抛砖引玉,预测一下以后的技术方向。另外,文中可能也有表述不对的地方,欢迎指正。如果只想看未来的部分,可从中间开始看。
计算机产生以后,这个行业的发展日新月异,不停地产生新的技术来解决新的问题。这里不把计算机语言的更新换代看作技术的变化。计算机语言应该算做是规范,除了解决新问题外,有些语言的产生和流行也是有历史原因的。
从计算机刚刚产生时,解决的是计算问题。其将很多人花费好几个月的计算在几天之内完成。这一代的工程师们更多的在解决硬件问题。程序员(或者叫做软件工程师)是将问题翻译成计算机语言(其实程序员做的一直是这个),也就是卡片纸。程序员在当时的计算机系统中,应该不算一个核心角色。因为大部分问题和挑战在硬件系统、算法上。
随着计算机成本的降低,世界大战后战争需求减少,开始大力发展经济。硬件解决方案的成本问题开始凸显,于是开始产生了通用计算机。通用计算机逐渐统一了硬件标准,把更多的灵活性放到了软件上。基本模式就是:巨无霸的硬件厂商们负责提供计算资源,程序员们负责解决问题。这时候,程序员的春天来了。在此同时,软件开发的理论也在不停地发展。随着各种语言的层出不穷,基本上大家认可了指令、数据,程序基本流程、库函数等各种计算机的概念。
再往后,随着计算机的应用的范围越来越大,挑战也越来越多了。由于系统复杂性的增加,很多系统已经不是几位,甚至是数十位程序员就能完成的了。(当今的操作系统、搜索引擎都是数千甚至数万人几十年辛苦工作的结晶)。新的挑战也来了——软件工程,如何更高效、可预期地开发、维护复杂系统。这里的挑战包括:如何将传统的项目管理经验放到软件项目管理中来;如何让程序员们采用各种标准化的编程风格;如何构建合适的团队结构等。这时候,程序员的重要性就凸显出来了,产业链中的地位也变高了。纵观历史,数万人以前集中在一起都是进行体力劳动或者战争。人类从来没有这么大规模的将智力集中在一起解决问题。
同时,解决的问题规模和类型也进一步增加。其中,人机交互是一个热门且有挑战的方向。输入上,除了从打字机来的键盘外,又发明了鼠标,显示,扬声器等各种人机交互的设备。程序员们除了要实现底层的驱动代码,在人机交互层面也要实现方便易用的交互体验。这时候除了算法和设计等挑战,还有人体工学、文化上的挑战。比如,中国人花了很多年,也没制造出广泛应用的中文键盘和流行的输入方式,***还是英文键盘+拼音成了最主流的输入方式。这是汉字本身的特点造成的,而广大程序员花了大量的人力物力才认识到了这些文化上的规律。另外,网络也是另一个热门。程序员们在底层将计算机连接在了一起,并依靠强大的网络能力实现了人们的远程沟通。
到了近几年,又出现了大数据、物联网等热门的方向。程序员们从底层实现大数据的批处理、传输、存储,解决了性能、可靠性等各种问题。由于大数据的精确性和完备性通常达不到100%,所以大数据也让很多程序员开始去解决不确定的问题。
别人家的程序员们一直在解决不同领域、类型的问题。程序员的角色开始了分化(同时也有很多角色从程序员中分化出来了),从开发、测试,到架构设计、体验优化、前端开发、后端开发、驱动开发、数据库开发、IT等等数不胜数。纵观不太长的程序员职业历史,这些角色也在不停的产生和消失中。这代表着一代一代的程序员要么不停的学习,要么从这个行业中离开(也没什么不好的,好多富翁都是程序员变的)。从历史来看,程序员们解决的问题,使用的组件和思维模式都在不停地变化。但也有一些不变的东西,比如程序基本流程、设计模式、软件工程。所以很多程序员在不停的学习新东西,从而能够解决新问题。
那么,现在正在、未来会发生什么变化呢?这里只想讨论一个:人机交互的革命,包括人机交互方式,和人机交互层次两方面的革命。(说人话!)好吧,就是Kinect, HoloLens、Cortana带来的新情况。这类新产品集中在一起,会对现有的人机交互产生颠覆性的革命。一句话概括:未来人们应该花更少的时间来学习如何使用科技,程序员们要花更多时间让科技来适应人,而不是人去适应科技。比如,单轮摩托车不需要学习怎么在一个轮子上保持平衡,四轴飞行器不需要学习怎么转弯、稳定,这都是很好的例子。
一:人机交互方式。人是生活在三维空间里的,程序员们也在不停地在各种输入输出方式模拟三维空间。首先,显示屏是一个二维的输出,由此鼠标和各种触摸方式也设计成了二维的。这里的二维性除了它们是平面输入输出外,它还真的只是个物理的平面……显示器放在哪里就在哪里,触摸要在显示器上完成,鼠标也需要在一个平面上完成移动。键盘呢?可以说其维度都没到一维。
什么是未来的输入设备呢?它包括全息输入输出设备和解放双手的输入方式。
- 全息输入设备。Kinect这样的体感、手势输入设备属于全息输入设备。Kinect很酷,但不得不说这只是全息输入设备的雏形。这不仅是因为其不温不火的状态,也是其本身还有很大的提升空间。一方面,设备本身精度不够、使用的范围不是360度无死角;另一方面后面没有强大的人工智能来支持(人工智能放到交互层次部分讲,这里只讲全息输入设备)。未来的输入设备应该是覆盖整个空间,精确检测到人的微动作和微表情,甚至能够检测到人的健康状态(安全和隐私是需要考虑的方面)。从单个技术上来说,应该没有突破不了的难题了,但集成起来制造出***的设备仍然需要巨大的投入。
- 全息输出设备。全息显示技术在很多科幻电影里都演示过了。HoloLens这样的增强现实设备和各种虚拟现实设备都属于全息显示设备。这些设备还处在非常初级的阶段,但已经带来了很大的震撼。在物理技术没有突破之前,这种可穿戴的设备是全息技术的主要载体。除此之外,还会出现各种味觉、触觉的设备,这些全部加起来,覆盖了人的所有感觉器官,就可以称作全息输出设备了。
- Cortana一类的语音助手。其最革命性的一点是进一步解放了双手(听起来怎么这么耳熟?)。这和人类直立行走的解放双手当然不能相提并论,但其革命性也是可圈可点的。还是那句话,这类语音助手还在雏形阶段,它们的主要挑战除了语音识别外,主要是在后文要讲的交互层次上。Cortana不像鼠标键盘,一方面需要学习如何使用,一方面还需要到固定的位置或者某个固定的姿势才能使用。现在Cortana虽然要将手机拿起来才能使用,但通过物联网的进一步发展,是可以进一步发展的。
对程序员的挑战就来了:
- 制造、集成出这些设备,甚至发明出新的设备。这些设备需要提供***的体验,和人的运动、感官无缝结合,且让人感到自然。
- 在较高层次,如何采集模糊、大量的输入,并转变成计算机能够处理的确定命令。和传统的输入方式相比,除了空间变成了三维,信息量也有数量级的增加。
- 怎样提高输入的效率、降低学习成本?程序员需要考虑的是如何颠覆性的提高输入效率。这里不仅是鼠标和屏幕的坐标从二维变成了三维的。想想钢铁侠是怎么输入的?
- 如何让设备输出最自然的体验?特别是全息显示设备,要解决头晕等问题需要大量的调试和研究的。
- 最重要的是:如何用这些设备构建全新的体验模式。比如,不同种类的应用应该放在什么位置,什么呈现方式?什么样的动作操作才是最有效率、最自然的?这些需要一代一代的产品不断的迭代,才能加深对新体验的认识,发挥新一代全息设备的能力。
二:人机交互层次。当前的人机交互方式上,虽然很多产品号称体验非常好,仍然需要人去适应设备。不仅是输入输出的方式,还是思维的方式,当前的人机交互的体验都有很大的提高空间。
例如,想出去旅游时,要先研究到底去哪里,要么上网,要么听人说,或者去旅行社直接预定。去旅行社当然最省事,但听不到***手的体验,成本也会比较高。如果要自己研究,选地方,确定日期,买机票、酒店,找攻略,过程中要用到很多次搜索引擎,各种预订网站,发邮件等。从开始想到基本确定至少需要好几天,中间也得好几个小时使用各种工具。而富豪们呢?也许只花5分钟就完成了整个过程:告诉助手:想出去玩。助手可能就问问想去什么样的地方(也许不是某个特定的地方)?玩几天?大概什么时候去?然后基本确定后再汇报一下安排就可以了。这两个过程之间的核心区别就在于交互的层次。普通人是依靠计算机进行任务层次的交互,而富豪是意图层次的交互。这就是交互层次的不同对效率的影响。
Cortana这样的语音助手除了解放了双手,它也是一个非常自然的输入方式。这让程序员和科学家们开始更多的研究人们语言后面的意图,从而提高计算机和人的交互层次。
Project Oxford和Azure Machine Learning这样的开放的人工智能组件真正把多年实验室里的玩具带给了全世界。这就像当年Siri的发布一样,虽然它不是***的,但没有它,就不会有google now和Cortana的迅速推出。好吧,又来一次:虽然Project Oxford只是个雏形,但是Project Oxford的推出给业界定义了人工智能组件更高层的接口标准,降低了人工智能的学习、应用门槛。特别是其中的语言模型。除了人工智能组件的开放,可以预见由各大公司基于大数据的各种数据模型也会很快共享。基于它们,人工智能的应用很快就会遍地开花,所有程序员都能创造出更智能的应用,从而每个人都可以有自己的个人助手。如果不能脑补个人助手的价值,请观看电影《她》(《Her》),看看人工智能是怎样帮忙处理电话和邮件的。
另一方面,在这一轮人工智能的热潮下,硬件公司们也开始制造采用人工智能算法的处理器,这也代表着新一代的编程语言和理念的开始流行了。
交互层次方面对程序员就有更大的挑战了:
- ***的挑战就是学习和适应新的编程理念。以前的程序都是if..else + while这样的确定性的结构化程序,程序员要开始学习如何写元程序。写出的程序是可以自己适应个体用户需求的,而不是写一段能够适应所有用户的程序。程序员的代码将是方向性的,统筹性的,而不再是细节的堆叠。
- 大开脑洞,如何结合全息交互和物联网等技术提高人机交互层次。帮助人们做事情10步并5步,5步并1步。比如,什么情况下抬手表示要喝水,抬头表示想开灯,甚至无需特定动作;真正帮助人们管理时间,协调日程,而不仅仅是一个日程表。
总而言之,这里描述的未来可能需要10年、20年或更长。也许我们这代程序员已经退出江湖了。热点将不再是发明各种语言、发现各种工程管理方式和软件设计模式了,而是科技如何进一步的以人为本,促进生产力发展。对程序员的挑战除了要学习和探索新的输入输出方式,还要学会人工智能这样的完全不同的编程理念。
【编辑推荐】
2015-10-15 17:11:47