单个花生超产（打一芯片技术）-51CTO.COM

单个花生超产（打一芯片技术）

谜底：多核

[[8828]]

一个花生要是超产了，必定有多个果仁儿，对吧？果仁儿又叫做“核儿”，所以这个谜底就是“多核”下面介绍一些有趣的多核知识。

多内核是指在一枚处理器中集成两个或多个完整的计算引擎(内核)。多核技术的开发源于工程师们认识到，仅仅提高单核芯片的速度会产生过多热量且无法带来相应的性能改善，先前的处理器产品就是如此。他们认识到，在先前产品中以那种速率，处理器产生的热量很快会超过太阳表面。即便是没有热量问题，其性价比也令人难以接受，速度稍快的处理器价格要高很多。

英特尔工程师们开发了多核芯片，使之满足“横向扩展”（而非“纵向扩充”）方法，从而提高性能。该架构实现了“分治法”战略。通过划分任务，线程应用能够充分利用多个执行内核，并可在特定的时间内执行更多任务。多核处理器是单枚芯片（也称为“硅核”），能够直接插入单一的处理器插槽中，但操作系统会利用所有相关的资源，将它的每个执行内核作为分立的逻辑处理器。通过在两个执行内核之间划分任务，多核处理器可在特定的时钟周期内执行更多任务。

多核架构能够使用的软件更出色地运行，并创建一个促进未来的软件编写更趋完善的架构。尽管认真的软件厂商还在探索全新的软件并发处理模式，但是，随着向多核处理器的移植，已有软件无需被修改就可支持多核平台。操作系统专为充分利用多个处理器而设计，且无需修改就可运行。为了充分利用多核技术，应用开发人员需要在程序设计中融入更多思路，但设计流程与对称多处理 (SMP) 系统的设计流程相同，并且单线程应用也继续运行。

得益于线程技术的应用在多核处理器上运行时将显示出卓越的性能可扩充性。此类软件包括多媒体应用（内容创建、编辑，以及本地和数据流回放）、工程和其他技术计算应用以及诸如应用服务器和数据库等中间层与后层服务器应用。

多核技术能够使服务器并行处理任务，此前，这可能需要使用多个处理器，多核系统更易于扩充，并且能够在更纤巧的外形中融入更强大的处理性能，这种外形所用的功耗更低、计算功耗产生的热量更少。多核技术是处理器发展的必然。

为什么要发展多核

为什么不能用单核的设计达到用户对处理器性能不断提高的要求呢？答案是功耗问题限制了单核处理器不断提高性能的发展途径。

作为计算机核心的处理器就是将输入的数字化的数据和信息，进行加工和处理，然后将结果输出。假定计算机的其他子系统不存在瓶颈的话，那么影响计算机性能高低的核心部件就是处理器。反映在指令上就是处理器执行指令的效率。

处理器性能 = 主频 x IPC

从上面的公式可以看出，衡量处理器性能的主要指标是每个时钟周期内可以执行的指令数(IPC: Instruction Per Clock)和处理器的主频。其实频率就是每秒钟做周期性变化的次数，1秒钟只有1次时钟周期的改变叫1Hz(赫兹)。主频为1GHz 就是1秒钟有10亿个时钟周期。

因此，提高处理器性能就是两个途径：提高主频和提高每个时钟周期内执行的指令数(IPC)。处理器微架构的变化可以改变IPC，效率更高的微架构可以提高IPC从而提高处理器的性能。但是，对于同一代的架构，改良架构来提高IPC的幅度是非常有限的，所以在单核处理器时代通过提高处理器的主频来提高性能就成了唯一的手段。

不幸的是，给处理器提高主频不是没有止境的，从下面的推导中可以看出，处理器的功耗和处理器内部的电流、电压的平方和主频成正比，而主频和电压成正比。

因为： “处理器功耗正比于电流x 电压 x 电压 x 主频”，“主频正比于电压”

所以：“处理器功耗正比于主频的三次方”

如果通过提高主频来提高处理器的性能，就会使处理器的功耗以指数(三次方)而非线性(一次方)的速度急剧上升，很快就会触及所谓的“频率的墙”(frequency wall)。过快的能耗上升，使得业界的多数厂商寻找另外一个提高处理器性能的因子，提高IPC。

提高IPC可以通过提高指令执行的并行度来实现，而提高并行度有两种途径：一是提高处理英特尔®酷睿™ 架构5大优势器微架构的并行度；二是采用多核架构。

在采用同样的微架构的情况下，为了达到处理器IPC的目的，我们可以采用多核的方法，同时有效地控制功耗的急剧上升。为什么？看看下面的推导。

因为：“处理器功耗正比于电流x 电压 x 电压 x 主频”，“IPC 正比于电流”

所以：“处理器功耗正比于 IPC”

由单核处理器增加到双核处理器，如果主频不变的话，IPC理论上可以提高一倍，功耗理论上也就最多提高一倍，因为功耗的增加是线性的。而实际情况是，双核处理器性能达到单核处理器同等性能的时候，前者的主频可以更低，因此功耗的下降也是指数方(三次方)下降的。反映到产品中就是双核处理器的起跳主频可以比单核处理器更低，性能更好。

由此可见，将来处理器发展的趋势是：为了达到更高的性能，在采用相同微架构的情况下，可以增加处理器的内核数量同时维持较低的主频。这样设计的效果是，更多的并行提高IPC，较低的主频有效地控制了功耗的上升。

除了多核技术的运用，采用更先进的高能效微架构可以进一步提高IPC和降低功耗——即提高能效。基于英特尔®酷睿™ 架构的英特尔® 酷睿™ 2 双核处理器和至强处理器就是现实中的例子。相比英特尔前一代的NetBurst 微架构(Intel® Pentium® 4 和Pentium® D)，酷睿微架构采用的英特尔® 宽区动态执行引擎和英特尔® 高级数字媒体增强技术，就是提高IPC的创新技术；英特尔® 智能功率特性则是降低微架构功耗的技术。

一些芯片的厂商指出，当处理器的频率达到某种程度后，处理器在工作量的要求会比速度的要求要大，且0.13微米所含的晶体管已很高，将来65纳米和45纳米，其1组光罩的成本会倍增。但是，这种成本成倍的增长并不会给厂商们带来相应的收入增长。且发热量和干扰的因素的介入使得集成度和处理器的频率已经越来越趋近于一个极限。

因此，使摩尔定律失效的有可能是技术，有可能是经济效益。

处理器实际性能是处理器在每个时钟周期内所能处理器指令数的总量，因此增加一个内核，理论上处理器每个时钟周期内可执行的单元数将增加一倍。原因很简单，因为它可以并行的执行指令，含有几个内核，单位时间可以执行的指令数量上限就会增加几倍。而在芯片内部多嵌入几个内核的难度要远远比加大内核的集成度要简单很多。于是，多核就能够在不提高生产难度的前提下，用多个低频率核心产生超过高频率单核心的处理效能，特别是服务器产品需要面对大量并行数据，多核心分配任务更能够提高工作效率。可以看作一种多处理器协作的微缩形式，并且达到更加的性能价格比，一套系统达到多套系统的性能。

多核的介入，使得摩尔定律在另一个层面的意义上，避免了尴尬的局面。从单核到双核到多核的发展就证明了摩尔定律还是非常正确的。从单核到双核再到多核的发展，可能是摩尔定律问世以来在芯片发展历史上速度最快的性能提升过程。"