(文章来自电脑报2008年第27期D版)

  (电脑报2008年第27期)在Intel的新一代Nehalem处理器中,英特尔推出了名为QuickPath Interconnect(简称QPI)的总线技术,该技术将取代陪伴了我们多年的前端总线(FSB)技术,成为新一代CPUCPUCPU与芯片组(CPU与内存)之间的连接总线,一推出便吸引了众多人的眼球。

FSB正离我们而去

  众所周知,前端总线(Front Side Bus,简称FSB)是将CPU连接到北桥芯片的总线,是CPU和外界交换数据的最主要通道。前端总线的数据传输能力对计算机整体性能影响很大,如果没足够宽的前端总线带宽,即使配备再强的CPU,用户也不会明显感觉到计算机整体速度的提升。

  目前Intel处理器主流的前端总线频率有800MHz、1066MHz、1333MHz几种,而就在2007年11月,Intel再度将处理器前端总线提升至1600MHz(默认外频400MHz),这比2003年最高端的800MHz FSB总线频率整整提升了一倍。这样高的前端总线频率,其带宽有多大呢?前端总线为1333MHz时,处理器与北桥之间的带宽是10.67GB/s,而提升到1600MHz能达到12.80GB/s,增加了20%。

  虽然Intel处理器的前端总线频率看起来已很高,但与同时不断提升的内存频率、高性能显卡(特别是双或多显卡系统)相比,CPU与芯片组存在的前端总线瓶颈仍未根本改变。例如1333MHz的FSB所提供的内存带宽是1333MHz×64bit/8=10667MB/s=10.67GB/s,其与双通道的DDR2 667正好匹配,但如果使用双通道的DDR2 800、DDR2 1066的内存,这时候FSB的带宽就小于内存的带宽。更不用说和未来的三通道高频率DDR3内存搭配了(Nehalem平台DDR3 1333内存的带宽可达32GB/s)。

  与AMD的HyperTransport(HT)总线技术相比,FSB的带宽瓶颈也很明显。HT作为AMD主板CPU上广为应用的一种端到端总线技术,它可在内存控制器、磁盘控制器以及PCI-E总线控制器之间提供更高的数据传输带宽。HT 1.0在双向32bit模式的总线带宽为12.8GB/s,其带宽便可匹敌目前最新的FSB带宽。2004年AMD推出的HT 2.0规格,最大带宽又由1.0规格的12.8GB/s提升到了22.4GB/s。而最新的HT 3.0又将工作频率从HT 2.0最高的1.4GHz增到2.6GHz,提升幅度几乎又达一倍。这样,HT 3.0在2.6GHz高频率32bit高位宽的运行模式下,它即可提供高达41.6GB/s的总线带宽(即使在16bit位宽下它也能提供20.8GB/s带宽),相比FSB优势明显,应付近两年内内存、显卡和处理器的未来需要也没有问题。

  面对这种带宽上劣势,虽然Intel通过对市场的准确把握,以及其他优势技术上的弥补(如指令集的优势、如在CPU效率上Intel的酷睿2双核共享二级缓存互联架构要明显优于AMD HT互联下的双核架构等等),让AMD的带宽优势并没因此转化为胜势,但Intel要想改变这种其处理器和北桥设备间带宽捉襟见肘的情况,纵使在现有技术上将FSB频率进一步提高到2133MHz,也难以应付未来DDR3内存及多显卡系统所带来的带宽需求。Intel推出新的总线技术势在必行。

 

当世界失去FSB,我们还有QPI

  Intel自身也清醒地认识到,要想再通过单纯提高处理器的外频和FSB,已难以象以前那样带来更好的性能提升。采用全新的Nehalem架构的Intel的下一代CPU让我们看见了英特尔变革的决心。预计在2008年第四季度正式发布,基于该架构的代号为Bloomfield的第一款核心可窥见其很多技术的细节——该处理器拥有全新的规格和性能,采用全新的Socket 1366接口,45nm制程,集成三通道DDR3内存控制器(支持DDR3 800/1066/1333/1600内存规格),使用新总线QPI与处理器进行连接,支持SMT(Simultaneous Multi-hreading,单颗处理器就可以支持8个线程并行运作)多线程技术,支持SSE4.2指令集(增加了7条新的SSE4指令),是Intel第一款原生四核处理器……

  当然,在其拥有的众多的新技术中,最引人注目的技术应该还是QPI(原先宣传的CSI总线)新总线技术,它是全新的Nehalem架构之所以能在架构、功能和性能上取得大突破的关键性技术。

 

 

QPI架构图

 

QPI能给我们带来什么? 

QPI使CPU中集成内存控制器

  QPI是在处理器中集成内存控制器的体系架构,主要用于处理器之间和系统组件之间的互联通信(诸如I/O)。它抛弃了沿用多年的FSB设计,CPU可直接通过内存控制器访问内存资源,而不是以前繁杂的“前端总线→北桥→内存总线”模式。并且,与AMD在主流的多核微处理器上采用的4 HT3连接方式不同,英特尔使用了4+1 QPI互连方式(4针对处理器设计,1针对I/O设计),这样多处理器的每个处理器都能直接与物理内存相连,每个处理器之间也能彼此互联来充分利用不同的内存,可让多处理器的等待时间变短(访问延迟可以降低50%以上),只用一个内存插槽就能实现与四路皓龙处理器同等的带宽。

QPI、处理器间峰值带宽可达96GB/s

  在高端的安腾系统中,QPI高速互连方式使得CPUCPU之间的峰值带宽可达96GB/s,峰值内存带宽可达34GB/s。这主要在于QPI采用了与PCI-E类似的点对点(Point-to-Point)设计,包括4条通路,每个通路(Lanes)包括一对线路,分别负责数据发送和接收,每一条通路可传送20bit数据。这就意味着即便是最早的QPI标准,其传输速度也能达到6.4GB/s——相当于每个连接能传输的单向带宽总计带宽可达到25.6GB/s(为FSB 1600MHz的12.8GB/s的两倍)。这样的带宽已可媲美AMD目前的总线解决方案,能满足未来CPUCPUCPU与芯片组间的数据传输需求。

● 多核间互传送资料不需经过芯片组


 


QPI的直接传输模式图


  QPI总线可实现多核处理器内部的直接互联,而无须如以前那样还要再经过FSB进行连接。例如,针对服务器的Nehalem处理器将拥有至少4组QPI传输,可至少组成包括4枚处理器的4路高端服务器系统(也就是16枚运算内核至少32线程并行运作)。而且在多处理器作业下,每颗处理器可以互相传送资料,并不需经过芯片组,从而大幅提升整体系统性能。随着未来Nehalem架构的处理器集成内存控制器、PCI-E 2.0图形接口乃至图形核心,QPI架构的优势将进一步发挥出来。
 
QPI使CPU中集成PCI-E控制器的架构

  因为QPI的高带宽,让Intel进一步集成了PCI-E控制器(限于工艺要求,Nehalem的首款产品并未集成内存和PCI-E控制器),这让传统的北桥芯片将不复存在,使未来英特尔的芯片组可进入单芯片时代,只需由一枚I/O芯片(即传统意义上的南桥)即可完成与外围设备的通讯。未来的主板将因此更廉价化,199元的入门级主板不再是梦。

QPI互联架构本身具有升级性

  QPI采用串联方式作为讯号的传送,采用了LVDS(低电压差分信号技术,主要用于高速数字信号互联,使信号能在差分PCB线对或平衡电缆上以几百Mbps以上的速率传输)讯号技术,可保证在高频率下仍能保持稳定性。QPI拥有更低的延迟及更良好的架构,将包括集成的存储器控制器技术以及改善的系统组件间通信链路。

  Nehalem平台将具备很好的扩展弹性,因为QPI互联架构的数量可以根据用户将来对中央处理器的需要进行增加或者减少。QPI具备的这种可让Nehalem中央处理器体系架构可扩展性的特点,不受核心的限制,这对于构建服务器高性能集群非常有利。

QPI总线架构具备高可靠性和性能

  可靠性,实用性和适用性特点为QPI的高可用性提供了保证。比如链接级循环冗余码验证(CRC),自愈型连接能避开错误区域重新进行自我配置来启用连接中好的部分。出现时钟密码故障时,时钟能自动改路发送到数据信道。QPI还具备热插拔能力来支持诸如处理器卡这种节点的热插拔。深度改良的微架构、集成内存控制器设计以及QPI直连技术,令Nehalem拥有更为出色的执行效率,在单线程同频率条件下,Nehalem的运算性能在相同功耗下比现行Penryn架构的效能同比提高30%。

写在最后:QPI对业界带来的影响

  虽然目前对Intel的新平台(特别是移动平台)能否在未来通过新的制造工艺获得完美的低功耗怀疑不少,但英特尔QPI仍可称得上目前最完美的总线架构,它具备了酷睿处理器高指令解码能力、出色的每瓦性能的优点,又兼具了以前一直欠缺的集成内存控制器高速直连的特性,将大大改善未来Intel CPUCPUCPU与内存间的带宽瓶颈,将让它们间能更好的实现更短延时的快捷通讯,所以一经推出便赢得了行业的广泛支持与赞同。

  在QPI新总线技术的支持下,可以预见的是,以后的系统性能将进一步增强,更符合摩尔定律发展的规律。也正是在QPI总线的强力支持下,Intel的新平台有望告别已略显过时的南北桥芯片组架构,进入更符合时代潮流的单芯片组(只保留南桥芯片)架构。并且,在QPI总线的强力支持下,CPU集成较高性能的GPU将不再是一句空话——预计在2009年第二季度末推出的第三款Nehalem架构的“Havendale”处理器便将直接集成GPU(将图形核心做成一枚单独的芯片,然后将它与CPU封装在一起)。

  当然,做为行业领导性厂商,每次Intel平台的进步都是有人欢喜有人愁。比如,AMD面临着该如何追赶Intel处理器革新速度的问题,如果未来AMD无法跟上英特尔的步伐,其市场份额肯定将变得越来越小。当然,AMD有其过硬的显卡技术支撑,这正是目前Intel所欠缺的,AMD CPU如真能将其GPU整合,带来的市场影响力也是巨大的。

  而相较之下,目前处境比较尴尬的倒是NVIDIA,Intel的目标是CPU整合GPU,而NVIDIA的目标则是GPU整合CPU和自造CPU,虽然NVIDIA自身对其信心满满,但NVIDIA能否取得QPI总线的专利授权目前情况不明。从目前的竞争形势来看,Intel再很难以免费或低价的方式为NVIDIA发放授权,NVIDIA以后想生产基于Intel平台的产品,很可能将面临高额授权费,以及因此带来的产品价格居高不下。并且,即便是Intel再度免费授权,面对只需一枚I/O芯片的Nehalem主板平台,第三方芯片组厂商已难有大展拳脚之地。反而是Intel CPU整合GPU策略如果成功,将对NVIDIA赖以生存的低端、中低端显卡市场产生致命性的打击,NVIDIA的出路或许只有自研CPU或收购VIA等处理器厂商,重整旗鼓。

  当然,无论是站在媒体还是消费者的角度来说,在对QPI带来的新特性表示欣喜的同时,我们同样不希望将来出现处理器、主板芯片组乃至显卡市场一家独霸的情况,这样无论对于整个市场还是消费者来说都是弊大于利的。因此、NVIDIA和AMD还要多多努力才好。

Felix 發表在 痞客邦 PIXNET 留言(0) 人氣()