英特尔每年年初都有向业界汇报其重要技术研发进展的习惯,在2月中旬于旧金山召开的“2007年国际固态电路研讨会(简称ISSCC 2007)”上,它就展示了全球首款具备每秒万亿次浮点运算性能的可编程处理器(下文简称“万亿级处理器”)研究用原型产品,并声称要在未来5-10年内完成这种处理器的产品化,将其推广到服务器、PC和手持设备中,让用户在这些产品上获得万亿级计算、即每秒处理万亿字节数据的应用体验。
对于业界来说,英特尔公布的上述信息绝对算得上是一颗重磅炸弹,其威力主要来源于两方面:首先是它要在单颗处理器上实现目前许多颗顶级服务器处理器“合力”才能达到的性能。据了解,全球第一个触到万亿次浮点运算性能标竿的,就是英特尔1996年为美国Sandia国家实验室开发的ASCI Red超级计算机,可该系统足足配备了近1万颗奔腾Pro处理器。即使是今天在IA服务器处理器市场上傲视群雄的双核安腾,在四路的配置下也只能实现约每秒450亿次的浮点运算能力。相比之下,单颗处理器即可支持万亿次浮点计算能力的意义已无庸赘言。
其次,也是最让业界感到震撼的,即英特尔并不打算将这种万亿级处理器的用途局限于高性能或企业计算领域,还要把它打入个人消费级计算产品,换言之,英特尔就是要让万亿级计算这个“今”日王谢堂前燕,尽快飞入寻常百姓家。
不过,与以往的技术下移相比,万亿级计算走向平民化的“落差”实在太大,而且这一构想要在未来5-10年内实现,看起来就更像是一次豪赌,若非英特尔拿出了性能达标的万亿级处理器原型产品,人们恐怕还很难预测它能有多大胜算。
英特尔万亿级处理器原型揭秘
谈到英特尔万亿级处理器原型产品,其实它还有一个更加形象和为人们熟悉的名称——英特尔80核处理器,它最显著的特征就是在面积为275平方毫米、尺寸仅比拇指指甲盖略大的硅片(Die)上通过“瓷砖片”平辅设计、以8×10的布局集成了80个完全相同的简单内核(英特尔称这些内核为Tile,即瓷砖片)。
据了解,这些内核的单位面积为3平方毫米,主要由两个单周期单精度可编程浮点引擎、寄存器组、3KB指令缓存、2KB数据缓存及拥有5个39位端口的路由器组成。为了简化设计,英特尔没有在这些内核上采用X86架构,而是选择了与安腾EPIC架构类似的96位VLIW(超长指令字)架构。
除在指令架构上与英特尔现有处理器不同外,这款原型产品的晶体管集成密度也出乎人们的意料。目前基于65纳米制程的酷睿2双核处理器在143平方毫米的硅片上集成了2.91亿晶体管,相比之下,采用同一制程生产出来的万亿级处理器原型产品硅片面积虽然大了近一倍,但集成的晶体管数量却只有约1亿个。造成这一结果的原因有二:一是这款原型产品只是一个用于实验室研究的样品,内核较为简单,没有像酷睿2一样配备大容量的缓存;二是它把不少硅片面积留给了内核与内核之间的数据连线。
[1] [2] [3] 下一页 |