2009年:英特爾與AMD服務(wù)器市場(chǎng)對(duì)對(duì)碰
為很值得期待,但我們也沒有忘記在x86服務(wù)器CPU市場(chǎng)中,并不是英特爾的獨(dú)角戲,它頑強(qiáng)的競(jìng)爭(zhēng)對(duì)手AMD仍然在這個(gè)市場(chǎng)中擁有著自己可觀的支持者。而在2008年里,AMD推出了其第一代45nm處理器“上海”(Shanghai),雖然仍然屬于第三代Opteron(晧龍)家族,但也有很多細(xì)微的變化,這無疑將使得2009年的服務(wù)器市場(chǎng)越發(fā)精彩。那么我們就來看看在新的一年中,英特爾與AMD將呈現(xiàn)出怎樣的競(jìng)爭(zhēng)態(tài)勢(shì)。
AMD新軍“上海”:神秘與困惑并行
在2008年的11月13日,AMD正式推出了其首款45nm Opteron處理器,但并沒有以第四代Opteron自居,從中可以看出它與第三代Opteron仍然是一家人,也就預(yù)示著其在內(nèi)部結(jié)構(gòu)上并沒有質(zhì)的變化,而更多的是一種“量變”式的增強(qiáng)。不過,在AMD的介紹中,筆者倒是覺得有些困惑,也讓這款處理器顯得有些神秘。
首先,我們知道AMD引以為榮的點(diǎn)對(duì)點(diǎn)處理器互聯(lián)架構(gòu)是其一大法寶,這個(gè)架構(gòu)的基礎(chǔ)就是AMD主導(dǎo)開發(fā)的開放式點(diǎn)對(duì)點(diǎn)總線技術(shù)HyperTransport,簡(jiǎn)稱HT。從早前的第三代65nm Opteron(即Barcelona,巴塞羅那)的介紹中,我們可以看出它就已經(jīng)采用了3條HT總線的設(shè)計(jì),而在這一點(diǎn)在“上海”身上并沒有變化,可是在一些規(guī)格上卻有了不同
在Barcelona的設(shè)計(jì)中,雙路的2xxx中3條HT總線中有一條負(fù)責(zé)與另外的CPU互聯(lián),另外兩條負(fù)責(zé)I/O處理,8xxx的3條HT都可用于CPU的互聯(lián),每條HT總線的總位寬是16bit。根據(jù)AMD的計(jì)劃,將會(huì)全面推行HT 3.0標(biāo)準(zhǔn),那么以現(xiàn)有的規(guī)格計(jì)算,采用2GHz時(shí)鐘的HT 3.0在16bit總位寬下的帶寬正好是8GB/s,三條共24GB/s,與其宣傳相符。也就是說,Barcelona用于CPU間互聯(lián)的帶寬為8GB/s,可是在Shanghai的新特性介紹中,我們看到的數(shù)值卻遠(yuǎn)高于此AMD給出的Shanghai新特性介紹,包括了45nm工藝帶來的好處(比如更高的主頻,更節(jié)能)、可支持DDR2-800(Barcelona只支持到DDR2-667)、可以更節(jié)能的智能預(yù)取、增強(qiáng)的快速虛擬化索引(RVI)以及更高的CPU間互聯(lián)帶寬,上圖標(biāo)注的17.6GB/s明顯高于Barcelona的8GB/s
這點(diǎn)讓筆者有些琢磨不透,而在上海的發(fā)布會(huì)上,我們也確定了其并沒有在HT頻率上做什么明顯的手腳,仍然在HT 3.0的范圍內(nèi)。那么我們的疑問來了,在4.4GTs的傳輸率下,如何達(dá)到17.6GB/s的總帶寬呢?顯然位寬是32bit,可Barcelona的設(shè)計(jì)是3條各16bit的HT總線,每條最高8GB/s的帶寬。如果Shanghai是在Barcelona的基礎(chǔ)上改進(jìn)而來,那么在總體的架構(gòu)上就不可能很大的變動(dòng),但CPU間互聯(lián)帶寬提升如此之大,我們也就有足夠的理由懷疑了。對(duì)此,筆者分析有兩種可能:
1、AMD的介紹有些誤導(dǎo),17.6GB/s是指CPU的I/O總帶寬而不是CPU間互聯(lián)的帶寬,如果這么考慮,那一切也就順理成章了(兩條HT總線,總位寬32bit,傳統(tǒng)率為4.4GTs)。
2、Shanghai將兩條HT用在CPU間的互聯(lián),只有一HT用在了I/O。
如果細(xì)分析,我認(rèn)為,第二種可能性很小,因?yàn)镾hanghai還有4路/8路的設(shè)計(jì),但HT總共就3條,若是用兩條HT來聯(lián)接CPU顯然是不合理的,所以筆者最終斷定Shanghai的CPU互聯(lián)帶寬現(xiàn)在仍然是8GB/s,到2009年第二季度全面升級(jí)后將提升至8.8GB/s。
對(duì)比英特爾的Nehalem架構(gòu),我們就能看出來Opteron原先的HT優(yōu)勢(shì)在2009年面對(duì)前者的QPI總線(Nehalem-EP的CPU間互聯(lián)與I/O帶寬均為25.6GB/s)時(shí)以處于下風(fēng),這主要體現(xiàn)在傳輸位寬小,傳輸頻率低。當(dāng)然,HT也是在進(jìn)步的,在2008年7月23日,HT組織發(fā)布了最新的HT 3.1標(biāo)準(zhǔn),從中可以看出至于在頻率上與QPI已經(jīng)相當(dāng)了,可是Opteron
特性比較 | HT 1.0 | HT 2.0 | HT 3.0 | HT 3.1 |
最大時(shí)鐘頻率 | 800Mhz | 1.4Ghz | 2.6Ghz | 3.2Ghz |
最大傳輸速率 | 1.6GT/s | 2.8GT/s | 5.2GT/s | 6.4GT/s |
最大總線帶寬(每項(xiàng)32位,雙向合計(jì)) | 12.8GB/s | 22.4GB/s | 41.6GB/s | 51.2GB/s |
AC操作 | NO | NO | Yes | Yes |
通過AD/DC自動(dòng)檢測(cè)與配置進(jìn)行電容遇合 | ||||
鏈路分割(非固定連接) | NO | NO | Yes | Yes |
每個(gè)HT鏈路可分割為兩個(gè)1/2位寬的鏈路 | ||||
熱插拔 | No | No | Yes | Yes |
動(dòng)態(tài)鏈路時(shí)鐘/帶寬調(diào)整 | No | No | Yes | Yes |
DirectPacket數(shù)據(jù)流 | 僅1.1 | Yes | Yes | Yes |
可增加16個(gè)虛擬通道(總共22個(gè)),支持對(duì)等網(wǎng)絡(luò)聯(lián)接,本地封包處理 | ||||
PCI Express影射 | No | Yes | Yes | Yes |
其次,另一個(gè)讓比較迷惑的一點(diǎn)就是仍然采用DDR2內(nèi)存,這在當(dāng)前大談綠色節(jié)能的背景下,顯得有些不可思議。DDR2的接班人DDR3在節(jié)能方面有著更好的表現(xiàn)(工作電壓降低了0.3V,理論能耗降低了16.7%),而且傳輸頻率比DDR2要高出近一倍。如果說DDR3因?yàn)槌杀镜脑虿粫?huì)在臺(tái)式機(jī)市場(chǎng)過快的普及,但對(duì)于更注重能耗的移動(dòng)和服務(wù)器市場(chǎng),DDR3理應(yīng)更受關(guān)注(當(dāng)初DDR2內(nèi)存也是率先在這兩個(gè)市場(chǎng)普及的)。也許Shanghai是為了最大限度與現(xiàn)有市場(chǎng)兼容,歷史上AMD也向來是穩(wěn)扎穩(wěn)打的,勇于挑起產(chǎn)業(yè)變化的是其競(jìng)爭(zhēng)對(duì)手英特爾(如Rambus DRAM和FB-DIMM的采用,此次DDR3也走在了前面)。但我們可以注意到,在HT總線上,雖然AMD宣稱Shanghai可以向下兼容,可是如果要想達(dá)到最佳的效果,還是必須要有新的支持4.4GTs的平臺(tái),那么為什么不能勇敢的采用DDR3呢?按照AMD的路線圖,到2010年才會(huì)轉(zhuǎn)向DDR3平臺(tái),我甚至有些懷疑是不是AMD在技術(shù)開發(fā)能力上出現(xiàn)了什么問題?
總之,AMD長(zhǎng)期以來最值得驕傲的兩大優(yōu)勢(shì)——點(diǎn)對(duì)點(diǎn)傳輸總線與集成內(nèi)存控制器,在Shanghai這一代將不復(fù)存在,反而將要開始追趕后來居上的對(duì)手,這的確讓筆者有些感嘆。
因此不得不說,Shanghai的發(fā)布在筆者的眼中有些神秘和困惑。當(dāng)然相對(duì)于Barcelona的進(jìn)步肯定是有的,主頻與內(nèi)存帶寬的提升無疑對(duì)性能有直接的幫助,只是如果自己進(jìn)步的步伐不如手快的話,那么就要相當(dāng)小心了。