74項嚴(yán)刑拷打 Intel Core i7性能完全解析
Tock年來到 酷睿2升級酷睿i7
2006年,Intel發(fā)布名為酷睿2的Core架構(gòu)處理器,隨后,Tick-Tock計劃啟動。
2007年,Tick年,Intel于11月份正式發(fā)布首款采用45納米制程的處理器——Core 2 Extreme QX9650。
2008年,Tock年,Intel將于11月中旬正式發(fā)布新一代的微架構(gòu)處理器——Core i7(研發(fā)代號:Nehalem)……
為什么叫i7?互聯(lián)網(wǎng)上有一種比較有意思的解釋:從Pentium 4開始,到后來的Pentium D、Core 2 Duo,i7剛好是第七代產(chǎn)品。雖然Intel官方并沒有對這種猜測進(jìn)行回應(yīng),但我們相信這其中必有原因。
時鐘開始倒計時,距離Core i7正式發(fā)布的時間已經(jīng)越來越近,相對于上一代酷睿2處理器,它有哪些性能方面的提升?它到底適合什么樣的用戶?它能否順利替代當(dāng)前酷睿2旗艦產(chǎn)品?它還有哪些方面的不足?74項瘋狂的測試項目將為您一一揭曉這些問題的答案……
#p#page_title#e#
● 制程和架構(gòu) CPU性能提升兩大法寶
眾所周知,排除時鐘頻率的差異,從根本上提升處理器性能的途徑有兩個:
1、更新制程。制造工藝的改進(jìn)理論上可以帶來功耗的降低,使得產(chǎn)品的默認(rèn)時鐘頻率可以更高,直接提升性能。同時如果在更新制造工藝的同時對微架構(gòu)進(jìn)行細(xì)微的調(diào)整,那么產(chǎn)品的性能也會得到提升。45納米的酷睿2處理器就是一個典型的例子。
基于45納米制程的雙核心Core架構(gòu)處理器內(nèi)核圖
Intel全新Nehalem架構(gòu)圖
2、更新微架構(gòu)。從奔騰4時代的NetBurst切換到Core架構(gòu)后的Intel,一舉擊敗了曾經(jīng)風(fēng)光一時的K8架構(gòu),幫助Intel重新登上性能王寶座。Core i7雖然商標(biāo)名稱仍然為酷睿,但產(chǎn)品的架構(gòu)已經(jīng)從Core更新為Nehalem,并且仍然采用高-K材料設(shè)計的45納米制程打造,因此在性能上的表現(xiàn)值得期待。關(guān)于45納米制程,我們之前已經(jīng)進(jìn)行了大量的介紹,因此在進(jìn)入測試環(huán)節(jié)之前,我們還需重點對Nehalem架構(gòu)進(jìn)行介紹。
#p#page_title#e#
● LGA 775散熱器全廢 Nehalem針腳有變化
自Intel“9”系列主板芯片組開始,CPU針腳被移植到了主板上,改為觸點式封裝的LGA 775處理器可以非常有效地避免在運輸過程中出現(xiàn)損傷。Core架構(gòu)發(fā)布以后,這種封裝方式被延續(xù)下來,而所有酷睿2處理器也采用LGA 775陣腳,與上一代的奔騰4、奔騰D接口完全兼容。但到了Nehalem架構(gòu)雖然也延續(xù)了觸點式封裝,但卻將產(chǎn)品的針腳更改為LGA 1366和LGA 1160(不久前有傳言又改為LGA 1156),其中LGA 1366處理器面積由原來的37.5mm*37.5mm提升為42.5mm*45mm。
Core i7 Extreme 965與QX9770背面對比
代號為Bloomfield的四核心Core i7處理器全部產(chǎn)品會采用LGA 1366封裝,針對主流市場的桌面級四核心處理器Lynnfield以及Cleaksfield將會采用LGA 1160(也可能是LGA 1156),而未來整合GPU功能的代號為Havendale的桌面雙核產(chǎn)品則將在更晚時候發(fā)布,同樣采用LGA 1160封裝,不過接口定義可能與Lynnfield有些不同,因此可能相關(guān)主板不會兼容。
LGA 775扣具的散熱器無法再兼容新的平臺
采用LGA 1366和LGA 1160(LGA 1156)接口后,主板的孔距直接提升為80mm和75mm,因此LGA 775平臺的散熱器無法兼容最新平臺,雖然這種設(shè)計為主板及散熱器廠商帶來了一些麻煩,但通過接口的差異化設(shè)計,Intel將頂級玩家與主流用戶直接分離出來,一定程度上有助于后續(xù)服務(wù)的針對性進(jìn)行。
#p#page_title#e#
● 為何只有133外頻? QPI總線替代FSB
由于采用了全新的微架構(gòu)設(shè)計,Core i7的規(guī)格相比以前有了大幅度改變。其首批上市的型號中最高端的Extreme 965主頻達(dá)到3.2GHz,與上代產(chǎn)品QX9770持平,但卻采用了133MHz*24這種低外頻、高倍頻的設(shè)計,與QX9770 400MHz*8的方式完全不同。我們知道,依賴于FSB總線傳輸,Intel 奔騰4、酷睿2 處理器都非常依賴處理器外頻,為何這次的旗艦級產(chǎn)品外頻卻只有133MHz呢?
Core i7 Extreme 965 CPU-Z規(guī)格:超低外頻*高倍頻設(shè)計
因為Nehalem架構(gòu)采用了全新的QPI總線。隨著處理器核心數(shù)量的增多,繼續(xù)公用一條FSB總線顯然已經(jīng)力不從心,為了改變FSB的瓶頸,Intel Nehalem架構(gòu)采用了類似于Hyper-Transport總線的全新數(shù)據(jù)傳輸總線Quick Path Interconnect,讓其與內(nèi)存直接交換數(shù)據(jù)。QPI總線的連接方式更加靈活,它可以將處理器的每顆核心分割為獨立的小塊,每個核心之間也可以通過QPI總線進(jìn)行連接,根據(jù)市場定位,QPI總線的條數(shù)會進(jìn)行調(diào)整。目前桌面級CPU的QPI總線為1條,但服務(wù)器級別的Nehalem處理器則會配備2條甚至4條QPI連接,因此QPI總線的引入讓Intel在服務(wù)器領(lǐng)域的競爭力大大加強(qiáng)。
Nehalem QPI架構(gòu)設(shè)計示意圖
與競爭對手相比,Intel桌面級處理器的QPI總線頻率最高可達(dá)6.4GT/s,即使是定位非旗艦的Core i7 920和940,也具備4.8GT/s頻率。QPI每個方向的的位寬可以為5、10、20bit,因此每個方向的QPI連接寬度可提供12-16GB/s帶寬,這樣一來一條QPI連接的帶寬可以達(dá)到24-32GB/s。
第一批Nehalem處理器使用了20bit的連接位寬,提供了大約25.6GB/s的數(shù)據(jù)傳輸能力,從理論上超越了競爭對手所采用的HyperTransport 3.0。QPI總線的引入也使得Intel可以更加保守地設(shè)定處理器外頻,將巨大的超頻空間留給玩家,因為一旦采用高倍頻設(shè)置,即便是小幅度的外頻提升也會讓CPU的時鐘頻率得到飛躍!
#p#page_title#e#
● CPU直接控制內(nèi)存 峰值帶寬32GB/s
講到QPI總線就不得不談?wù)凬ehalem處理器的內(nèi)存控制器。內(nèi)存控制器(integrated memory controller)簡稱IMC,由于Core i7通過QPI直接與內(nèi)存交換數(shù)據(jù),因此CPU內(nèi)部就必須集成一個控制內(nèi)存的部門。首批上市的Core i7內(nèi)存控制器支持3通道DDR3內(nèi)存規(guī)格,徹底拋棄DDR2。其三通道內(nèi)存默認(rèn)運行在DDR3-1066,也可以很容易地運行在DDR3-1333,以達(dá)到32GB/s的峰值帶寬。通過內(nèi)存控制器設(shè)計,Nehalem處理器達(dá)到了酷睿2處理器的4倍內(nèi)存帶寬,使得每個核心可以支持最大10個未解決的數(shù)據(jù)緩存命中失敗和總共16個命中失敗,比酷睿2的單核心8個總共14個提高了不少。
內(nèi)存控制器架構(gòu)圖
內(nèi)存控制器和QPI總線的結(jié)合工作,令數(shù)據(jù)延遲大大降低,直接的表現(xiàn)就是我們在運行大型軟件或大型3D游戲時的數(shù)據(jù)加載時間大大減少,這對無法忍耐長時間數(shù)據(jù)加載的玩家確實是一個利好消息。
玩Core i7 并非一定要插3條或6條內(nèi)存
另外,值得一提的是,雖然Core i7處理器是集成3通道DDR3內(nèi)存控制器,但并不表示我們必須搭配3條內(nèi)存或6條內(nèi)存來組建3通道系統(tǒng)才可以發(fā)揮其威力,筆者曾嘗試過采用2條內(nèi)存測試,結(jié)果表明在裝載2條內(nèi)存的情況下Core i7可以開啟雙通道模式,雖然與3通道相比在內(nèi)存帶寬上存在一定差距。
值得一提的是目前的32bit操作系統(tǒng)對4GB內(nèi)存的支持并不到位,而在2GB內(nèi)存配備已經(jīng)成為主流的情況下,Intel將3通道的規(guī)格引入也確實符合了現(xiàn)實。采用3條1GB內(nèi)存組成的3通道內(nèi)存系統(tǒng)將恰到好處地為整套平臺帶來內(nèi)存效能上的提升。
#p#page_title#e#
● 8MB L3 Cache引入 Core i7緩存架構(gòu)面目全非
Nehalem處理器的緩存架構(gòu)相對于之前的奔騰4、酷睿2產(chǎn)品,也有了較大的變化。隨著45納米制程的引入,酷睿2處理器的最大L2緩存已經(jīng)達(dá)到12MB,類似于FSB,繼續(xù)無休止地提升L2緩存并不一定能帶來明顯的效能改善,因此在Core i7上,我們看到了一個全新的緩存架構(gòu)。
依賴二級緩存的時代已經(jīng)過去
從Core i7的緩存架構(gòu)示意圖可以看出,它選用了共享L3緩存的方式來暫存數(shù)據(jù)。桌面級四核心處理器的產(chǎn)品動用了8MB L3緩存。4個核心除了共享8MB L3緩存外,每顆核心內(nèi)部還單獨具備256KB的L2緩存,另外還為每顆核心配備了與Core架構(gòu)極為類似的64KB L1緩存。
這里必須說一下緩存延遲問題。45納米酷睿2處理器的L2緩存延遲周期為15,而Intel工程師表示Nehalem架構(gòu)的L3緩存可以達(dá)到30-40周期,不過每顆核心獨立擁有的通用L2緩存周期只有12,因此L3帶來的高延遲問題一定程度上由L2進(jìn)行了彌補(bǔ)。另一方面,4顆核心共享L3緩存,在數(shù)據(jù)命中失敗后可直接重新從內(nèi)存尋找數(shù)據(jù),而不是在緩存中重新進(jìn)行偵測。Intel稱Nehalem上的L3緩存為Smart Cache,想必也是因為這些原因。
● SSE4.2指令集加入 辦公性能大幅提升
45納米加入了SSE4.1指令集,令處理器的多媒體處理能力得到最大70%的提升。在Nehalem架構(gòu)的Core i7處理器中,SSE4.2指令集被引入,加入了STTNI(字符串文本新指令)和ATA(面向應(yīng)用的加速器)兩大優(yōu)化指令。
Nehalem架構(gòu)加入SSE4.2指令集
STTNI主要針對XML進(jìn)行文檔和數(shù)據(jù)處理進(jìn)行優(yōu)化,使這一方面的應(yīng)用性能達(dá)到上一代產(chǎn)品的3.8倍。ATA則主要增加CRC32計算校驗碼,另一方面讓POPCNT用來計算一個16/32/64位整數(shù)里面中多少個為1的位。
目前Intel C++ Compiler 10.x和Microsoft Visual Studio 2008 VC++均已經(jīng)實現(xiàn)了對于SSE4.2的支持。具備SSE4.2指令集的Nehalem Core i7處理器在辦公應(yīng)用中的性能將得到大幅度提升。
#p#page_title#e#
● 重新啟用超線程 恐怖8線程設(shè)計
Nehalem架構(gòu)還重新啟用了曾經(jīng)在NetBurst上應(yīng)用過的超線程技術(shù),不過已經(jīng)更名為同步多線程技術(shù)(Simultaneous Multi-Threading,SMT)。我們知道,NetBurst架構(gòu)上的超線程技術(shù)局限于FSB和內(nèi)存?zhèn)鬏敂?shù)據(jù)帶寬,實際帶來的性能提升可能并不明顯,因此后來的酷睿2處理器直接拋棄了超線程技術(shù)。但這次Nehalem架構(gòu)將QPI和集成內(nèi)存控制器引入后直接帶來驚人的帶寬,重新啟動同步多線程技術(shù)毫無疑問不用再擔(dān)心傳輸帶寬所產(chǎn)生的瓶頸。
8線程設(shè)計能將運算周期縮短20-30%
Nehalem架構(gòu)所采用的同步多線程技術(shù)基于2路設(shè)計,即每顆核心可以同時執(zhí)行2個線程。在多任務(wù)情況下可以有效提升性能,采用這種模擬的邏輯運算核心絕對比直接增加一顆物理運算核心成本低。Intel表示SMT技術(shù)可以在能耗增加不明顯的情況下提升20-30%性能。
● 動態(tài)超頻? Turbo技術(shù)簡介
首批發(fā)布的Nehalem Core i7處理器TDP為130W,在這個TDP設(shè)定范圍內(nèi)用戶可以開啟一種名為Turbo的技術(shù)來提升CPU在某些應(yīng)用中的時鐘頻率。例如在大型3D游戲中,可能多核心并不能帶來明顯的效能提升,對處理器進(jìn)行超頻反而效果更好,如果這個時候開啟Turbo模式,并且將TDP設(shè)定在用戶所采用的散熱器允許范圍內(nèi),那么CPU在這個時侯可以對某顆或某兩顆核心進(jìn)行動態(tài)超頻來提升性能。
新增加的Turbo技術(shù)讓處理器超頻智能化
實現(xiàn)Turbo技術(shù)需要在核心內(nèi)部設(shè)計一個功率控制器,大約需要消耗100萬個晶體管。但這個代價是值得的,因為在某些游戲中開啟Turbo模式可以直接帶來10%左右的性能提升,相當(dāng)于將顯卡提升一個檔次。值得一提的是,Extreme版本的Core i7處理器最高可以將TDP在BIOS中設(shè)定到190W來執(zhí)行Turbo模式,在個別應(yīng)用中進(jìn)一步提升CPU時鐘頻率,帶來效能上的提升。
#p#page_title#e#
● X58芯片組 LGA 1366的專屬
為了細(xì)分市場,Nehalem架構(gòu)的Core i7處理器采用了3種不同的陣腳封裝模式,Intel將高端的四核心產(chǎn)品設(shè)定為LGA 1366,其配套的主板芯片組當(dāng)之無愧地采用了“X”系列,即代號為Tylersburg的X58 Express。
Intel X58 Express架構(gòu)圖
Intel X58 Express基于LGA 1366的Bloomfield Nehalem微架構(gòu)處理器設(shè)計,搭配ICH10R南橋。由于Nehalem處理器開始集成內(nèi)存控制器,因此X58 Express主板芯片組支持3通道DDR3內(nèi)存規(guī)格。另一方面,主板北橋芯片集成32條PCI-Express通道,可以實現(xiàn)雙16X的SLI(需NVIDIA官方驗證或外掛NF200芯片實現(xiàn))、CrossFire功能,并且可以拆分為4條8X通道,實現(xiàn)3卡SLI或者4路CrossFire功能,大幅度提升3D游戲性能。
Intel X58 Express北橋芯片特寫
目前,微星、華碩、技嘉、映泰、富士康、精英等臺系傳統(tǒng)大廠已經(jīng)陸續(xù)拿出了各自的X58 Express主板,本土品牌翔升也有相關(guān)產(chǎn)品開發(fā),而Intel原廠X58也在早些時候送達(dá)了中關(guān)村在線。除了Intel原廠X58主板外,其余ODM合作伙伴的X58產(chǎn)品都通過NVIDIA授權(quán)加入了對SLI的支持。NVIDIA對每款X58授權(quán)的費用是5美金,而板載nForce 200芯片實現(xiàn)SLI則需要至少30美金的芯片費用,因此ZOL收到的首批X58主板統(tǒng)統(tǒng)采用了授權(quán)支持這種更為經(jīng)濟(jì)的方案。當(dāng)然,要為頂級玩家打造3-Way 16x SLI功能,部分廠商肯定也會不惜重金購買nForce 200芯片進(jìn)行支持。
雖然Intel首款自家的X58主板——DX58SO并不支持SLI功能,但我們并不排除未來Intel與NVIDIA達(dá)成協(xié)議后會通過授權(quán)的方式讓其具備這一功能,而且Intel也極有可能重新為玩家打造一片更為豪華的X58主板,只要市場有這個需求。
#p#page_title#e#
● 用料豪華不輸一線 原廠X58詳解
一直以來,Intel在旗艦級芯片組主板的做工、用料及超頻能力就不輸給臺系大廠,當(dāng)然這主要還是由于其旗艦級芯片的定位決定的。DX58SO的整體布局相對于以前的產(chǎn)品有了大幅度的改觀,其內(nèi)存插槽和北橋芯片的位置設(shè)計顯然是為了更加貼近Core i7處理器的特點進(jìn)行了重新布線,以求帶來更好的信號和更低的干擾。另外值得一提的是,目前我們所接觸的X58主板基本都沒有加載第三方的NF200芯片來實現(xiàn)SLI,而是采用NVIDIA官方授權(quán)Key的方式實現(xiàn)。Intel對其解釋是可以減少成本,另外還能避免加載第三方芯片帶來的延遲。
8層PCB設(shè)計,黑色板型,毫無疑問Intel原廠的DX58SO是一款定位于旗艦的產(chǎn)品。主板搭配ICH10R南橋,提供首批LGA 1366接口Core i7處理器的最佳解決方案。
異常豪華的供電設(shè)計
PULSE電感及ADP4000控制芯片
主板CPU供電部分使用了一顆原生6相位PWM控制芯片ADP4000,支持VRD11.1規(guī)范,同時搭配大量來自日本化工和富士通的日系固態(tài)電容,電感方面,ATI旗艦級顯卡上常見的PULSE被應(yīng)用了上來,可以說這款主板的CPU供電不惜成本。同時為了解決處理器超頻后供電部分發(fā)熱問題,主板還在MOSFET上加裝了鋁制散熱片,雖然沒有傳統(tǒng)的一體化熱管式設(shè)計豪華,但滿足實用超頻后的散熱需求已經(jīng)是綽綽有余。
北橋供電及散熱
雖然將內(nèi)存控制器集成到CPU內(nèi)部可以令北橋的負(fù)載降低,但I(xiàn)ntel X58北橋芯片的供電設(shè)計同樣一絲不茍,另外,原廠的X58還提供了一款A(yù)VC代工的主動式散熱風(fēng)扇。
DIMM內(nèi)存插槽
Intel DX58SO主板配備了4條DIMM內(nèi)存插槽,3條藍(lán)色的插槽支持3通道內(nèi)存規(guī)格,這與大量ODM產(chǎn)品所用的6條插槽的解決方案相比顯得更加實用,因為就目前的操作系統(tǒng)來看,3GB(1GB*3)或者是6GB(2GB*3)的搭配方案已經(jīng)足矣,將插槽縮減可以減少布線難度。而將內(nèi)存插槽設(shè)計在主板最北端,更加貼近CPU,一定程度上還能減少線路的干擾和延遲。
主板搭配ICH10R南橋
X58 Express統(tǒng)一搭配ICH10R南橋,原廠X58提供6組SATA磁盤接口,可以支持RAID-0、1、5、0+1等多種磁盤陣列模式,由于沒有加載JMB363之類的芯片,因此這款主板上不存在IDE磁盤接口和軟驅(qū)接口,看來Intel將IDE淘汰的行動首先還是從自己開始做起了。
擴(kuò)展插槽
原廠X58主板提供2個PCI-E X16 2.0顯卡插槽,可以支持雙16X模式的CrossFire,另外,它還提供了1條開放式的PCI-E X4插槽、2條PCI-E X1插槽和一條PCI插槽,擴(kuò)展能力不錯。
音頻及網(wǎng)絡(luò)芯片
DX58SO采用ALC889 HD音頻芯片,提供7.1聲道的支持,信噪比達(dá)到110,網(wǎng)絡(luò)芯片則采用了WG82567LM,可提供千兆網(wǎng)絡(luò)傳輸功能。
I/O接口
主板的I/O接口端提供了2組e-SATA磁盤接口、8組USB 2.0接口、1組千兆網(wǎng)絡(luò)接口和1組IEEE 1394接口。另外,主板還提供了光纖輸出接口和音頻輸入、輸出接口
● 74項嚴(yán)刑拷打 我們的測試方法及平臺設(shè)定
本次測試將采用Intel Core i7 Extreme 965處理器,搭配原廠X58主板。內(nèi)存方面我們將首次組建3通道系統(tǒng),為了消除瓶頸,我們會采用SSD硬盤以及GTX280顯卡作為測試平臺。測試將在Windows Vista Ultimate下進(jìn)行,詳細(xì)的硬件設(shè)定及規(guī)格請參見下表:
測 試 平 臺 及 相關(guān) 介 紹
中央處理器
Intel Core i7 Extreme 965
4核8線程/133MHz×24主頻/256KB×4 L2緩存/8MB共享L3緩存
Intel Core 2 Extreme QX9770
(四核/400MHz×8 / 12MB共享L2緩存)
散熱器
九州風(fēng)神 黑虎鯨 for LGA 1366
貓頭鷹 NH-C12P for LGA 775
內(nèi)存模組
Kingston HyperX KHX1400D3K2 1GB*3
(Run:DDR3 1066 @ 7-7-7-20-1T)
主板
Intel DX58SO LGA 1366
(Intel X58+ICH10R)
ASUS Rampage Extreme LGA 775
(Intel X48+ICH9R)
顯示卡
MSI M280GTX-T2D1G-OC
(核心/著色器/顯存頻率700MHz /1400MHz/2300MHz)
硬盤
Intel X25-M SATA SSD
(80GB / MLC / 16MB緩存 / NTFS系統(tǒng)分區(qū))
電源供應(yīng)器
Thermaltake Toughpower 1500W
( ATX 2.3 / 1500W額定功率 )
顯示器
DELL 3007 WFP
(30英寸寬屏液晶 2560×1600 @ 60Hz)
功率負(fù)載儀
Seasonic PowerAngel
與平臺相連,不包含顯示器
OS及驅(qū)動程序
Windows Vista Ultimate SP1
32bit English / 版本號:6001
Intel Chipset Software Installation Utility
版本號:9.1.0.1007
NVIDIA Forceware for Vista 32
版本號:178.24 WHQL
測試平臺一覽
本次測試特別感謝金士頓提供HyperX DDR3 3通道內(nèi)存套裝、九州風(fēng)神提供最新的LGA 1160/1366版黑虎鯨散熱器。我們的測試環(huán)節(jié)分為3個章節(jié),分別考察DIY理論性能、視頻編碼及轉(zhuǎn)碼性能和3D游戲性能。測試軟件及相關(guān)信息請參見下表:
測 試 軟 件 及 相 關(guān) 介 紹
性能測試軟件
DIY理論性能測試
BAPCo SYSmark 2007 Preview
BAPCo / 版本號:1.04.670
PCmark Vantage
Futuremark / 版本號:1.0
ScienceMark
AlexanderGoodrich, B.S. / 版本號:2.0
Fritz Chess Benchmark
ChessBase GmbH / Fritz 10 OCT 24 2006
WinRAR
版本號:3.71
Everest Ultimate
Lavalys / 版本號:4.60.1500
SiSoftware Sandra
SiSoftware / 版本號:2009
多媒體應(yīng)用測試
CINEBENCH
MAXON / 版本號R10
POV-Ray
Persistence of Vision / 版本號3.7.0
H.264 Encoder
MainConcept / 版本號:2.01
TMPEGEnc 4.0 Xpress
Pegasys Inc. / 版本號:4.4.2.238
DivX Converter
DivX ,Inc. / 版本號:6.8
3D游戲及相關(guān)軟件
Quake 4
id Software / 版本:1.4.1
Half Life 2 Episode 2
VALVE / 版本號:1.0.0.0
Crysis WARHEAD
Crytek / 版本號:1.0
Company of Hearoes
Relic / 版本號:1.71
World in Conflict
Sierra / 版本號:1.0.0.0
Call of Juarez
Ubisoft / 版本號1.0
其他
系統(tǒng)信息獲取
CPU-Z
www.cpuid.com / 版本號1.48
綜上所述,Core i7處理器將在接下來接受我們18項軟件、供74個子項目的嚴(yán)刑拷打。首先,我們將從DIY理論性能測試開始。
● 最高提升12% SYSmark 2007性能揭秘
SYSmark 2007 Preview是由BAPCo(英文全名Business Applications Performance Corporation,中文名為“商業(yè)應(yīng)用性能公司”)組織推出的一款系統(tǒng)綜合性能評估軟件。BAPCo組織成立于1995年,是一家領(lǐng)先全球的非盈利性工業(yè)出版組織,其成員包括PC硬件廠商、第三方硬件性能評估機(jī)構(gòu)、軟件出版商以及半導(dǎo)體制造商。目前BAPCo組織一共有16個成員,其中包括AMD、Apple、ARCintuition、Atheros Communications、CNET、Compal Electronics、Dell、Hewlett-Packard、Intel、Lenovo、Microsoft、NVIDIA、Toshiba、VNU Business Publications Limited(UK)、ZDNet以及Ziff Davis Media。這個組織除了推出權(quán)威的SYSmark系列外,還推出了MobileMark,這款軟件在筆記本電腦性能測試中十分常見。
Core i7 Extreme 965相對于上代旗艦QX9770,在SYSmark 2007總成績上提升了4%,總分達(dá)到驚人的200分。在3D建模子項目中,Core i7一舉將差距拉大到了12%。不過Core i7在辦公生產(chǎn)力和電子學(xué)習(xí)子項目中表現(xiàn)失常,竟然被QX9770反超
● 理論游戲性能提升23.5% PCmark測試
來自Futuremark的PCmark系列測試軟件與SYSmark系列相比,更加偏重于娛樂應(yīng)用。針對Windows Vista操作系統(tǒng),PCmark也從2005升級到了Vantage,全新的PCmark Vantage不僅包括系統(tǒng)總分,而且還包含了Memories(內(nèi)存)、TV and Movies(視頻)、Gaming(游戲)、Music(音樂)以及Communications(通信)和Productivity(生產(chǎn)力)。接下來是Core i7在PCmark Vantage中的表現(xiàn):
PCmark Vantage總分相對于上代旗艦提升了9%性能。與SYSmark 2007結(jié)果有些相似的是在Gaming子項目測試中Core i7的優(yōu)勢非常明顯,達(dá)到了23.5%,但在辦公生產(chǎn)力上再次表現(xiàn)出不足之處。當(dāng)然,這種理論的非正?,F(xiàn)象還需要后續(xù)的實踐來證明。
#p#page_title#e#
● 內(nèi)存控制器發(fā)飆 ScienceMark測試
接下來要進(jìn)行的是ScienceMark的測試,我們選用的是2.0版本。這是一款通過一些科學(xué)方程式來測試系統(tǒng)性能的軟件。它主要針對臺式機(jī)和工作站內(nèi)存子系統(tǒng),對于增加了內(nèi)存控制器的Core i7來說,這款軟件理所應(yīng)但反映出內(nèi)存?zhèn)鬏攷捲龃蠛髱淼淖兓?/p>
從總分來看,也許Core i7 Extreme 965相對于上代頂級的QX9770沒有太明顯的得分提升,但是我們看看內(nèi)存子項目就能夠發(fā)現(xiàn)i7帶來的性能飛躍。3023.53比1951.02,性能提升幅度達(dá)到了55%,Core i7的內(nèi)存控制器在本論測試中終于開始發(fā)飆。
#p#page_title#e#
● 性能提升121% Everest內(nèi)存子項目測試
雖然在前面的SYSmark 2007和PCmark Vantage測試中Core i7的得分有些時常,但真正能夠?qū)C內(nèi)存效能進(jìn)行有效考察的還是著名的Everest。我們選用了Ultimate 4.60.1500版本,分別測試內(nèi)存讀取、寫入、復(fù)制、延遲各項性能。
Core i7所在平臺執(zhí)行效率驚人!在內(nèi)存復(fù)制自項目中領(lǐng)先上一代產(chǎn)品121%,三通道+集成內(nèi)存控制器徹底將DDR3內(nèi)存的高帶寬優(yōu)勢釋放出來。要知道我們僅僅是在DDR3-1066下完成了測試,其實在更高內(nèi)存頻率下,Core i7的內(nèi)存讀取已經(jīng)超過2GB/s。另外,內(nèi)存延遲測試結(jié)果也十分驚人,37.3ns的延遲即便是連以內(nèi)存延遲低著稱的K8平臺也望塵莫及。
#p#page_title#e#
● 全面提升 Everest CPU性能測試
Everest除了可以對內(nèi)存理論性能進(jìn)行全面考察外,還可以對CPU的計算效能進(jìn)行全面考察。它提供了7大測試項目,分別為:
CPU Queen——測試CPU的分支預(yù)測能力,以及預(yù)測錯誤時所造成的效能影響。
CPU PhotoWorxx——著重于CPU的整數(shù)運算能力,利用模擬數(shù)位影像處理來進(jìn)行CPU效能的評估。
CPU ZLib——另一項針對CPU整數(shù)運算的測試,利用Zlib這個壓縮函式庫,來計算CPU在處理壓縮檔案時的能力。
CPU AES——一種加密計算測試。
FPU Julia——利用朱利亞碎形幾何運算,來評估CPU的單精度(32bit)浮點運算能力。
FPU Mandel——利用了“Mandelbrot”碎形幾何運算,來評估CPU的倍精度(64bit)運算能力。
FPU SinJulia——利用修改過的朱利亞碎形運算,來評估CPU的延伸精度(80bit)浮點運算能力。
即便是針對CPU的純理論測試,我們也可以看出Core i7在各項性能測試中體現(xiàn)出的王者霸氣。CPU Zlib(主要考察整數(shù)運算性能)測試直接提升30.1%,另外3個FPU浮點運算的測試中Core i7也能分別領(lǐng)先上代旗艦15%、26%、89.5%!
#p#page_title#e#
● SiSoftware Sandra運算性能及多媒體指令集測試
SiSoftware Sandra是一項非常重要的PC性能衡量軟件。不久前它推出了2009版本,增加了對多核心、多線程處理器的支持,讓我們可以更好地用它來考察PC的總體性能。這里將測試CPU的基本運算能力和多媒體指令集效能:
從基準(zhǔn)運算性能的測試來看,無論是整數(shù)運算還是浮點運算,Core i7相對于上一代產(chǎn)品都有了飛躍性的性能提升。其浮點、整數(shù)運算性能分別提升54%和47.9%。
由于加入SSE4.2多媒體指令集,因此Core i7處理器在關(guān)于多媒體指令集的測試項目中同樣表象非常出色,不管是Float還是Int都能夠領(lǐng)先QX9770所在平臺不小。
#p#page_title#e#
● 運算性能測試 Fritz 10&WinRAR
SYSmark 2007、PCmark Vantage、ScienceMark 2.0、SiSoftware Sandra以及Everest等測試項目也許過于理論化,那么接下來我們來看看兩款實際應(yīng)用軟件中Core i7的效能表現(xiàn)。Fritz是一款國際象棋軟件,它在x86架構(gòu)PC上實現(xiàn)了當(dāng)年IBM深藍(lán)所做的關(guān)于國際象棋的預(yù)測和計算。雖然當(dāng)前的PC與IBM深藍(lán)并不能相提并論,但至少通過這個運算我們能夠從主觀上對一臺PC,特別是CPU的運算效能有一個認(rèn)識。Fritz系列軟件給出了一個基準(zhǔn)參數(shù),就是在P3 1.0G處理器下,其可以每秒運算48萬步。
由于是8線程同時運算,再加上Core i7在架構(gòu)上進(jìn)行了變化,因此在Fritz 10的測試中Core i7 Extreme 965領(lǐng)先上代產(chǎn)品達(dá)到了29.5%。
WinRAR幾乎是每臺PC必裝的一款軟件。其自帶的Benchmark測試能夠反映出CPU的文件壓縮及解壓縮處理能力。這款軟件對內(nèi)存帶寬的吞吐非常敏感,一直以來集成內(nèi)存控制器的處理器在這款軟件應(yīng)用中具備先天優(yōu)勢。
測試結(jié)果不出所料,Core i7一度領(lǐng)先四核心酷睿2 處理器,幅度高達(dá)69%,想想在解壓縮和壓縮應(yīng)用中,如果您裝載了一套擁有Core i7處理器系統(tǒng)的PC,性能將比前一代頂級產(chǎn)品提升69%,是多么美妙的一件事。
小結(jié):
DIY理論性能的測試環(huán)節(jié)結(jié)束。從各項軟件的測試結(jié)果來看,Core i7在包括CPU理論運算能力、內(nèi)存執(zhí)行效率、3D Game等多方面相對于上一代Core架構(gòu)的四核心酷睿2處理器有了大幅度的性能提升。特別是引入的內(nèi)存控制器充分發(fā)揮了DDR3內(nèi)存以及3通道巨大的效能,這一點也許在家用桌面級平臺上體現(xiàn)并不明顯,但在對服務(wù)器系統(tǒng)的性能提升是革命性的。
#p#page_title#e#
● 多媒體性能測試:POV-Ray&CINEBENCH
剛剛針對CPU的基準(zhǔn)性能及運算能力進(jìn)行了眾多理論性的測試,現(xiàn)在我們轉(zhuǎn)入對多媒體應(yīng)用的性能測試章節(jié)。本章節(jié)重點考察Core i7相對于上一代旗艦產(chǎn)品QX9770在圖形渲染、視頻編碼及轉(zhuǎn)碼效能。
Core i7相對于第一代45nm處理器,增加了SSE4.2指令集,組成了完整的SSE4指令集。SSE4.2指令集包含7條指令,主要針對文本應(yīng)用及上網(wǎng)進(jìn)行優(yōu)化,配合之前的SSE4.1指令集,Core i7在日常生活中常用的軟件中將得到突飛猛進(jìn)的效能提升。
另外,由于超線程技術(shù)的回歸(Core i7中這項技術(shù)更名為Simultaneous Multi-Threading,簡稱SMT),Core i7處理器在圖形渲染及視頻處理等較為依賴運算核心的應(yīng)用中將占據(jù)絕對優(yōu)勢。
從兩款圖形渲染應(yīng)用的測試結(jié)果看來,SMT技術(shù)確實能夠給我們的應(yīng)用帶來非凡的體驗。POV-Ray打開SMT后可以帶來61%的性能提升,而CINEBENCH R10中則至少能夠帶來24%的攀升幅度。
#p#page_title#e#
● 多線程發(fā)威 視頻編碼及轉(zhuǎn)碼測試
隨45納米制程誕生的SSE4.1指令集讓CPU的視頻處理能力直接提升70%,而這次加入的SSE4.2指令集雖然在視頻方面并未進(jìn)行過多優(yōu)化,但由于SMT帶來的8線程優(yōu)勢,我們同樣期待它的表現(xiàn)。本次選用了DivX 6.8、TMPGEnc、H.264 Encoder三款常用的視頻編輯軟件進(jìn)行測試。
在8線程的巨大優(yōu)勢下,Core i7在TMPGEnc中可以最大提升41%的性能,而在DivX 6.8和H.264 Encoder中,QX9770有較好表現(xiàn),但與Core i7相比還是落后了不少,分別為12%和29%。
本章小結(jié):
從本章的測試結(jié)果可以看出,由于具備SMT技術(shù),打開8線程的Core i7處理器與上一代頂級的4核心處理器相比,無論是在圖形渲染還是視頻轉(zhuǎn)碼和編碼中都能夠大大提升執(zhí)行效能。對于多媒體工作者來說,如果您天天面對的是海量的圖形處理、大量的視頻壓縮,那么花錢購置一套Core i7的平臺似乎對工作效率的提升大有幫助。
#p#page_title#e#
● 玩家盛宴 游戲應(yīng)用測試之3Dmark 06
除了變態(tài)的多媒體專業(yè)應(yīng)用,目前對PC效能要求最高的恐怕當(dāng)屬大型3D游戲了。本章節(jié)我們將重點考察Core i7在不同類型游戲中的執(zhí)行效率以及3Dmark理論性能。雖說對游戲的流暢程度影響最大的是顯卡,但CPU對游戲中的人工智能和物理加速支持是不可忽視的,因為有了這些,我們才能夠獲得逼真的游戲效果。
首先我們采用3Dmark 06來進(jìn)行測試,測試分為默認(rèn)分辨率(1280*1024)和最高分辨率(2560*1600),測試時關(guān)閉AA、AF,最后選取總分和CPU子項目成績。通過對比我們發(fā)現(xiàn),Core i7相對于上一代產(chǎn)品大致能夠在3Dmark 06中提升8%-14%的性能。不過8線程的優(yōu)勢在這款軟件中并沒有很好地體現(xiàn)出來。
#p#page_title#e#
● CPU子項提升明顯 3Dmark Vantage測試
針對Windows Vista系統(tǒng)推出的3Dmark Vantage將CPU和GPU的測試得分單獨計算,因此更能夠看出不同平臺配備下CPU性能的差異化。我們將在Performance和Extreme兩種模式下對整套平臺進(jìn)行測試:
很顯然,Vantage版本的3Dmark更能夠凸顯Core i7的線程優(yōu)勢。雖然在總分表現(xiàn)上兩套平臺相差無極,但51.6%的CPU子項目差距足以說明多線程處理器在未來游戲中的將起到至關(guān)重要的作用。
#p#page_title#e#
● 經(jīng)典DX9游戲 Quake4&HL2
接下來進(jìn)行實際的游戲測試環(huán)節(jié)。首先是2款比較經(jīng)典的DirectX 9游戲:Quake4以及Half Life 2 EP2。測試畫面設(shè)定最高,但統(tǒng)一關(guān)閉AA和AF。
Core i7 Extreme 965在本論測試中表現(xiàn)失常,與之前的PCmark Vantage、SYSmark 2007的理論性測試不太一致。這可能是因為游戲年代較久,直接導(dǎo)致Core i7的多線程優(yōu)勢不明顯,另外游戲在開發(fā)時Core i7并未誕生,因此Core i7的表現(xiàn)市場也是能夠理解的。
#p#page_title#e#
● DX10游戲測試 Crysis&狂野西部
我們再來看看兩套平臺在DirectX 10游戲中的表現(xiàn)。經(jīng)過2代產(chǎn)品的更迭,目前的主流DirectX 10顯卡在相應(yīng)游戲中的性能已經(jīng)大大超過第一代產(chǎn)品,不過在頂級的DirectX 10 FSP游戲面前,即使是當(dāng)前最頂級的顯卡與最頂級的CPU也會顯得吃力。
Crysis WARHEAD(孤島危機(jī) 彈頭)是剛剛發(fā)布的一款Crysis的資料片。游戲與Crysis相比,畫面精美程度不減,可玩性更高,更加注重整個游戲過程的劇情性。在這款游戲測試中,Core i7在最低分辨率下有1幀的領(lǐng)先,其余分辨率則與QX9770持平。
Call of Juarez是另一款DirectX 10 FPS游戲,不過由于發(fā)布時間較早,因此已經(jīng)基本被主流的高端顯卡所征服。在這款游戲中,Core i7的測試結(jié)果全面小幅度落后于QX9770,表現(xiàn)再次失常
#p#page_title#e#
● DX10游戲測試 英雄連&沖突世界
嚴(yán)格意義上來說《英雄連》并不是一款DirectX 10游戲,不過在補(bǔ)丁升級到1.71后它加入了對DirectX API的支持,并且畫面精美程度大大提升。而本次測試的另外一款游戲《沖突世界》則是原汁原味的基于DirectX 10。
《英雄連》的測試結(jié)果同樣令人費解,不管是在入門級的1024*768分辨率下還是在24英寸顯示器標(biāo)準(zhǔn)的1920*1200分辨率下,Core i7始終落后于QX9770平臺,雖然每次落后的幅度都很小,但這種結(jié)果按照理論是不應(yīng)該出現(xiàn)的。
《沖突世界》的測試結(jié)果則喜憂參半。低分辨率下Core i7以微弱優(yōu)勢領(lǐng)先,主流分辨率(1680*1050)下二者打平,但是在高分辨率下QX9770所在平臺又反超Core i7。
小結(jié):
在本環(huán)節(jié)測試中,Core i7在3Dmark理論測試中的表現(xiàn)出色,全面領(lǐng)先上一代旗艦產(chǎn)品,但是在實際的游戲測試中卻表現(xiàn)得有些不正常。8線程以及巨大的內(nèi)存帶寬優(yōu)勢并沒有在游戲中體現(xiàn)出來,從Crysis WARHEAD的測試結(jié)果中我們可以看出一些端倪——在Core i7誕生之前的游戲可能沒有基于全新的CPU架構(gòu)進(jìn)行開發(fā),另一方面則是由于主流游戲?qū)Χ嗑€程的支持還并不到位。在今年臺北舉行的IDF上,Intel用《失落星球》展示Core i7處理器的游戲性能相對于上一代產(chǎn)品提升了30%。也許需要在個別對多線程支持較好的游戲中Core i7處理器才能體現(xiàn)出優(yōu)勢,我們在后續(xù)的文章中將針對這一點進(jìn)行重點探討。
#p#page_title#e#
● 節(jié)能測試 整體功耗僅上升10%
關(guān)于Core i7的Benchmark測試環(huán)節(jié)就到這里,接下來我們將對其功耗進(jìn)行測試。從之前的測試可以看到,Core i7相對于上一代產(chǎn)品在各方面有了極為誘人的性能提升,而其130W的TDP也基本與上一代旗艦產(chǎn)品相同。那么它的功耗如何呢?如果僅僅是為了獲得性能上的提升而讓功耗大大增加,對于用戶來說也許并不是好消息。
我們的功耗測試分為3個方面:
1、Windows待機(jī)情況下Core i7+X58平臺與QX9770+X48平臺的功耗對比
2、開啟SP2004令CPU達(dá)到100%負(fù)載后Core i7+X58平臺與QX9770+X48平臺的功耗對比
3、運行3Dmark Vantage Extreme測試,對比兩套平臺瞬間最大峰值。
雖然在3種情況下Core i7+X58的功率消耗都比QX9770+X48高一些,但Windows待機(jī)、CPU 100%負(fù)載和平臺瞬間峰值僅分別提升了3%、7% 3%,這種小幅度的功耗提升所帶來的性能提升顯然是值得的。Intel官方曾表示Nehalem處理器相對于上一代產(chǎn)品最大提升10%功耗,所言不假。
值得一提的是,Intel非常擅于不斷更新步進(jìn)來降低處理器的能耗,這在45納米酷睿2處理器上已經(jīng)有了很好的體現(xiàn),我們所測試的Core i7 Extreme 965為C0步進(jìn),第一批正式出貨為C1,而在隨后的新步進(jìn)版本上功耗可能會比本次測試更低。
#p#page_title#e#
● 性能總體評價:多方面壓倒性優(yōu)勢
○基準(zhǔn)運算能力出眾
經(jīng)過74項全方位的測試,基于Nehalem架構(gòu)的Core i7處理器基準(zhǔn)運算能力的確相對于上一代產(chǎn)品有了突飛猛進(jìn)的提升。在Everest Ultimate中,Core i7的運算能力有15%-89%的性能提升,而SiSoftware Sandra 2009給出我們的成績則是浮點、整數(shù)運算性能分別提升54%和47.9%。如此巨大的基準(zhǔn)運算性能將直接為PC帶來多方面應(yīng)用的全面提升。
○內(nèi)存效能讓人吃驚
Core i7 Extreme 965正反面特寫
得益于3通道DDR3內(nèi)存控制器的導(dǎo)入,Nehalem Core i7處理器一挽以往內(nèi)存效能不足的窘境,直接將內(nèi)存讀取、寫入、復(fù)制、延遲的效能提升到一個全新的境界。另一方面,QPI總線的設(shè)計讓Core i7突破FSB的瓶頸,靈活的總線設(shè)計思路可以讓基于Nehalem架構(gòu)的處理器在服務(wù)器市場大放異彩,徹底改變以往由內(nèi)存效能和FSB帶來痛楚。
○多線程威力巨大
超線程技術(shù)的回歸雖然并不能帶來雙倍的性能提升,但這種設(shè)計直接讓Core i7在3D圖形渲染、視頻制作和處理上與上代產(chǎn)品相比取得壓倒性勝利,隨著越來越陡應(yīng)用軟件加入對多線程處理器的支持,具備8個邏輯運算核心的Core i7將牢牢把握多任務(wù)處理領(lǐng)域的話語權(quán)。當(dāng)然,這一切應(yīng)該建立在傳統(tǒng)機(jī)械硬盤瓶頸得到有效解決后。
○游戲性能略顯不足
僅僅在《失落星球》等個別游戲上的成功并不能掩蓋不足
雖然Intel在IDF上用《失落星球》演示了Core i7帶來的30%游戲性能的提升,但經(jīng)過我們對多款主流游戲的測試發(fā)現(xiàn),Core i7為游戲性能提升帶來的拉力明顯不足。也許在低分辨率下還有一些優(yōu)勢,但在較高分辨率下就明顯與上一代產(chǎn)品體現(xiàn)不出太大差距。Intel曾經(jīng)建議在1280*1024下進(jìn)行測試,但我們認(rèn)為如此強(qiáng)悍的平臺僅僅在1280*1024分辨率下運行游戲未免有些不切實際。也許是主流游戲并未針對Nehalem架構(gòu)進(jìn)行開發(fā),我們預(yù)計在接下來陸續(xù)發(fā)布的新游戲中Core i7會體現(xiàn)出一些優(yōu)勢來。另外,針對主流游戲?qū)Χ嗑€程支持不足的情況,我們建議大家適當(dāng)?shù)剡\用Nehalem架構(gòu)的Turbo功能來提升執(zhí)行效率。
#p#page_title#e#
● 市場預(yù)測及展望:頂級玩家必備尤物
○成功接替上代旗艦
四核心Core i7處理器性能全面超越上一代酷睿2四核心產(chǎn)品已經(jīng)是不爭的事實,Core i7與X58的組合已經(jīng)成功接過上代旗艦的槍。首批上市的四核心Bloomfield產(chǎn)品分為3款,主頻從2.66GHz到3.2GHz,售價最低僅284美金,最高999美金,基本與上一代四核心處理器保持平衡,隨著Core i7的大量鋪貨,Core架構(gòu)的四核心處理器將逐漸淡出市場。
○多媒體工作者不可錯過
鑒于Core i7處理器在3D圖形渲染及視頻轉(zhuǎn)碼編碼方面的巨大優(yōu)勢,日常以多媒體工作為主的圖形設(shè)計人員及視頻制作人員恐怕應(yīng)該考慮為自己重新添置一套平臺了。Core i7+X58的組合不僅可以令工作事半功倍,而且其多達(dá)8個線程的優(yōu)勢還有望讓我們在進(jìn)行日常多媒體制作的同時進(jìn)行一些其它的操作。
○頂級DIY玩家必備尤物
Core i7在Super π等玩家關(guān)注的軟件中表現(xiàn)令人驚訝
當(dāng)然,作為TOP DIYer,Core i7絕對是不可多得的尤物。主頻為3.2GHz的Core i7 Extreme 965在僅僅搭配單通道1GB DDR3-1066內(nèi)存的情況下就能夠獲得12.906s的好成績,而在3Dmark Vantage等軟件中,基于Nehalem架構(gòu)的Core i7也同樣開始嶄露頭角,作為喜愛沖擊各項Benchmark世界紀(jì)錄的TOP DIYer,如此尤物豈能錯過?
○領(lǐng)先對手兩個身位
Nehalem來了,Intel已領(lǐng)先對手兩個身位
Intel Core架構(gòu)的發(fā)布讓競爭對手在2年時間內(nèi)無法翻身,只能通過價格戰(zhàn)來獲取一定的低端市場份額,而Nehalem架構(gòu)的按時發(fā)布則再次將優(yōu)勢拉大到了兩個身位,誠然,一家獨大對終端消費者而言并不是好消息,但從目前的情況看來要為要讓Nehalem架構(gòu)的Core i7處理器嘗到敗北的滋味,競爭對手還有很長的路要走……
#p#page_title#e#
#p#page_title#e##p#page_title#e#