NVIDIA副總Walter談專業(yè)卡技術(shù)及行業(yè)客戶應用狀況
NVIDIA Quadro 專業(yè)顯卡推動了索尼電影公司所屬的Imageworks公司在最新的所有CG動作電影中的創(chuàng)意工作。
如何能夠運用技術(shù)手段將已有1200年歷史的古老史詩中描述的英雄、妖怪和巨龍再現(xiàn)在人們的眼前?這個問題就是導演Robert Zemeckis與索尼電影公司所屬的Imageworks公司(索尼Imageworks)在將《Beowulf(戰(zhàn)狼)》的故事搬上銀幕的過程中所面臨的挑戰(zhàn)。
Zemeckis 與索尼Imageworks的工作團隊,使用了曾在《The Polar Express(極地特快)》中首次使用,并在《Monster House(怪獸屋)》中再次使用的“表演捕捉技術(shù)”,來講述英雄Beowulf(由Ray Winstone飾演)的故事。在這個故事中,Beowulf 來到Hrothgar國王(Anthony Hopkins 先生)的議事大廳,殺死長期以來一直為Hrothgar的王國制造苦難和災難的妖怪 Grendel(Crispin Glover)。然而,在處決Grendel之后, Beowulf 就必須面對Grendel的母親(Angelina Jolie)因為喪子之痛而必將采取的瘋狂復仇行動。這個故事改編自被認為是英國文學首部巨著的恢宏史詩。
“表演捕捉”運用了演員的身體運動和面部表情的相關追蹤技術(shù),然后將收集到的相關數(shù)據(jù)用于根據(jù)演員的表演創(chuàng)建動畫場景。 影片《Beowulf(戰(zhàn)狼)》 的超常規(guī)模是這部作品的制作過程中遭遇的一個獨特挑戰(zhàn)。有些場景的人物角色達到了70多個,每個演員的動作都必須進行精準捕捉、跟蹤,并且需要將其放置融入到動畫角色的身上。然后再應用紋理和照明效果,從而在攝影機布局過程中能夠讓導演實現(xiàn)實時互動。
這種新的預覽技術(shù)增加了額外的相關挑戰(zhàn)。傳統(tǒng)的預覽技術(shù)使用簡單的、非紋理性幾何學來設置或計劃攝影機、演員和場景中動作的所處位置。但是對于《Beowulf(戰(zhàn)狼)》這部影片來說,電影制作人員和索尼Imageworks的工作團隊需要完成更多的工作。他們需要一種能夠表明情緒、照明細節(jié)和場景基調(diào)的預覽程序。 因此,就需要實現(xiàn)和達到與頂級視頻游戲效果相類似的較高畫面質(zhì)量,而找到能夠應對制作出實時高質(zhì)量畫面挑戰(zhàn)的顯卡產(chǎn)品才是解決這個問題的訣竅?!禕eowulf(戰(zhàn)狼)》的工作團隊在NVIDIA的 Quadro專業(yè)顯卡產(chǎn)品家族中找到了他們理想的產(chǎn)品,這種顯卡可以提供對多個角色進行紋理和照明實時渲染所需的處理動力。憑借Quadro™解決方案,影片導演可在調(diào)度、拍攝和更改表演的實時進程中,獲得自己需要的及時性反饋。
“Quadro顯卡具備生產(chǎn)我們在表演捕捉集成和攝影機布局過程中所需要的實時場景能力。” 《Beowulf(戰(zhàn)狼)》的動畫技術(shù)主管——Corey Turner 這樣說道。“我們有些場景非常復雜,有時需要對70多個角色的動作進行實時編輯和渲染, NVIDIA賦予了我們實時展示導演想法的能力。”
通過將Quadro專業(yè)圖形顯卡集成到他們創(chuàng)意作品之中,索尼Imageworks的工作團隊實現(xiàn)了對復雜性很高的動作場景的實時排列和渲染。工作人員們遇到的最為重大的挑戰(zhàn)之一就是Grendel在Hrothgar的議事大廳遭到攻擊的場景。這個場景的出鏡角色有70多個,還要由一臺移動攝影機在大廳內(nèi)拍攝整個過程,Zemeckis在所有數(shù)據(jù)都已在實時3D 場景中進行集成之后,決定了攝影機的拍攝位置以及表演動作如何做出。盡管在所有表演中,最終只有一小部分可以在攝像機的拍攝范圍內(nèi),不過,Quadro顯卡能夠讓導演在決定最終拍攝機位之前,對所有的角色進行排列布局和渲染操作。
《Beowulf(戰(zhàn)狼)》這部影片的制作過程一直在挑戰(zhàn)Quadro顯卡的性能表現(xiàn)極限 。最具挑戰(zhàn)性的拍攝之一是一段107秒的場景拍攝過程,在這個場景中,將近60個角色開始的時候在議事大廳跳舞,然后,這些角色的活動地點又轉(zhuǎn)移到了議事大廳的房頂上面 ,隨后他們又穿過了四英里的鄉(xiāng)間小路,最后,拍攝工作在Grendel的洞穴中結(jié)束。由于需要對演員、道具進行實時的完全照明和紋理渲染,所以,該項拍攝工作分為三個實時預覽片段進行,然后再共同進行回放編輯工作。然而,Zemeckis仍然能夠?qū)⑵渫昝赖剡M行視覺演繹和展示,最后的成片中,整個拍攝工作看上去非常流暢完整、無懈可擊。
#p#page_title#e#
第2頁:NVIDIA專業(yè)圖形解決方案高端論壇——Walter演講(上)
時 間:2008年1月17日
地 點:北京麗思卡爾頓酒店酒店 大宴會廳
Walter Mundt-Blum:首先歡迎大家來參加我們的論壇,同時我也非常感謝大家對我們的產(chǎn)品特別是專業(yè)產(chǎn)品感興趣。我想向大家解釋一下我們公司是做什么的,有一些產(chǎn)品可能大家以前不知道,其實我們還做這個。我相信中國用戶對我們公司是非常了解的,我們有很多游戲方面的產(chǎn)品,甚至很多人給我們發(fā)來自己創(chuàng)作的NVIDIA相關藝術(shù)產(chǎn)品,包括照片等等的東西,比如說有人在雪上做了一個我們的LOGO。感謝他們對NVIDIA公司的巨大熱情。最有意思的是我們可以看這個小孩子的臉,這是來自歐洲的一張照片,他們的父母為問我們是不是可以把這個小姑娘起名為NVIDIA呢?我們對此沒有任何否定意見,還有其他的照片,比如說西瓜上有我們的LOGO等等。
很多人都知道我們在游戲領域做出了很大的貢獻。那現(xiàn)在我們講一下我們在專業(yè)領域做哪些東西。我們這次過來主要希望向大家介紹兩個產(chǎn)品:一個是Tesla和CUDA,是我們公司推出的高性能計算的產(chǎn)品;另外一個是Quadro,我會來主講這方面的技術(shù)產(chǎn)品。
『NVIDIA專業(yè)解決方案事業(yè)部全球銷售副總裁Walter先生向參會媒體朋友介紹CUDA及專業(yè)顯卡產(chǎn)品』
在Tesla和CUDA這方面中,我們的GPU不在是負責圖形方面的工作,而是用在視覺計算。而在面向圖形方面的專業(yè)解決方案中,我們也不僅有板卡還有系統(tǒng)。比如說桌面系統(tǒng),還有服務器的環(huán)境等等。換句話說,NVIDIA可以做很大的系統(tǒng),不僅僅是一種普通的顯卡。
通過這張圖表我們可以看到,在工作站的整個發(fā)展過程當中,我們所發(fā)售的GPU的數(shù)量比其他公司的產(chǎn)品總和還要多。同時這里有一個趨勢圖,2007年大家可以看到這是第三季度,而到2007年第四季度末我們在專業(yè)市場80%至85%的市場份額。如果把所有的產(chǎn)品加起來超過了所有其他競爭對手同類產(chǎn)品的總和,從這點來說,我們?nèi)〉昧司薮蟮某删?。當然這些成就的得來,也要非常感謝中國的市場,因為盡管我們進入中國時間非常短,在專業(yè)產(chǎn)品上僅僅兩年時間,我們已經(jīng)取得了很大的進步。但是在國內(nèi)杰出的藝術(shù)創(chuàng)作中,90%都用到了NVIDIA GPU的設計。另外,我們的應用領域也非常多,比如像空中客車A380,在我接下來的DCC演講部分當中可以給大家看到,空中客車有一個超大的屏幕,是1:1的比例制作的。人們可以時時看到到底內(nèi)部的設計是什么樣,他們甚至可以走進去,而這就要歸功于我們的Quadro解決方案。還有蘭博基尼,還有阿迪達斯,可以讓他們看到這個鞋設計出來到底是什么樣子,產(chǎn)生時時的圖形。還有比如像歐寶,他們有汽車使用系統(tǒng),通過這個系統(tǒng)歐寶可以提供比之前多27%的設計樣式。一年前,他們本來打算只有200個終端的建設,而現(xiàn)在有600個。保時捷也采用我們的產(chǎn)品進行設計,還有其他公司有類似的做法,所以大家會看到越來越多的公司會用我們的產(chǎn)品做汽車的配置。
我們這個技術(shù)不僅僅是用于制造業(yè),而且也非常重要的在電視行業(yè),比如說我們有一個SDI的產(chǎn)品。大家看一下這邊的奧林匹克的滑冰,大家可以看到,實際上背后這個東西是由電腦計算機時時制作出來的,大家可以看到隨著這個人的出現(xiàn),相應的計算機技術(shù)制作出來會變化。而正因為如此,我們獲得了艾美獎,這是我們的CEO黃仁勛先生領取艾美獎。還有在中國我們也知道有一個紀錄片叫《圓明園》,這是一個數(shù)字紀錄片,在中國是最大的一部數(shù)字紀錄片。也許我們可以看這個記錄片的一些視頻。
所有這些影像都是數(shù)字制作的,不是真的東西,我也非常高興請到了《圓明園》的導演金先生,下面我們請他來向我們解釋一下,他們是如何使用NVIDIA技術(shù)制作這么好的紀錄片。
金鐵木:各位大家好!《圓明園》這部分電影大概有人看過,在北京播了很長時間,其實從藝術(shù)的角度來講電影,電影需要技術(shù)的支持,我其實在技術(shù)方面屬于門外漢,非常不懂。但是在中國所有導演中,我一直致力于數(shù)字技術(shù)的,換句話說,我做的影片,有一大部分是要再現(xiàn)歷史,重現(xiàn)歷史,《圓明園》就是這樣的一部電影,沒有數(shù)字技術(shù)就沒有《圓明園》。
『電影《圓明園》導演金鐵木先生介紹電影編輯中采用NVIDIA專業(yè)顯卡的成功經(jīng)歷』
在電影中,我們最基本的要求在圖象處理方面我們而需要2K的技術(shù),現(xiàn)在我們在做4K的電影,明年我們就要做6K的電影,現(xiàn)在我們在做奧運會的開幕式及我們在多媒體演示方面有8K的要求,這樣的要求對專業(yè)的圖形處理技術(shù)要求高,越來越高。所以,我覺得有了像NVIDIA這樣的公司,有了這樣的技術(shù),有了這樣的專業(yè)的團隊致力于這方面的開發(fā),我們在專業(yè)的電影影像方面才有可能。我們運算的能量,運算最后達到的效果,才會達到我們所需要的,因為電影最后都是要給觀眾看的,電影是NVIDIA這種圖形處理技術(shù)是通向觀眾的橋梁。我其實不是非常了解,我做技術(shù)的團隊告訴我,說NVIDIA是業(yè)界最好的他們是做的最大的。希望NVIDIA做的越來越好,我們講做6K、8K電影的時候,希望NVIDIA的技術(shù)會讓我們更輕松。謝謝大家!
Walter Mundt-Blum:謝謝您,雖然我不能理解你說的東西,可以說是什么也不懂,但是我相信我們合作的還是非常不錯,謝謝您!除了電影之外,我們同時也在垂直市場方面也非常知名,其中有一個就是在軍事技術(shù)方面,航空技術(shù)方面的GPU的技術(shù)。比如說向模擬系統(tǒng),還有戰(zhàn)斗機,還有頭盔上面的攝像頭等等,我們的GPU也在用在這里面。
如果在設計產(chǎn)品,基本上希望在進行生產(chǎn)之前,就知道到底它看上去怎么樣,它的功能怎么樣。如果不能模擬就會浪費很多的時間和資源,這里有四個小例子??梢越o大家一些印象我們到底跟我們的合作伙伴做哪些東西。這是空中客車,這是3D的虛擬化空間,到處都是投影機,上面、下面、后面都是投影機,這些投影機會投出3D的影像,你需要戴上3D的眼鏡進這個房間,你感覺在這個房間里面,空中客車就設計了這樣一個空間,他的空間非常大。比如向新加坡航空公司,或者漢莎,他們就會到空中客車總部訪問,這時候空中客車就會向這些經(jīng)理人來展示和模擬新產(chǎn)品。
保時捷也在采用我們的技術(shù),例如用尾燈的設計,保時捷用了RTT的產(chǎn)品,其中用到了我們的GPU,這是尾燈的設計。由于他們不希望進行實物模型的制作,通過這種模擬就省了他們50萬美元的設計經(jīng)費。因為往往他們希望需要做4—5個不同的設計,以往他們需要實物模型,而現(xiàn)在已經(jīng)徹底數(shù)字化了。
還有大眾,大家可能也知道,上海大眾在國內(nèi)的知名度,大眾有超大的屏幕,不僅僅是來模擬設計,同時還可以來模擬駕駛,比如說在設備和人之間的距離是多少,甚至是生產(chǎn)也可以進行模擬。右下角這張圖,人們正在模擬制造一些維修,比如說你把這個車拿過來,發(fā)動機在里面,而你在進行維修的時候,你要換引擎,可能需要保證不需要動其他的東西,就可以來對它進行更換等等。所以,人們在用我們的技術(shù)時更快的可以投入市場,并且也可以節(jié)省他們的資金。
在不久的將來,汽車導航系統(tǒng)不僅能幫他們導航,要到達他們想要到的目的地,同時也可以幫助人們,因為系統(tǒng)可以看,同時可以識別東西,待會兒Andy Keane會講到GPU計算,會講到GPU不僅僅是幫助顯示還有其它的用途。在這里我們可以看到,我們在車里裝了GPU,你可以看到左邊有兩張圖,一張是車前面真正的機井,另外可以看到下面西門子授權(quán)的一個設計,前面裝了一個攝像機,真正來捕捉這些圖像,通過我們的導航系統(tǒng),在屏幕上放一個箭頭,這樣就知道朝著前頭走。在右上角有儀表盤的設計,就是說在這不再是一種模擬的儀表盤,而是采用了全新的技術(shù)。這個數(shù)字儀表盤采用了比較高的分辨率,大概有1000—2000像素。而且你可以不斷地把功能來回的調(diào)換,有的時候你可以調(diào)成儀表,同時想換的時候,比如說想看一下你們前面攝像機設一些鏡頭和圖片的話可以調(diào)換。
#p#page_title#e#
第3頁:NVIDIA專業(yè)圖形解決方案高端論壇——Walter演講(下)
看下面這張圖上你可以看到這是一個新的技術(shù),這個技術(shù)也是在美國開發(fā)的,這個技術(shù)能夠幫助我們捕捉一些圖像,之后把圖像改成數(shù)碼的,它甚至能夠做一些警報系統(tǒng),假設顏色變紅的話,你可以看到前面可能有一些障礙物越來越近了,總的來說是一個比較好的預警系統(tǒng)。
我們在車里面做一些GPU,不僅在設計上,還有內(nèi)飾也會應用到GPU的技術(shù)。另外跟圖形無關的高性能計算領域,GPU也有比較好的應用,接下來我給大家介紹一下我們在這方面的市場情況。
這張圖能夠讓大家非常容易的理解,可以看到運輸界的高速提升,或者說吞吐量的高速提升,你可以看一下,之前大家使用航船來進行交通,就是藍色線表現(xiàn)的階段,然后開始使用其他的交通工具。對于航船的速度提升是非常緩慢的,不是說一下子提升起來。你可以做一個航船的運輸之后,兩個三個甚至可以加兩個…,太平洋、大西洋的運輸。但是蒸汽輪船的發(fā)明將跨大西洋航行時間減少到了兩個星期,最短的時間可以接近一個星期。到了飛機被發(fā)明的時候,跨大西洋的航行在畫下了一個篇章。
對數(shù)據(jù)處理能力來說,你只用CPU來做數(shù)據(jù)處理可以看到,它的浮點的增長數(shù)比較點,所以人們之前用CPU進行計算的時候,在絕對計算速度而言并不是很好,而當人們使用CPU做其他的工作,并沒有真正用于計算。但是隨著時間的流失,GPU的運算功能被發(fā)掘出來,比如說運用化學領域,機損化學領域,以前需要花6天的時間做一些數(shù)據(jù)處理,現(xiàn)在不到30分鐘就可以處理了。對于神經(jīng)建模來說,如果只用CPU進行出具處理得話,大概需要花2.7天的時間,現(xiàn)在用GPU只需要30分鐘。對于無線射頻模擬來說,以前要8小時的時間做模擬,模擬無線射頻,現(xiàn)在只需要13分鐘都不到的時間模擬。你可以看到浮點增長的速度隨著GPU技術(shù)的出現(xiàn)得到了很大的改進。
我們不僅僅把這個技術(shù)應用于工業(yè)領域,包括設計車內(nèi)的內(nèi)飾,同時我們也做一些醫(yī)學上的應用。
你可以看到這張圖,大家看到的是超聲波對嬰兒胚胎的掃描,現(xiàn)在的掃描結(jié)果中我看不清也看不明白孩子在哪兒,如果你用我們的技術(shù),可以真正的重現(xiàn)3D、2D的圖形,通過掃描就可以實現(xiàn),這樣你可以看到體內(nèi)的嬰兒可以長什么樣子。你可以看到,通過GPU技術(shù),你可以做3D、2D的轉(zhuǎn)換。我們在醫(yī)學領域可以在很多領域看到GPU的使用,不僅是圖像的使用,包括計算。
地質(zhì)學家也在這個領域進行了一些分析,因為他們要處理得數(shù)據(jù)非常大,甚至有的時候會使用T字節(jié)級的數(shù)據(jù)進行分析,看一下對石油的勘探來說,他們目前在使用我們的技術(shù),比如說可以看到,你們通過對地面的一些探測的顯示,可以看到不同的層,搜集不同的數(shù)據(jù),數(shù)據(jù)量比較大,假設用CPU計算可以花幾個月的時間處理這些數(shù)據(jù),但是通過使用GPU,實際上速度要提高17—20倍左右,假設你用一個GPU的話,可能得使用20個CPU,所以GPU的功能要更為強大,尤其對數(shù)據(jù)處理來說。如果你要處理大量的數(shù)據(jù),GPU可能是你選擇的技術(shù)。
在金融領域也是如此,在股票交易上GPU計算技術(shù)經(jīng)常會被使用,比如說人們要進行金融風險的分析,這個時候可以用CPU來做一些分析,在GPU上面做數(shù)據(jù)分析,比如說每一次在GPU可以做15萬字的齊全模擬,非常精準和高效。
另外一個非常有趣的領域就是GPU能夠使機器有一些認知能力,比如說能看能聞,像狗能夠聞到癌細胞一樣。我們在美國也和一家合資公司進行合作,做了一些分析,而且記錄出電腦的反應情況。同時他們也開始對嗅覺進行一些分析和模擬,模擬大腦的反映,他們用GPU的技術(shù)來教電腦來探來聞,所以我想在幾年之后我們將會看到他們的一些研究和制作成果。也就是說電腦可以真正來聞一些東西。
我們怎么樣能夠跟上最新的技術(shù)呢?為什么要將Quadro產(chǎn)品應用在這些領域呢?Quadro實際上在設計產(chǎn)品方面有一些獨特的優(yōu)勢滿足我們客戶的有一些獨特需求,我們需要對他們的需求做定制的一些設計。比如像空客,還有一些其他的航空公司,他們在不同的電腦中使用同步鎖向,比如說SDI可以應用電腦影片制作,Quadro Plex可以在PC上進行高性能的GPU的應用,我們希望能夠覆蓋一些城市設計的需求。就性能而言,我們優(yōu)化了Quadro,假設你看一下芯片,Quadro的芯片和其它GeForce的芯片基本上類似,但是在內(nèi)部有更多的晶體管,這樣你可以對Quadro做一些簡單的設計,把一些高級的原件進行實效分析,和專業(yè)的應用相比,Quadro的性能比較好,而且更為穩(wěn)定一些。
另外我們還和一些公司合作,來引證和驗證相關的產(chǎn)品,比如說Autodesk,Adobe,這些公司對我們的驅(qū)動進行測試,同時給我們驅(qū)動和硬件進行認證,但是對GeForce來說不太了解,所以不能進行認證和驗證,他們的生產(chǎn)周期比較長,所以在Quadro中整個產(chǎn)品組合比較多,GeForce主要使用娛樂領域,速度是非常重要的,Quadro和它不一樣,GeForce速度有10%的變化,但是Quadro在啟動24小時內(nèi)隨著時間功能會增加。
看一下GPU,比較一下Quadro和GeForce的性能比較和基本設計上的區(qū)別,你可以看到從這個垂直應用角度來說,Quadro的性能是GeForce的5倍,尤其是它通過Shader Model 4.0、OpenGL和DX10,進行了性能加速的提高,我們更多關注垂直市場,我們也和很多的公司客戶進行聯(lián)系,包括國內(nèi)的一些大的公司,比如說浦東發(fā)展建設銀行,發(fā)展建設公司等等。還有很多大的客戶,我們也征求他們的需求,比如說你們未來6個月、12個月、24個月的需求是什么,我們把這些信息搜集起來給我們的設計人員作為參考。之后我們需要12—18個月的時間進行設計這些產(chǎn)品,目前客戶有很多問題,我們可以幫他們解決這些問題,比如說給他們提供我們的獨立軟件供應商還有我們的硬件合作商,包括聯(lián)想、HP,和他們一起幫助我們的客戶解決問題。
同時,我們也在教育我們的客戶,希望今年我們能夠把客戶教育的體系擴展到中國,我們通過垂直市場,包括奧林巴斯,還有和其他的一些合作伙伴建立合作伙伴關系,同時也通過一些圓桌會議進行討論,比如去年在德國大概有140名非常關鍵的IT人物在圓桌會議上跟我們共享了一些技術(shù)信息。
眼見為實,接下來我給大家放兩段小片子,給大家介紹一下目前通過我們的技術(shù)能夠做一些什么樣的事情。第一個關于實時光線追蹤的,在一年前需要200個或者是400個CPU做實時光線追蹤,現(xiàn)在只用一個系統(tǒng)就可以做。比如說看一下(蘭博基尼)的例子,這是一個(蘭博基尼)的車,這里面有反光鏡的影子,但是沒有真正的反射,但是你可以看到電腦在做一些計算,看一看反射的結(jié)果,你可以看到它從反光鏡里面做一些反射的計算,同時也做一系列的相關的計算,所以你可以看到以實時的方式能夠看到這些光線。這是通過一些追蹤的技術(shù)在進行改進,你可以看尾燈,保時捷當時憑借對實時的追蹤,希望能夠?qū)ξ矡暨M行光線追蹤,現(xiàn)在你可以通過這個技術(shù),可以看到實時的尾燈光線追蹤,這個地方也一樣,這種實時的追蹤能夠給你一種更好的感知,在模擬過程中能夠更好的了解產(chǎn)品設計的結(jié)果是什么樣。
接下來就是一種提升的技術(shù),這個提升的技術(shù)是什么,由于我有一個視頻,同時又一些3D的技術(shù)在一起,我們對RTT也做了一些研究,就是對實際的車輪的輪胎設計做了一些研究。你可以看到,這是攝像機把整個輪胎拍攝下來,在里面你可以看到有一些標志點,這些標志點被電腦使用。這個輪胎是真的,但是里面的輪轂是一個3D的制作,大家可以看到里面的反射,外面是真的,但是里面是3D的,這樣大家可以看到實時的輪胎在轉(zhuǎn)動,到底設計在里面是怎么反映的。這個看上去已經(jīng)不錯了,但是我們再加上第二個像機在這里,它可以由計算機來反映的是一個光源在上面反射的狀況,所以大家可以看到,實際上我們公司進入的領域是很多人不知道我們所在的領域,很多人只知道我們在游戲方面做的非常不錯,我希望大家能夠把這些訊息傳達給你們的同事們還有其他人。就是NVIDIA不僅僅是做游戲產(chǎn)品的。
謝謝大家!希望大家今天過的愉快,而且我們在今天來的分會場希望能夠再次看到大家
#p#page_title#e#
第4頁:NVIDIA媒體圓桌會——Walter演講(上)
時 間:2008年1月17日(13:30—15:00)
地 點:北京麗思爾頓酒店
魏鳴:謝謝大家下午又回來這里,今天很多內(nèi)容要裝到腦子里,我們在上午在Walter的主題演講里面,從更高的層面來講專業(yè)圖形解決方案對行業(yè)的影響對人生活的影響,下午有一些媒體,我們想更細的介紹一下Walter的解決方案,這個產(chǎn)品的特點,架構(gòu)是什么。所以下午注重技術(shù)型,同時也會講在某些垂直行業(yè)我們?yōu)槭裁醋龅暮?,為什么在這個市場里占有率是80%,我們是怎么做的這么深的,所以從這幾方面具體的解釋一下。他先有一個PPT的演講,然后是媒體問答。
Walter:首先介紹一下我自己,大家可能從我的名字也能看出,我并不是美國人我是德國人,但是我在美國工作,我在NVIDIA工作了7年,我之前在艾爾莎這個公司負責銷售和執(zhí)行總裁。在2000年的時候,雖然艾爾莎是最早在用NVIDIA的東西做工作站的產(chǎn)品,在那年也是NVIDIA收購了艾爾莎這個公司所有相關的資產(chǎn),并且把開發(fā)人員也帶到了NVIDIA公司。
在之前我們只有Quadro和GeForce這兩個產(chǎn)品線,也可以說是兩個品牌,現(xiàn)在也就是9月之前我們推出了Tesla,大家早上已經(jīng)聽到了,我們現(xiàn)在已經(jīng)有了三個針對不同市場的三個產(chǎn)品線。GeForce主要是在娛樂游戲這塊兒的,Quadro主要是在專業(yè)DCC,還有垂直市場這塊兒,數(shù)字內(nèi)容創(chuàng)建等。Tesla主要在計算這塊兒,早上我同事跟大家介紹了有關Tesla這塊兒,下午我主要講Quadro這部分。
實際上我們可以看到這三個不同的產(chǎn)品線,它們不僅僅是品牌不同,而且芯片相關的技術(shù)也不一樣,相比較Tesla和GeForce,我們Quadro產(chǎn)品應該說更超級的硬件的組合,因為里面有專門是用于OpenGL,還有一些專用的不同的驅(qū)動,同時也支持AutoCAD。
這張圖上(PPT)大家可以看到有關Quadro的相關數(shù)字,我們在NVIDIA,加起來有15000人年的專業(yè)GPU經(jīng)驗,到個月底,也就是說到我們這個財年接觸我們能夠出貨的針對專業(yè)級的GPU是1200萬套,看到我們這個數(shù)字是1200萬套,而所有其他的競爭對手在這個專業(yè)領域的SGI,所有加起來的整個出貨量都不達不到我們這個數(shù)字。我們總的研發(fā)費用每年是 10億美元,這里不僅僅指Quadro產(chǎn)品,其實也包括其他的GPU產(chǎn)品,還包括媒體、通信、處理器等等,所有加在一起是10億美元的研發(fā)費用。正是由于我們這種研究的能力,我們的投入,我們的支持,我們確信我們公司在相關的工作站的處理器是最優(yōu)秀的。再看一下我們的專業(yè)團隊,專門進行專業(yè)領域的解決方案開發(fā)的工程人員有200名,包括在美國東西海岸,包括在德國、印度,可以說我們這些工程是地理方面區(qū)域分配跨了所有時區(qū),一旦有問題在這里沒有解決,可能很快就傳到另外一個地方解決。我們這個產(chǎn)品實際上有垂直市場非常大的市場份額,而且接下來我會向大家介紹,我們在這個市場上做的深度有多深,我們之所以現(xiàn)在在這個市場有80—85%的市場份額,要具體看地域,可能有略微的差異,主要是因為我們能夠給最終的客戶,通過我們的產(chǎn)品提供真正的一整套,適合他們的解決方法,我們?nèi)绾文軌蛑揽蛻粲惺裁磫栴},他們需要解決什么問題呢,我們就要和最終的用戶公司談,去了解他們的需求,這些客戶遍布航空行業(yè)、醫(yī)療行業(yè)、游戲等等,我待會兒再給大家介紹。
由于我們服務的客戶類型非常多樣,所以我們所提供的Quadro的產(chǎn)品平臺非常多樣化,這個和我們競爭對手有一些不一樣,我們競爭對手往往只有某一種類型,比如像桌面系統(tǒng)等等,我們實際上有筆記本電腦,用于臺式,用于工作站,還有單獨的Quadro Plex這個產(chǎn)品,圖形到了一定大的時候,往往需要的功耗是比較大的,把它放在一個里面可能不行,所以我們就出來了Quadro Plex的產(chǎn)品,用于這種需求,還可以用于刀片里面,惠普就用到我們一款Quadro產(chǎn)品,用在刀片里面,同時在不久之前我們還開始了有了服務器的環(huán)境,比如像遠程的圖形等等。這些都是我們可以提供的不同的平臺的產(chǎn)品,具體的接下來會給大家介紹。
接下來這個問題是,為什么人們要選擇Quadro,為什么不能用GeForce呢?這個問題經(jīng)常人有提到,實際上GeForce用在對圖形要求并不算太高的應用上,接下來我給大家舉一個例子,用AutoCAD這個軟件的例子,AutoCAD是大家比較常用的軟件,它的價錢并不是太高,大概4000美元左右,通過使用我們Quadro可以進一步提升AutoCAD的性能。
AutoCAD2008版出來以后,已經(jīng)從2D轉(zhuǎn)向了3D,我們在他們出來之后,也是對我們Quadro Plex的進行了相應的調(diào)整,從而能夠更好的支持它運用,而現(xiàn)在Autodesk、AutoCAD對硬件進行認證,以往他們并不這樣做,只所以要認證,是因為3D的環(huán)境中發(fā)生風險更高,所以現(xiàn)在對硬件進行認證,當然Quadro是經(jīng)過認證的。相比較GeForce而言,Quadro有一個大的特點就是它的設計,它的生產(chǎn)完全都是由我自己進行的,而GeForce只是我們自己設計出來一個所謂的參考設計,把這個交給我們的合作伙伴,由他們根據(jù)他們的最終產(chǎn)品的要求,進行相應的調(diào)整,比如說具體的規(guī)格,相應的環(huán)境、風扇、冷卻系統(tǒng)怎么做,都有他們自己不同的做法。他們對自己的最終產(chǎn)品負責,而我們對他們進行某些調(diào)整并不清楚。而在Quadro這個產(chǎn)品并不是這樣,完全由我們自己進行管理,所以從性能價格比這個角度來說,可能差異并不大,但是從穩(wěn)定性,從受到認證的情況來看,Quadro還是比GeForce要強很多。
大家看Autodesk的網(wǎng)站,大家可以看到它實際上對系統(tǒng)的要求增加了,原來都屬于標準,現(xiàn)在隨著64位3D出來,實際上規(guī)格增加了,要求也增加了,而且開始做認證了。如果說你去用這個軟件的話,實際上它里面時候會對這個系統(tǒng)的環(huán)境進行檢測,里面有一個叫性能調(diào)諧器,就會出來說這個環(huán)境是不是正常,上面的提示說的就是,現(xiàn)在的3D圖形環(huán)境是正常的。如果說你用的是一個未經(jīng)認證的設備就會出來一個警告,會告訴你這個可以用,但是這個是未經(jīng)認證的產(chǎn)品,這樣你可以用它,但是到底穩(wěn)定性和性能會是怎么樣,是不能保證的,而且出了問題是沒有辦法幫助你解決的。
大家如果看一下GeForce和Quadro價格在相同類似價位上,性能比較就可以看一下這張圖,這是一個雜志對AutoCAD的基本測試,左邊是GeForce,右邊的綠色點是Quadro,在不同的價格點上,Quadro的性能比GeForce高不少,也就是說很多人們會說Quadro太貴了,所以我們不用它,實際上用Quadro實際上不需要用那么高端的產(chǎn)品,可以往下降一降,在類似的價格上可以獲得更好的性能,并且是更穩(wěn)定的效果。這張總計了一下我剛才講的東西。
現(xiàn)在我們來看一下架構(gòu),架構(gòu)這塊兒大約在8個月之前,我們做出了一個改變,就是隨著G80這個產(chǎn)品的推出,我們公司在也是最先推出所謂統(tǒng)一架構(gòu)的,我不知道大家誰知道統(tǒng)一架構(gòu)這個概念?對于統(tǒng)一架構(gòu)來說,現(xiàn)在如果你要用OpenGL,DirectX10,并且用Shader Model4.0,就必須要有統(tǒng)一架構(gòu),否則就沒有辦法進行運行。為什么?我們先看一下過去20年當中,到底是一個什么樣的情況?首先我們知道這是GPU的工作流程,首先是負責幾何這塊兒,有負責像素這塊兒,在幾何這塊兒,應該由8個管線,在像素這塊兒有24個管線,幾何這塊兒處理三角形、點、多邊形等等,像素這塊兒主要是進行紋理、渲染、光線等等這些東西,這些會進行混合,要進行抗鋸齒的處理等等。這些數(shù)據(jù)再放到幀緩存當中,再顯示到屏幕上,這在過去20年當中,圖形處理的程序。大家好象聽上去有點兒暈的感覺,但是大家不用擔心,大家不用去設計GPU。
老的管線架構(gòu)有什么不好呢?老的架構(gòu)處理幾何這塊兒的管線和處理紋理這塊兒的管線是分開的,就是它只能做這個,或者只能做那個,我們看第一張圖的形狀,它負責幾何的管線處理幾何就非常繁忙,處理像素的下面沒有幾何形狀,但是有光線效果,還有紋理,差異非常大,所以在處理這張圖,就使得上面的負責幾何的這方面的管線沒有什么事情干,而負責像素的處理,紋理的管線就會非常繁忙。
再看一下這張圖,我們之前看到的是非統(tǒng)一的架構(gòu),也就是管線要么只能做這個,要么只能做那個,這上面是一個統(tǒng)一的架構(gòu),這個圖看上去非常復雜,但是基本上面每一個綠點都代表一個管線,最大的是128個,既可以進行像素的處理也可以進行幾何的處理,不像以前只能做這個或者那個,以前是8個幾何的管線,加上24個像素的管線是32個,現(xiàn)在我們在這上面最大的可以有128個管線。(大家隨時都可以提出問題來)
在統(tǒng)一架構(gòu)之下,跟以前就不一樣了,以后在統(tǒng)一架構(gòu)之下,如果是非常多的幾何的圖,所有線程處理器都可以進行幾何的處理,不像以前有一些只能用來進行像素的處理。下面這張圖是在紋理光線這塊兒,所以所有的線程處理器都可以進行相應的對光線和紋理的處理,其他的幾何處理只是其中很少的一部分。
在Quadro下面,我們也是針對不同的市場細分,在Quadro NVS這塊兒,主要針對2D的市場,還有金融業(yè)、呼叫中心等等,這個是用的比較多的在Quadro FX往往用于數(shù)字應用,創(chuàng)新用的比較多,另外一塊兒是比較專門行業(yè)的應用,比如說SDI,在廣播行業(yè)的應用,還有應用到大的屏幕強上面的,就需要用到我們同步幀鎖定交換鎖定的技術(shù),像你們看到在右下角這個Quadro G-Sync,在非常高的性能下放可以使用Quadro Plex這樣的產(chǎn)品。 針對于每一種應用,我們都有相應的應用軟件包,同時我們會把這些硬件和軟件提供給相應的公司,讓他們進行認證,進行測試,這就是為什么我們在Quadro這塊兒有非常多的合作伙伴。
這上面是我們幀鎖定和交換鎖定的技術(shù),如果大家聽了上午的演講,可能已經(jīng)聽到過相關的東西這是用在非常大的投影的顯示屏幕上,同時也用在3D的模擬空間當中,比如說用在產(chǎn)品的模擬還有一些產(chǎn)品的評估等等,比如在在投影屏幕應用當中,可以用相對簡單的做法,像有一個系統(tǒng)兩個投影機投到一個屏幕上面,現(xiàn)在很多用戶要求有更高的性能,所以會把這個分成4—6個接點,就需要主機和附屬機當中實現(xiàn)比較好的同步,否則的話,整個的圖象就會亂套了,這就是為什么我們有幀鎖定和交換鎖定來保證主機和其他附屬的機器之前能夠?qū)崿F(xiàn)好的同步。
#p#page_title#e#
第5頁:NVIDIA媒體圓桌會——Walter演講(下)
舉個例子,這是空客車,在歐洲他們所做的大的3D的模擬空間,這里用到了32個投影機,有16個屏幕,每個屏幕都是立體的,也就是一個投影機是管你的左眼,一個是管右眼,在前后左右上下都有相應的屏幕,它的大小和實際的大小是1:1比例,使得人在這里面可以用3D的模擬方式看到實際是一個什么樣的情形。在SGI公司不在市場上之后,我們公司是唯一一個能夠提供這種解決方案的公司了。
還有就是我們Quadro Plex這個產(chǎn)品。這里有一個例子,是比較新的索尼4K的投影機,一個投影機有4個輸入,在他們參考的配置當中用的就是Quadro這個產(chǎn)品,因為它要求無縫,并且是一個工作站的解決方案,他們認為用Quadro產(chǎn)品是最為適合的。我們還有遠程的圖形的產(chǎn)品,比如像在服務器環(huán)節(jié)當中的,在這個當中包含有4個高端的GPU,每個有1.5GB的緩存,在這個當中大家可以看到把風扇都放在下端了,它們屬于非常吵的,在使用這樣一個產(chǎn)品的環(huán)境下,大家都不愿意放在身邊,它專門是用服務器的環(huán)節(jié)設置的。對很多公司來說,他們希望能夠在服務器的房間當中把圖形的功能可以完成,出于安全考慮,可以在服務器當中把這些事情做完,再通過傳輸,傳輸?shù)浆F(xiàn)實設備去,這是他們認為以后希望實現(xiàn)的,而我們現(xiàn)在正在開始往這個方向努力。還有一個服務器的應用就是在金融類領域,他們不是出于安全的考慮,而是出于空間的考慮,比如說一個交易員,前面要擺6臺、8臺、10幾臺的顯示屏幕,他不希望放更多的電腦,而是希望使用服務器的解決方案,這也是介紹在空間當中產(chǎn)生一些熱或者其他相關的污染。我們QuadroNVS這個產(chǎn)品,很多是為金融行業(yè)設計的,它們集中在工作站之內(nèi),有相應的軟件幫助他們進行多個顯示器的管理等等,還有很多金融企業(yè)所需要的功能都可以通過我們的軟件來進行實行。
大家看到的這些產(chǎn)品都是使用統(tǒng)一架構(gòu),而我們最新推出就是FX3700,還有512兆的幀緩存,它的性能也會非常高,這個產(chǎn)品比較前面的產(chǎn)品它的性能提高是什么樣的情況呢?這張圖是我們新一代產(chǎn)品和此前產(chǎn)品之間的性能比較,藍色柱是我們新一代產(chǎn)品,黃色是前一代的產(chǎn)品,370是新一代,350是之前那一代,570是新一代,560是之前一代,這樣依此類推,可以看到在不同的高低端的產(chǎn)品上,新一代的產(chǎn)品性能相比較前一代都有比較大的提升,而且新一代低端一些的產(chǎn)品甚至超過了前一代比它高一級的產(chǎn)品。大家可以看到,我們最新推出的中高端的產(chǎn)品,F(xiàn)X3700,它和FX4600性能已經(jīng)沒有什么太多的差別了,至少從這個評測上面來說是這樣,它們之間的價格還有一定的差距,但是在這里所做的測試并沒有太多的考慮到,比如像幀緩存所帶來的影響,比如說你要處理很多紋理,有大量的數(shù)據(jù)的情況下,實際上幀緩存的大小對你的結(jié)構(gòu)還有比較大的影響,因為3700、4600、5600它們各自的幀緩存都不一樣,(一個是5、6兆,一個是8.5兆),看它們最終運行什么的軟件,可能最終出來的結(jié)果還是有一定的差異。除此以外,在我們一個產(chǎn)品推出在市場存在的生命周期當中,我們往往會進行4—6次驅(qū)動的改進,而且我們這個驅(qū)動是所謂統(tǒng)一的驅(qū)動,我們所出來新的驅(qū)動可以用在以前的產(chǎn)品上面,所以往往我們每過兩到三個月普遍就會對驅(qū)動進行一些更新,一般來說根據(jù)我們的歷史經(jīng)驗,在一個產(chǎn)品從推出到撤出市場這段時間之內(nèi),它的性能由于驅(qū)動的改進會有30—50%的提高,所以大家從這張圖上所看到的性能的表現(xiàn)還不是最后能夠達到的最高的狀況。
同時,我們新推出的產(chǎn)品,它在功耗上面也有所降低,像3700這款,功耗大概在78瓦左右,而之前這一代是在150瓦左右,性能優(yōu)60%的提高,功耗大概下降了一半左右,總的來說我們這些新的產(chǎn)品每瓦效能都有比較大的提升,在上面所列出的產(chǎn)品當中,都已經(jīng)經(jīng)過了能源之星的評定。我們這些產(chǎn)品從FX370—FX3700都用PCI-E2.0,意味著我們總線帶寬已經(jīng)提高了。當然坦白來說,大部分的應用并不能用到這些帶寬,只能在很高端的應用上使用這些帶寬。
與此同時,我們還在驅(qū)動環(huán)境當中不斷提高我們的產(chǎn)品用戶友好性,比如我們有一個叫ACE(程序配置引擎),為什么要有這個呢?我們知道對專業(yè)用戶來說,他們往往同時使用多個軟件,比如在桌面上同時運行幾個,AutoCAD、Autodesk等等,同時打開,往往在以前他們需要針對于每一個,比如說利用這個應用的時候,需要對于驅(qū)動進行相應的設置,以實現(xiàn)最優(yōu)的性能,再用另外一個再重新設置一遍,這樣很麻煩?,F(xiàn)在我們有了這個ACE,就會自動發(fā)現(xiàn)他在用什么,比如說你點開了新的軟件,新的程序,它就會發(fā)現(xiàn)你已經(jīng)用這個東西了,它就會進行相應的驅(qū)動配置的調(diào)整,使得你可以在用這個程序的時候?qū)崿F(xiàn)最優(yōu)的性能,這個是我們最近才剛剛推出的,現(xiàn)在是用在Vista和XP上面。這是我們剛剛所推出的比較新的產(chǎn)品,是一周之前才推出的,我就不具體講產(chǎn)品具體的規(guī)格,如果大家有興趣可以聯(lián)系我們在中國的同事,因為也有同事在這邊,可以想他們要一些樣品等等,可以進行一些檢測等等。
現(xiàn)在我們看一下,在垂直市場上面所做的工作,對于競爭對手來說,他們對于垂直市場的定義,比如說制造業(yè),實際上對我們來說,制造業(yè)并不是一個真正的簡單的垂直市場,比如像在制造業(yè)當中就可以分成汽車、航空、造船等等。而在僅僅在汽車這個行業(yè),都可以分成非常多的步驟,而且是非常復雜的。比如說首先是造型,在造型這塊兒就要畫出車的圖等等,你想讓它是什么樣的形狀,通過造型就進入到設計階段,比如說你車身和表面怎么做,儀表盤,相應的電子設備,還有動力總成,包括你的引擎、發(fā)動機、輪子應該怎么樣,還有軸等等到底怎么樣設計。在設計之后還要進行數(shù)字的模擬,就是上面的DMU,就是數(shù)字的模擬,還要考慮到駕駛的模擬,還有碰撞模擬,還有空氣動力學方面的考慮。同時,在這個之后還需要進入生產(chǎn)過程,就要進行模具的制造,這個過程當中也會用到可視化的東西,同時在工廠的設計上也希望是最為合理的,所以也需要首先要有一個數(shù)字工廠,進行數(shù)字模擬,需要最大的合理性,這些過程當中會生成很多3D數(shù)據(jù),也可以應用到市場營銷當中。
舉個例子來說,像奧迪2.8這個車,在相應的資料片上市之前,實際上并沒有一輛真實的車存在,所有的資料片當中所用的東西都是利用3D制作出來的。這些3D數(shù)據(jù)化可以用做很多的用途,像保時捷有了這些3D數(shù)據(jù)之后,應用到他們的培訓當中,比如說修理的培訓,還有在網(wǎng)絡上讓這些用戶可以自己來進行車輛的配置,通過使用3D數(shù)據(jù),我們不久之前也收購了一個公司,這個公司也做很多相關的產(chǎn)品的開發(fā),比如說在網(wǎng)絡上如何進行實時的車載的配置等等,這都是他們的專長,同時也可以把這種技術(shù)用到經(jīng)銷商的終端,比如像通用汽車歐寶這個品牌,他們在歐洲已經(jīng)是部署了600臺這樣的終端,而且通過使用這樣的終端,每一個經(jīng)銷商都可以把他們的銷售增加30%。
現(xiàn)在我們可以看到,在整個汽車的設計、生產(chǎn)、銷售過程當中,在很多的步驟上都可以用到我們這個產(chǎn)品,比如說像前面在演講當中大家也看到了,在車身內(nèi)部現(xiàn)在一些GPU產(chǎn)品的使用,比如在顯示屏儀表盤,有駕駛員的支持系統(tǒng)等等,這些都可以用這個技術(shù),而且現(xiàn)在很多的領域有CUDA和Tesla的產(chǎn)品,在模具方面我們希望使用通用的GPU,像模具制作過程當中,會有一些塑料跟一些金屬,它們之間要脫開需要有一個比較巧妙的角度,一個什么樣的角度可以做的最好,這些都可以通過GPU的使用進行相應的模擬,從而實現(xiàn)最佳的模具制作,在這方面我們都在進行工作。
大家可以看到這些是我們在中國之外的合作伙伴和客戶,里面有美國、歐洲、日本、韓國,Google也是我們的客戶,比如像Google Earth,我們跟大眾進行一個導航系統(tǒng)的研發(fā),就會把數(shù)據(jù)從Google Earth拿過來,車里的駕駛員就可以讀到這些數(shù)據(jù)。Google也用到我們的服務器相應環(huán)境的產(chǎn)品,比如在服務器當用到了媒體通信處理器,在美國的Google在他們的平臺之上就有100萬個服務器接點。當然,也可以看到我們的客戶遍布非常多的行業(yè),比如在汽車行業(yè),大家看到了很多汽車公司,還有醫(yī)療設備,包括通用電器,還有飛利浦、西門子等等,還有廣播電視臺等等,還有像電子產(chǎn)品,很多這些公司大家都非常熟悉,都是我們的客戶。在中國我們時間非常短,在Quadro這塊兒僅僅只有一年半的時間,但是我們也非常高興,中國的公司也非常愿意使用我們的產(chǎn)品。從這一頁上可以看到使用我們相關產(chǎn)品的公司的名字,寶鋼、福田汽車、通用、大眾、一汽等等,當然也有原因是因為他們很多都和國外的車廠進行合資,像豐田、大眾、奧迪等等,所以我們進入的途徑相對來說也比較容易。
這上面大家可以看到更多,比如說數(shù)字內(nèi)容制作,還有游戲行業(yè),我們在國內(nèi)的一些客戶,我也認識客戶當中很多的人,我們的銷售團隊在中國也有很多的相關人員,我們也會到世界各地去和這些客戶談,去了解他們存在什么樣的問題,我們看是不是可以通過我們軟件的合作伙伴幫助他們解決相應的問題,當然通過利用我們的產(chǎn)品。
我已經(jīng)講了很長時間,聽了這么多,大家都覺得自己可以去設計圖形卡了,不知道大家現(xiàn)在有沒有什么問題?非常愿意回答大家的問題。
記者:剛才說到Quadro是通過動態(tài)分配統(tǒng)一渲染,兩個單元,渲染單元和像素單元,我想知道是怎樣進行的,是通過CUDA嗎?協(xié)調(diào)動態(tài)統(tǒng)一是如何進行的?
Walter:主要通過GPU當中的驅(qū)動來進行的,到底哪些是幾何,哪些是像素部分,比如說這個數(shù)據(jù)進來,我們這個軟件就會自動判斷,到底是屬于處理三角形、幾何這塊兒,還是處理像素紋理這塊兒,對每一幀進行測試,看哪些屬于幾何,哪些屬于像素這塊兒,總的來說由驅(qū)動進行分配,這和CUDA不一樣,CUDA是針對于每一個處理器,在CUDA當中是通過驅(qū)動來進行的。
記者:有沒有與奧運會相關的客戶以及新的應用?
Walter:我們確實有,但是沒有得到客戶的許可,沒有辦法給予一些詳細的信息,比如我們跟(索貝)有很多的合作關系,他們是給很多廣播類的公司進行軟件服務,特別是高清環(huán)境下,高清電視和3D內(nèi)容是做的比較多的領域,還有(水晶石)這個公司,也在這方面做很多的工作,也是我們的合作伙伴。
記者:是不是針對細分的垂直市場的功能,是不是已經(jīng)集成在里面了?
Walter:我覺得你說的沒錯,比如說我們針對于廣播行業(yè),我們有SDI的技術(shù),SDI應該叫串行數(shù)字接口,它可以幫助實現(xiàn)你的3D內(nèi)容和視頻融合在一起,如果做到這一點,就需要有一個SDI的輸入,往往以前的做法先在 GPU上面做,然后再到SDI板上面去,現(xiàn)在通過我們這個產(chǎn)品,就把GPU和SDI放在一起,可以實現(xiàn)實時動畫等等,我們針對超大的屏幕墻有我們的同步鎖幀的技術(shù),針對數(shù)字內(nèi)容創(chuàng)建OpenGL,我們有專門的驅(qū)動,我們針對不同的市場有不同的驅(qū)動,還有相應的硬件。看一下我們這個產(chǎn)品系列,我們有8個標準產(chǎn)品,有5、6個針對不同行業(yè)的行業(yè)性的產(chǎn)品。大家可以看到下面這張畫是針對不同的,比如像SLI可以實現(xiàn)更高的性能,SDI是適用于廣播的行業(yè),最后一個主要是在服務器環(huán)節(jié)當中進行使用的。還有一個MBS,這個產(chǎn)品主要是針對金融行業(yè)的還有呼叫中心,甚至包括9.11這種急救電話中心,因為他們有很多屏幕需要同時進行管理。
記者:是不是這些是我們目前有的垂直專業(yè)市場的產(chǎn)品?
Walter:這是目前我們有的垂直專業(yè)市場的產(chǎn)品都在上面。這里面實際上有些是第三代產(chǎn)品,G-SyncII已經(jīng)是第三代產(chǎn)品,SDI是第二代產(chǎn)品,Plex是第二代產(chǎn)品,服務器是第一代產(chǎn)品。
記者:剛才說這個這個圖形服務器跟Tesla在應用上有什么差異嗎?
Walter:這里有一些不同,首先Quadro Plex是支持OpenGL,而Tesla是不支持OpenGL的這是一個區(qū)別。第二,他們的內(nèi)存不一樣,因為對于計算來說內(nèi)存非常重要,所以Tesla是一種特別的內(nèi)存,比如說對圖形來說,即便內(nèi)存犯一點兒錯也不是那么大的問題,因為一個像素每秒鐘要變50次,有一點兒錯誤沒太大的問題,Tesla是用于計算,如果這里有錯誤,都會影響后面的計算,所以后面的準確性都非常重要。我們在Tesla當中有一個內(nèi)存控制器它會對對錯進行檢查,這和Quadro是不一樣的,而且本身它的內(nèi)存也是特殊的內(nèi)存也不一樣??偟膩碚f,Quadro支持OpenGL,Tesla內(nèi)存更好一些,GeForce就便宜一點。Quadro其是從圖形的角度,Tesla是計算的角度。
#p#page_title#e#
第6頁:NVIDIA專業(yè)圖形解決方案高端論壇——Andy篇(上)
時 間:2008年1月17日
地 點:北京麗思卡爾頓酒店酒店 大宴會廳
Andy Keane:非常感謝大家今天來參加我們的論壇,這是我第一次到中國到北京,我覺得這個機會非常棒。今天我要跟大家介紹什么呢?是一種為大家設計推出的全新技術(shù),幫大家解決軟件開發(fā)中的新問題。
CUDA技術(shù)是在去年推出,在Tesla之后推出,主要作用是幫助大家解決在你們的軟件、科學研究和工程當中出現(xiàn)的新問題,所以我的演講會是兩部分,首先是CUDA技術(shù),CUDA技術(shù)怎么出現(xiàn)的,大家如何使用這個技術(shù),然后講另外一個產(chǎn)品線就是Tesla,這個產(chǎn)品線是面向工業(yè)應用的,把GPU用于以前沒有用過的地方,比如說數(shù)據(jù)中心,人們在進行科學研究以及工程方面的應用。
從這張圖上大家可以看到,可編程GPU隨時間發(fā)展的狀況,2002年我們推出了第一個可編程的GPU,在那個時候我們的變成單元只涉及了GPU的很小一塊兒——著色器,于是,在2002年,我們開始有了可編程的著色器。因為我們的用戶是希望有這樣一種功能的推出,這樣的話就使得那些開發(fā)人員他們可以在圖形當中做一些特殊的效果,就可以用到他們的創(chuàng)造性。因為本來GPU的功能是特定,而在2002年我們也希望能夠把GPU用于除了圖形以外的一些應用,在2002年我們就推出了32位的浮點,這不僅僅是用于圖形的,把這個技術(shù)給了開發(fā)人員,而最終我們犯了一個錯誤,就是在早期我們忘了一個重要的事情,這個重要的事情就是這是一個軟件工具,我們必須要能夠解決軟件開發(fā)人員的問題,不僅僅給他們一個硬件,一個新的處理器是不夠的,因為在那個時候GPU僅支持OpenGL圖形計算的,我們認識到這個錯誤重新開始,在2003年我們用了一些新的人,像計算機架構(gòu)人員,語言開發(fā)人員,讓他們和圖形以及工程人員一起開始了新的項目,最終就推出了我們的CUDA的技術(shù)。CUDA技術(shù)不僅僅是GPU的計算技術(shù),同時也是編程環(huán)境,編程語言,它是第一個能夠把定型計算串行計算融入到一起的技術(shù)。開發(fā)人員解決了一個計算問題,他們用的C語言,C++,登記于網(wǎng)絡的語言或者是Java。他們在編計算程序的時候,他們怎么來做的呢?他們是做一個C程序,然后就在CPU上進行串行的計算,這個計算是按順序來進行的。給大家看一個例子,要進行并行計算的話,開發(fā)人員不得不加很多的軟件,就像多核或者是集群,你必須要用軟件的工具來解決并行計算問題,我們在CUDA當中怎么做的呢?
在CUDA當中,我們創(chuàng)建了一個環(huán)境,CUDA是可以統(tǒng)一并行和串行計算,CUDA是有三個組成部分,他是一個C語言編譯器,實際上用CPU的編譯工具開發(fā)出來的,這個方式IBM經(jīng)常使用,還有一個專門的計算驅(qū)動程序,這不是一個圖形的驅(qū)動,而往往速度更快,而且和圖形的驅(qū)動不一樣,這樣的話就可以增加我們的計算能力,并且獨立圖形之外的,還有工具,還有標準的CPU類型的工具,包括像調(diào)試程序,分析器,我們還有很多樣本例子來說明如何用技術(shù)來解決一些相關的問題。我們還有很多的培訓,還有手冊,還有教育工具,能夠讓開發(fā)人員來學習如何在GPU上進行編程。我們看一下首先是計算的格式,我原來是做微處理器設計的,我們使用單核做一個設計,有一個指令在任何時間都能進行一個指令的執(zhí)行。它是一種串行的方式,也就是一個一個指令來的。如果CPU是按照順序來的,而且是一小塊兒、一小塊兒來的,而CPU的工作方式首先要有很高的頻率,而且要很大的緩存,這樣的話就可以實現(xiàn)非常高速的串行計算。但是看一下GPU非常不一樣,GPU的設計可以解決并行的計算問題,圖形就是這樣,向每一幀大量的像素,像3D當中更是以百萬進行計算,這些都是并行實時的,所以大量的同時通過GPU,而且大量是并行,同時進行計算。就是說把所有的數(shù)據(jù)一起拿進來,可能是128個處理器同時進行計算,所有都是同時進行。CUDA就是這兩種類型之間的連接點,開發(fā)人員開發(fā)一個C程序,然后把CPU的代碼和GPU的代碼在原代碼當中共存,而CUDA成為了串行計算和并行計算的連接,心里我們有一個編譯器在GPU上可以并行使用,CUDA可以延伸到CPU當中,也就是說大家可以編CUDA的程序,并且可以在CPU上面進行執(zhí)行,所以可以用并行的概念,并行是用于不同的設計當中。
看一下到底在一個并行和串行當中有哪些不同的特性呢?首先看一下GPU,它不是代替CPU,它們必須是攜手合作,因為CPU有很多的技術(shù),可以解決某些特定的問題,這些問題是非次序的,這些數(shù)據(jù)必須按照數(shù)據(jù)進行。操作系統(tǒng)就是一個非常經(jīng)典的類型問題,是CPU非常善于處理的,很多不同的功能之間沒有關聯(lián)性,所有的數(shù)據(jù)之間沒有關聯(lián)性,所以要實現(xiàn)這種功能。還有數(shù)據(jù)庫,同時還有時間的壓縮,同時不斷地使用同樣的代碼,這種類型對CPU來說非常適用。GPU就不一樣了,有一些類型的問題,他們存在共同性,存在共同的主題。首先是海量數(shù)據(jù)的處理,像石油天然氣,他們從大陸上海上搜集到大量的數(shù)據(jù),然后需要進行處理怎么樣來進行挖井,還有金融風險,股票市場,國內(nèi)還有其他國家的,所有這些信息數(shù)量非常大,需要進行處理幫助人們進行正確的決策。
還有另外一個例子就是醫(yī)療成像,在先進的醫(yī)療設備當中,比如像CT機或者是核磁共振,往往傳感器會出來大量的數(shù)據(jù)需要同時進行處理,這對GPU來說非常適用。當然GPU是需要和CPU來進行合作,進行數(shù)據(jù)的管理,對操作系統(tǒng)進行管理等等。GPU上有三個不同的東西,首先有專用的計算,在GPU當中,在進行計算的時候是一種非常特殊的方式進行,它不再做圖形,而是將自己作為一個計算單元模擬一個處理器就是來進行計算。第二,GPU上的C環(huán)境,C是什么,任何開發(fā)人員理解C語言,現(xiàn)在就可以理解如何來對GPU進行編程,而真正的挑戰(zhàn)很多開發(fā)人員面臨的就是如何來進行一個并行的計算機的軟件,這個和其他的是一樣的,無論是多核還是集群,或者是GPU問題是一樣的,并不是一個單獨的GPU的問題。第三,出去在數(shù)據(jù)中心有一個問題,比如說你有一個高性能的工作站進行工程設計等等,我們有一個專門的GPU產(chǎn)品針對這種環(huán)境。其中金融方面的計算,這是非常復雜的,結(jié)果非常不錯。還有另外一個是天體物理學,就在今年波士頓就有一個專門的會議就是有關GPU在天體物理學當中的使用,有一百多個科學家會來講,他們來自全世界,會講到新的類型的研究在GPU上面,以及他們?nèi)绾伟堰@個利用到天體物理學的研究當中。在這樣的一些應用當中,還有一些設計應用當中,他們以前需要在大的計算機集群上,比如現(xiàn)在可以在工作站就可以解決了。
而且非常強調(diào)游戲的體驗,游戲的性能,CUDA前面Walter也講到了,是用一些專業(yè)的應用,某些特定的產(chǎn)品,一些性能。
第三個就是Tesla,為什么要用Tesla,是因為在數(shù)據(jù)中心沒有GPU,所以我們是專門引出了這種產(chǎn)品,針對特定類型的客戶。在這些GPU上,他們能做一些什么呢?大家可以看一下在GeForce上面,為什么要用GeForce上面的CUDA呢?除了游戲以外,很多游戲人員把CUDA納入游戲當中,還有很多圖像,有很多數(shù)據(jù)是相機,我們可以獲得更快的圖像,更大的像素,更好的互動,更平滑的畫面。用CUDA可以把所有這些好的這種圖像功能用出來,還有音頻、編碼、解碼、壓縮、安全性等等,所有這些功能都可以在GPU上并行處理。CUDA可以實現(xiàn)圖像可視化和音頻圖像同步。
通過CUDA可以讓這些更快,還有我們前面講了Tesla,它有哪些應用,下面我會更具體的講。這是最新的應用,在過去兩三個月當中出現(xiàn)的,像實時的期權(quán),還有分子動力學,還有超聲影像,這是分子動力學當中的代碼,可以是嵌入到很多其他的不同的環(huán)境當中,我們有很多的例子,在地震偏移等等。CUDA可以免費提供,所以有很多的軟件不斷地出來我們也非常關注這些發(fā)展。
#p#page_title#e#
第7頁:NVIDIA專業(yè)圖形解決方案高端論壇——Andy篇(下)
現(xiàn)在看一下Acceleware的例子,這是開始一些公司在用圖形的API進行計算,2006年他們推出一個產(chǎn)品是手機模擬的產(chǎn)品,很多手機上的天線用GPU進行模擬,為了保證信號的完整性不受損害,還有安全,很多的廠商在設計手機的時候,會使用到GPU,這個技術(shù)也是嵌入的,而且也非??欤a(chǎn)品推出的時候,我們是展示了一種差異,如果用僅僅用CPU,或者相比較CPU和GPU的差異,如果僅僅用CPU的話,CPU需要15小時,而GPU只需要15分鐘。我們跟媒體見面的時候,把這個給他們看了,基本說就在我講完之后,可能一個模型就已經(jīng)完成了,如果你用比較慢的技術(shù),可能要等到明天。對工程師來說這個完全不一樣,因為通過快的技術(shù),他們可以進行非常好的互動。
現(xiàn)在他們在做一些地震方面的應用和研究也就是說他們希望用這個計算集群的算法來幫助一些油井公司來找到一些石油。在石油探測領域有一家公司叫HEADWAVE,他們也用了一些地理數(shù)據(jù),你可以看到這漲圖,他們是關于石油的產(chǎn)品,看了一下這些圖就問,應該在哪兒進行鉆井呢?你要決定的時候,服務器要處理很多的地理信息,HEADWAVE他們把這些相關的數(shù)據(jù)收集起來之后建立一個數(shù)據(jù)庫,非常大,之后需要一個工作站通過GPU來進行數(shù)據(jù)處理。
VMD/NAMD分子動力學領域也是先鋒領域,去年我們的首席技術(shù)官,他說我在這個課上學了一點兒東西,之后可以用在視頻分子動力學的設計中,包括分子,還有細胞,還有細菌動力的分析。之后他發(fā)布了一款工具,在我們的網(wǎng)站上進行發(fā)布,用了一個標準的工作站,3GPU的設計,基本上能夠達到非??焖俣鹊倪@也是令人吃驚的研究。在美國如果用一家最先進的研究機構(gòu),也要花很長時間,很多的科學家來進行研究才能得到這樣的結(jié)果。
再看一下Matlab,這個實驗室都所有的工程師來說,他們在這里使用CPU+GPU,通過使用這個,性能得到了17倍的提升,人們可以把電腦作為一個計算工具來使用。我們做了一個研究代碼,通過CUDA可以使用這個加速17倍,以前需要3天,現(xiàn)在只需要3個小時的時間,他們一周可以做兩次模擬,現(xiàn)在總的來說這個研究速度得到了很高的提升。
簡單介紹一下我們在金融領域中的應用,金融領域是一個非常有趣的領域,尤其對高量數(shù)據(jù)的處理來說,對電腦的要求也非常高,我們在美國可以在一秒鐘把美國所有的期權(quán)進行處理,可以評估美國所有的股票期權(quán),所以基本上是實時的可以處理這個結(jié)果。
再看一下Level3,他們也有很多的不同的期權(quán)不同的證券,他們也采用這個技術(shù)對七千進行分析。這我們一個研究人員做的標桿性的研究,它的性能可以比普通的電腦的速度要提高好幾百倍。所以總的來說,對GPU來說,在未來重要領域的應用非常有前景。
這張圖是地理信息系統(tǒng),或者是多重地理信息系統(tǒng)。在很多領域都可以應用,比如說你想做城市規(guī)劃,建一些社區(qū),房屋、道路的設計,這些的城市規(guī)劃人員可以用地理信息軟件或者技術(shù)來分析相關的人口信息和地理信息之后來決定是否在那里建一些醫(yī)院或者房屋等等。比如說應該在哪個地方建立一些街道,還有我的電廠應該在哪兒,這個軟件可以制作出一些地圖,疊加上人口信息,住房、人口、公路等等描述這個區(qū)域,這樣可以和地質(zhì)規(guī)劃人員,城市規(guī)劃人員進行互動,規(guī)劃人員可以使用GPU正確的設計出道路,可以打造更加高效的城市。
另外就是關于天體物理學,很久以前,有一系列的天體物理學家,他們覺得天體物理學能夠通過GPU來加速,在日本也使用了這個項目,他們使用了GPU之后效果非常不錯。
再看一下曼德爾布羅特,這個很難做,它是一種非常簡單的應用,我們在網(wǎng)站上也是由學生開發(fā)的,他每天給我們打電話,發(fā)郵件,希望能夠得到一個板塊,之后我們給了他一塊兒,馬上就給我們做了曼德爾布羅特的模擬,所以現(xiàn)在已經(jīng)在我們的SDK上發(fā)布了,也就是對我們的工具包里對我們的開發(fā)人員進行了正式公布。
給大家看一下演示,這是用筆記本電腦做的,這個用的G80的GPU,這是它的編碼,速度不是很慢,總而言之是手提電腦,負責大家對這個游戲比較感興趣,實際上也進行了細節(jié)性的模擬,模擬水面的波紋。接下來一張,這是天體物理,實際上它是實時的模擬,也是用筆記本電腦做的,你可以看到在這上面,大概有35G浮點,但是整體的價錢不貴,僅僅900美元,所以任何物理學家都可以做比較有趣的模擬。另外有一點,它也是8800 GTX的基礎上設計的,它是在16GPU的體系上進行操作的,實際上也可以在筆記本電腦上進行運行,因為它比較穩(wěn)定。你可以看到這個就是GPU的好處。
這個比較有趣,但是給大家展示另外一個角度,基本是是從工業(yè)應用的角度上來展示的,有一些領域大家在Walter 的發(fā)言中也看到了,就是視覺的領域,我們是怎么做的呢?我們首先有一個和電腦連接的攝像機之后進行過濾,在CPU和GPU之間進行過濾,點一下CPU,先點上面再點下面,你看數(shù)字比較少,但是你可以看到這個電腦上有10個飛行演示,所以對筆記本電腦來說,一個比較一般性的CPU加一個GPU的話就可以進行8次的飛行演示??梢钥吹竭@個圖像還是比較清晰的,我們再看最后一點。這個圖像在CPU不太可能實現(xiàn),基本上是通過GPU可以實現(xiàn),這叫光流,也就是CPU來分析一下這個屏幕上的一些投射。我們在CPU上是不能夠做,比如說你可以看到一些色彩的損失,所有這些小的紅點,基本上都是小的三角,這些小三角能夠感知到屏幕上物品的運動,而這個矢量還有三角形的大小就是這個矢量,這在CPU上不能做,CPU只能做區(qū)域性的分析。所以,你可以看到對CPU電腦來說,你可以看到一塊兒一塊兒的東西,不能真正做細節(jié)的圖像描述。但是,這也是在筆記本電腦上做的。
『NVIDIA專業(yè)顯卡及解決方案展示區(qū)』
我們再看一下Tesla產(chǎn)品線,我們會繼續(xù)發(fā)展GPU,也會繼續(xù)朝筆記本電腦方向進行進一步的探索,但是在Tesla方面我們希望真正的有所探索。第一個就是工作站,我們有一些科學家和工程師他們有電腦,這樣我們可以桌面和桌邊型計算機上實現(xiàn)超級計算機的性能,我們給他們建立新的服務器,來滿足他們大規(guī)模計算的需求。另外,工作站的計算集群,也就是說在桌面計算機上可以建立一個標準的工作站。
接下來是關于服務器的,你可以看到這里有4個GPU,它的高度大概是1U的尺寸,可靠性比較高,同時對數(shù)據(jù)管理中心來說,之前的可能有4000多個服務器,有很多GPU,對管理人員來說怎么能夠看到哪個地方有些問題,比如說有一些風扇散熱出了問題,那個地方怎么辦呢?GPU可以自我管理,自我處理,所以你可以看到密度比較高,目標性能比較高,同時尺寸比較小,同時自我管理能力比較高。這是我們數(shù)據(jù)中心計算系統(tǒng),對Tesla來說服務器是怎么做的呢?
你可以看到軟件能夠把軟件和CPU連接起來,這是有一個服務器,有兩個小的適配卡,放入服務器中,還有一些電纜,把GPU系統(tǒng),目前有4個GPU,通過CPI的轉(zhuǎn)換器進行連接,這樣可以把PCI,GPU和CPU連接起來。
這有4個8系列GPU,第二個是2個GPU,這是服務器解決方案是4個GPU,工作站就是兩個或者一個。剛才我簡單介紹了我們怎么應用CUDA,怎么應用計算的。今年你可以看到GPU在CUDA這方面會有進一步的進展,我們希望能夠建立一些新的平臺新的環(huán)境,希望能夠更好的提高計算速度。
謝謝大家。
#p#page_title#e#
第8頁:NVIDIA CUDA技術(shù)媒體介紹會——Andy篇(上)
時 間:2008年1月17日(11:00—12:00)
地 點:北京麗思卡爾頓酒店
魏鳴:今天Andy在他的主題演講大部分介紹了CUDA的情況,在這里媒體有問題他來回答,他先介紹一下今天早上的內(nèi)容,再給大家重新總結(jié)一下。
Andy Keane:今天上午我總結(jié)一下,我們主要介紹了CUDA。另外,在07年我們主要推出了兩個最主要的技術(shù),一個是CUDA,他是用新的編程環(huán)境,是對GPU編程,對一般的開發(fā)人員,通過使用CUDA能夠使用GPU來編程,以前開發(fā)使用CPU,C或者C++語言來編程,通過CUDA他們可以使用GPU來編程。
CUDA這個產(chǎn)品一大特點就是它能夠建立這樣比較好的軟件環(huán)境,一方面能夠使串行的處理成為可能,另一方面也能夠使并行的處理成為可能,這樣串行的CPU可以用順序處理一些數(shù)據(jù),同時也把量比較大的數(shù)據(jù)分成不同的塊兒,GPU可以通過并行的方式進行處理,總的來說CUDA建立一個比較好的軟件環(huán)境,同時使CPU和GPU并行數(shù)據(jù)處理成為可能。
另外,對CUDA來說比較有特色的一點就是它是通過把CPU并行起來一樣,讓CPU來處理不同塊兒的數(shù)據(jù),也就是說通過軟件,CPU在處理的時候通過軟件來處理,也就是把不同的問題,或者不同的數(shù)據(jù)并行起來,通過管理不同的現(xiàn)在線程用軟件來處理問題,有的時候有困難,如果通過軟件管理和處理線程的話,為什么采用GPU呢?因為GPU實際上是在建立就把管理的問題解決掉了,假設輸入一大堆程序或者信息,這時候GPU就會主動的進行計算,同時對這些線程進行分析和計算,再反饋給你答案,這時候GPU只負責計算不負責管理,所以速度要快,而且更簡單一些。
『NVIDIAGPU計算事業(yè)部總經(jīng)理Andy Keane先生向參會媒體介紹專業(yè)顯卡優(yōu)勢及發(fā)展歷程』
另外,再說完最后一點大家就可以討論,我手上已經(jīng)有大家提出的一系列問題,討論問題的清單,這些問題問的非常好,都是關于軟件環(huán)境的,CUDA作為一個工具,目前僅僅處于開始的階段,這也是為什么我們現(xiàn)在用簡單的語言環(huán)境下利用CUDA,也就是C,這對很多的開發(fā)人員里說,他們就會更容易使用GPU,因為C語言對他們來說非常容易,大家都會。這只是一類開發(fā)人員,在未來我們還會在新的工具,其他的高級語言上來使用CUDA,那時候我們可能會有一些新的設計,或者新類別的CUDA的應用。
比如說一些高級語言現(xiàn)在就可以并行處理一些數(shù)據(jù),我們就在CUDA的基礎上,因為CUDA實際上是一種渠道,讓程序員能夠利用CUDA接觸使用GPU,在未來新的高級語言上,我們利用CUDA之后,整個的處理速度將會更快,比如說在C++語言上,我們可以把整個環(huán)境架構(gòu)在CUDA之上,或者整個驅(qū)動之上。CUDA應該在利用GPU的計算能力上,最底層的軟件環(huán)境,其他的語言就可以在這個基礎上進行應用了。
根據(jù)你們提的問題的清單,我也提大家感興趣得主題,大家想知道為我們要選擇CUDA,為什么要用CUDA,設計出CUDA的目標是什么,應用是什么,世界上在科學界、工業(yè)界大家都知道CUDA有比較好的應用。大家比較感興趣的是對普通的消費者來說,CUDA是不是有一定的未來可以使用呢?另外今天上午也做了一些小的演示。
舉個例子,就像筆記本電腦一樣,今天介紹關于天文物體學的設計和演示,實際上它能夠處理35G浮點的處理速度,就像手提電腦一樣,10—15年前尺寸相當于一個大的房間,還是很笨拙的,現(xiàn)在可以處理視頻、音頻還有其他的應用等等,所以潛力還是比較巨大的。CUDA也是一樣,我們僅僅推出一個初級的版本,或者剛推出的版本,在未來隨著性能不斷地提高,我們會推出下一個版本,再下一個版本,這樣不僅僅是程序員、科學家、工業(yè)人員他們可以使用CUDA進行設計,包括普通的消費者你們也可以利用CUDA來進行自己的設計。超級計算,以前是在很大的電腦上運行,現(xiàn)在由于有了這些先進的GPU的技術(shù)和CUDA的技術(shù),就可以在自己的電腦上,完成很高的科運算?,F(xiàn)在,大家有任何問題可以提出。
記者:我理解CUDA技術(shù)是NVIDIA動態(tài)負載平衡技術(shù),并且通過驅(qū)動程序來實現(xiàn)的,可能是比較靈活,這種方式必須是用緩存技術(shù)來優(yōu)化推進或者是同步計算?它依賴緩存技術(shù),這種方式最終會不會以芯片內(nèi)制的方式整合到芯片當中來實現(xiàn)呢?
Andy Keane:實際上對于很多圖形的站來說,復雜的因素都是在GPU里面的,圖形和計算基本的應用是一樣的,在GPU里面有一些核心的應用,或者說核心的程序,通過驅(qū)動連接到CPU,基本上通過一個通道來平衡CPU和GPU,這個所謂通道就是我們所謂的芯片和芯片組,比如說你可以把一些軟件,包括一些應用程序,包括驅(qū)動,也就是CPU的軟件連接到GPU的內(nèi)核上,通過通道。但是總的來說,未來不會有太大的變化,不會出現(xiàn)芯片內(nèi)制的狀況,還會保持現(xiàn)狀。
記者:第一,關于GPU,咱們新的工具跟CPU和GPU的聯(lián)系非常緊密,我們在CPU這方面得到的支持有多大?比如說得到AMD和Intel的支持有多大?第二,我們有一個相關的社區(qū),這個社區(qū)里面我們相關的東西會不會用開源的模式推廣,另外會不會對進入這個社區(qū)對開發(fā)人員有一個獎勵的機制?
Andy Keane:簡單介紹一下GPU和CPU處理的數(shù)據(jù)是各不相同的,解決的問題也是不同的,對GPU來說它處理一些比較類似統(tǒng)一的數(shù)據(jù),能夠平行一塊兒的形式批量處理,但是對CPU來說,它是一種順序的方式處理一些少量的但是各不相關,不同的數(shù)據(jù)。比如說在我們操作系統(tǒng)中,你們會經(jīng)??吹剑覀兊腃PU來處理鍵盤,還有你們的文檔等各種不同的程序,這是非常小的。各不相關的,基本上是CPU來處理。在實際應用中兩個內(nèi)容都包括了,有的需要并行的處理一些數(shù)據(jù),有的需要串行的處理一些數(shù)據(jù),所以就需要我們要找到一個平衡。比如說對于你的手提電腦來說,基本上很大程度上使用的是CPU的處理,比如說各方面。在圖像和MP3這方面使用GPU進行處理。另外在油井開發(fā)、地理信息這些工業(yè)應用中,并行處理的數(shù)據(jù)很多,因為信息量比較大,都是比較類似的,但是需要以順序處理的方式的數(shù)據(jù)比較少,所以在不同的行業(yè)不同的應用中我們都會找到不同的平衡。
記者:AMD也購并了一個企業(yè),會不會對CUDA技術(shù)進行一些限制?會不會影響CUDA的應用。第二,Intel始終想跟NVIDIA這塊兒有合作,如果在這方面你們推出來CUDA是想在高端這塊兒有一些影響,Intel會不會對你們有一些限制,如果不得到這兩個公司的支持,CUDA在跟CPU的接觸中會有一些脫節(jié),這樣的話GPU的能力就很難發(fā)揮出來,或者說即使GPU的能力發(fā)揮出來了,CPU也很難。
Andy Keane:實際上對于AMD來說,他們和CUDA在某種程度比較類似,他們的軟件環(huán)境比較類似,所以基本上娓娓道來我們預測他的代碼也好,軟件也好,將會非常類似于CUDA的一些代碼和軟件?,F(xiàn)在他只是把一些相關的部分拿出來放到他們的芯片中,因為我們的芯片不一樣,CUDA和AMD是不一樣的,他們就把類似的因素拿出來放到芯片中。但是基本上我們是屬于一個俱樂部,因為我們的技術(shù)也是一樣的,軟件也是一樣的,未來他們有所發(fā)展對我們并是一種威脅。
關于Intel,他們的軟件采用多核的CPU技術(shù),但是由于他們多核的存在,他們的運行問題太多了。為什么呢?因為程序員們總是要處理很多多核的運算還有設計,處理多重的線程,你編的軟件要在不同的線程上運行,而且能在2、4、6個不同的處理器之間靈活的轉(zhuǎn)換,這已經(jīng)是非常難的事情。所以,對Intel多核電腦來說可靠性比較低,作為媒體你們也經(jīng)常報道,多核技術(shù)總是問題比較多,已經(jīng)成為他們往前發(fā)展的一個障礙了。
我們有很多的挑戰(zhàn)需要去解決,一個好的軟件開發(fā)員利用多核來做的話,它的穩(wěn)定性,因為要有多線程來開發(fā),穩(wěn)定性就會有問題,很多問題需要去解決。
另外也想強調(diào)一點,在這個軟件環(huán)境下,我們并不準備代替或者替代軟件中的多核CPU,為什么?因為在未來多核的CPU還在運行系統(tǒng)中運行,同時GPU只是負責處理那些非常大的,海量的而且需要快速處理的數(shù)據(jù),它的功能主要是在不替代CPU的前提下,來主要負責處理大量的數(shù)據(jù),而大量的線程仍然是存在CPU上??偟膩碚f,CPU和GPU共存,在未來GPU處理大量的音頻、視頻還有圖像這樣一些數(shù)據(jù),但是CPU還會處理一些串行的內(nèi)容。
#p#page_title#e#
第9頁:NVIDIA CUDA技術(shù)媒體介紹會——Andy篇(下)
魏鳴:我們說的CUDA這個東西是怎么樣更好的利用GPU的計算能力去開發(fā)新的應用出來,這在以前人們基于CPU來開發(fā)應用程序,但是GPU的能力沒有被很好的開發(fā)出來,我們推出CUDA就是為了更好的利用GPU的計算能力,所以我們說的CUDA這個技術(shù)和其他的公司所談到的利用CPU來進行的這種編程是不同的范疇,解決的問題不一樣。就剛才說的CPU和GPU的運行模式也不一樣,所以他們之間不是對立,是并存在一些解決不同的問題。
Andy Keane:CUDA作為一個軟件,CUDA是用C程序基礎上的一個軟件,他可以在不同的市場上應用,比如說GeForce一些應用市場等等,但是對工業(yè)或者高端的大量數(shù)據(jù)處理的領域來說,應該是Tesla這個產(chǎn)品。我們有兩個競爭對手,其中有一個是FPGA,這個時候大家就問這個問題,為什么我們會選擇CUDA而不選擇FPGA,對程序員來說他要選擇程序運行的時間有多長,對FPGA來說,如果發(fā)生變化是要在芯片方面發(fā)生變化,所以它只能解決一些非常特殊的問題,在某些問題的解決上,F(xiàn)PGA的性能比較好,但是問題是可編程性比較差。
魏鳴:CUDA跟編程語言的區(qū)別,比如說金融業(yè)方面你要分析證券,如果用FPGA就要有變化要重新設計,用CUDA不需要重新設計,改變程序就可以了,這樣便于開發(fā)人員應用,而且可編程性更強了,這是主要的區(qū)別。
記者:如果使用CUDA的話,這個程序員是不是要在開發(fā)習慣上有所改變?
Andy Keane:總的來說,CUDA解決的是并行的計算的一些問題,實際在CUDA出現(xiàn)之前有很多其他的技術(shù),也出現(xiàn)并且目的是為了解決這些問題,這些問題是并行大量的數(shù)據(jù)處理,也是早就存在的,這也是為什么出現(xiàn)了多核處理器,出現(xiàn)了FPGA等等其他的技術(shù)。就像看一本書一樣,作為CPU會一頁一頁過這些書,再把相關的詞找出來。但是GPU就很簡單,把整個書分成好幾塊兒,同時并行處理這些內(nèi)容找到你的目標??偟膩碚f,這個問題的設計,這個思維,這個概念才是最主要的,編程也很重要,但是和設計相比不像設計那么重要,設計是核心的。所以,在程序上可以通過CUDA,可以通過多核或者FPGA來解決,但是對程序員來說需要在思維上有所改變,在程序操作上不用做太大改變。
魏鳴:軟件不需要做改變,只是在擴充編程的時候要從硬性的角度考慮這個問題,這個才是最重要的。
記者:我有三個問題。第一,CUDA在圖形編程方面和現(xiàn)有的圖形開發(fā)環(huán)境,比如說OpenGL在做圖形編程的時候是否會有沖突?只能用其中一種。第二,使用CUDA這種應用程序是不是只能在NVIDIA的硬件平臺上?如果是的話,我覺得未來可能出現(xiàn)多種GPU接口的標準,是否有一種解決方案解決多種應用平臺之間的兼容性問題。第三,CUDA是否能夠在移動開發(fā)環(huán)境中應用?比如說在手機上,現(xiàn)在有沒有計劃與手機的操作系統(tǒng)開發(fā)商有這種合作計劃呢?
Andy Keane:在設計上,我們CUDA在圖像處理這方面已經(jīng)考慮了要通過API,OpenGL所設計的圖像能夠兼容或者設計接口,首先建一個像素緩沖目標,后寫入API,整個過程還是比較容易實現(xiàn)。像之前的演示里面也是這樣一個概念,就是在圖形和CUDA之間,我們實際上找到一個平衡,天體物理學那個演示中大家能夠看到。因為有的時候CUDA并不能處理所有圖的信息,而圖也不能處理CUDA所能夠處理的信息,因為CUDA處理信息比較獨特,那些非結(jié)構(gòu)性的數(shù)據(jù),包括字符和一般性的數(shù)據(jù),對圖來說,處理的數(shù)據(jù)更加具體更加特定,所以我們在設計上也考慮了不同的因素組合起來。
第二個問題,CUDA剛剛開始是我們公司的產(chǎn)品,我們也會基于我們公司的產(chǎn)品推廣這個技術(shù),但是CUDA在計算領域里,只有開放式的架構(gòu)和技術(shù)才能夠有生命力,所以CUDA會慢慢的把它在CPU上運行,或者在其他的GPU上面運行,這肯定是以后的趨勢。但是,我們不會強調(diào)行業(yè)接受這個技術(shù),而是有這樣一個平臺,這樣一個技術(shù)讓大家一塊兒來開發(fā)。將來有一個情況就是其他的人采用它,可能會有其他的標準出來,我們一塊兒互相結(jié)合在一起做,所以還會是行業(yè)性開放性的技術(shù),發(fā)展方向應該是這樣的。
第三個問題,CUDA對移動設施來說是高中端的產(chǎn)品,但是它的體積比較小,對CUDA來說目前是嵌入GPU的技術(shù),或者是什么也好,我想未來技術(shù)可能會用在手機上,但是可能要經(jīng)過幾代,直到技術(shù)允許它的尺寸可以縮小到一定的大小,另外需要的電源,還有各方面的需求可以滿足手機需要的時候,但是中間可能要經(jīng)過一段時間。
Andy Keane:應用于計算機的計算技術(shù),你最后看到在你手機上需要花幾年,因為你要減少功耗才能用,現(xiàn)在在高端的,GeForce 8系列可以用,慢慢會一步步的推進。
記者:我們公司現(xiàn)在倡導通用GPU計算,我們有沒有在這方面有更多的實驗運行?是不是需要更多開發(fā)部來支持新的通用計算?
Andy Keane:我們首先定義一下什么叫做通用計算?通用計算基本上通過CG或者OpenGL,或者其他的圖形語言進行圖形的計算問題,一般我們會把紋理作為一些資料來進行輸入之后,把這些數(shù)據(jù)進行分析,可能產(chǎn)出的就是紋理的顏色等等各種分析結(jié)果,CUDA主要采用C編譯器,我們也有自己的一些庫,但是總的來說是基于C語言的,是不是還會建立其他的庫開發(fā)新的功能?基本上在C編譯器上,不是真正有所謂的庫,基本上就是C編譯器上的開發(fā)。
記者:在Gelato里面是不是應用了CUDA,如果不是的話,CUDA是不是開發(fā)了圖像方面的軟件?CUDA是不是用于開發(fā)游戲運算中物理隱形方面的東西?
Andy Keane:在Gelato中沒有使用CUDA,其實Gelato開發(fā)之前就已經(jīng)存在開發(fā)好了,但是我們使用CUDA進行開發(fā),這方面我們的確也有一些活動,但是具體是哪個產(chǎn)品我們不能告訴你,因為產(chǎn)品經(jīng)理不會同意我這么做,如果我要提前在他的產(chǎn)品出來之前就向你們宣布的話,他肯定不會高興的。實際上我們現(xiàn)在已經(jīng)有一個產(chǎn)品市場上可以看到,就是紋理壓縮的一個設施,或者說一個設備,主要是處理紋理還有圖像等等。主要是加強一些視覺上的效果,就這個渲染器我也不能做太多評論,但是總的來說它在渲染方面還是不錯的。我們也做過一些試驗,但是我覺得很多開發(fā)商他們覺得物理卡價值并不高,而且興趣也不是很大,實際上有兩種方法來解決這個問題。一個就是用你的多核,物理卡的問題可以用多核CPU來解決,比如說你電腦里有4個核,一個是操作系統(tǒng),一個是游戲,還有兩個額外的核。另外有一部分的物理的特性可以通過GPU來解決,但是GPU實際上處理的是一些,比如說CPU適合游戲處理和游戲相關的深嵌程度比較深的物理特性,但是GPU處理的是形象,或者看起來怎么樣,或者說視覺效果等等。比如說在一款游戲里面,舉個簡單的例子,樹動的時候使用的是GPU,因為它實際上和打游戲沒什么關系,但是人跨過草叢的動作就跟游戲的相關性更高,而且和AP的相關性更高,這個時候使用的就是CPU來進行處理。
記者:第一,我發(fā)現(xiàn)有CUDA的GPU有128個內(nèi)核,就是說對一個程序員面對如此多的內(nèi)核開發(fā)的時候,他如何能夠知道他已經(jīng)充分利用了這128個內(nèi)核,也許他的程序?qū)懙牟缓?,沒有充分利用好,或者說他應該再買一個新的GPU,而不是程序的問題。
第二,我發(fā)現(xiàn)對于CUDA并不是把一個C的代碼或者是它的程序直接翻譯成GPU的語言 ,而是中間通過PTS的編譯器。我就有一個問題,關于PTS編譯器,我們程序員是不是可以直接編輯PTS的代碼控制GPU,直接對硬件進行操作,而不需要寫C語言。
安迪•凱恩:就程序員開發(fā)而言,實際上我們也準備了一系列工具幫助程序員更好的利用資源進行開發(fā),比如說我們有4個調(diào)節(jié)器,它是(GTP)的調(diào)節(jié)器,你通過調(diào)節(jié)器可以分析是不是哪個地方出問題了,如果出問題你可以一步式的解決,這樣的調(diào)節(jié)器是CPU式的調(diào)節(jié)器。另外,我們也有一個分析器,這個分析器能夠幫助你分析你的編碼效率怎么樣,資源是不是完全利用了,或者在128個處理器中是不是都被利用了,另外我們會有一個Excel表格,上面列入不同的信息,在你編程序之前可以利用這個表格更好的利用這些資源,更好的進行程序開發(fā)。對于GPU來說,實際上它的處理速度你們已經(jīng)知道了,比CPU要快得多,但是我們采用一個中間語言叫PTS,主要是為了保證背后基層的GPU快速運行的時候,整個系統(tǒng)還是穩(wěn)定的,從C語言進行開發(fā)之后轉(zhuǎn)換到PTS,這個過程也是相對來說更穩(wěn)定,因為GPU處理速度非常快,我們需要找到這個中間語言能夠穩(wěn)定。對我們來說,我們建議程序員還要用C語言來開發(fā),還是一個詞穩(wěn)定,用PTS來開發(fā)更大程度是一種工具和編譯器,讓你更好的接觸到一些數(shù)據(jù)。這實際上跟CPU也一樣,很少有人說真正的去編,基本上用一個編譯器來做,編譯器已經(jīng)很好了,它能夠保證這個系統(tǒng)的穩(wěn)定。
記者:我們有沒有開發(fā)更高級語言的計劃?
Andy Keane:我們本身不是軟件開發(fā)商,我們只是建立一個底層,讓更多的軟件開發(fā)商開展他們的東西。
#p#page_title#e#
隨著NVIDIA的Tesla品牌旗下的GPU(圖形處理器)運算產(chǎn)品和CUDA軟件開發(fā)工具的使用者越來越多,為了更好地履行對客戶的承諾,NVIDIA公司開設了一個專門為高性能計算(HPC)開發(fā)人員提供服務的資源社區(qū)——CUDAZone。
CUDA是世界上唯一針對GPU(圖形處理器)開發(fā)的C語言開發(fā)環(huán)境。自2007年2月發(fā)布以來,CUDA幫助工程師、科學家、地球物理學家等科研工作者實現(xiàn)了許多新的、工作必備的海量信息處理,并且將處理速度大幅提升到了相當于之前45至400倍。
CUDAZone站點將會成為專業(yè)人士、學者以及所有對CUDA和Tesla有興趣的人們的全球性交流中心。站點功能涵蓋編程技術(shù)發(fā)布、客戶聚焦、項目張貼和方法交流的論壇、CUDA工具的下載、代碼實例、新聞事件等諸多內(nèi)容。
NVIDIA的GPU計算事業(yè)部總經(jīng)理安迪۰凱恩(Andy Keane)表示:“自HPC社區(qū)成立以來,我們通過社區(qū)了解到客戶對CUDA非常支持。每天都有客戶發(fā)電子郵件告訴我們,他們的工作流程運行速度得到了難以想象的提升。CUDAZone將會成為這些成果的聚集點,并為我們的用戶提供一個集最新資訊、資源下載和數(shù)據(jù)更新于一體的平臺。”
欲了解更多信息以及下載CUDA SDK以及工具,請登錄www.nvidia.com/cuda。
Andy Keane—GPU計算事業(yè)部總經(jīng)理
Andy Keane先生于2006年加盟NVIDIA公司,出任NVIDIA公司全新的GPU計算事業(yè)部的總經(jīng)理,全面負責這一全新業(yè)務部門的組建,包括財務、銷售、市場運作、產(chǎn)品規(guī)劃以及推廣等。
在加入NVIDIA之前,Andy Keane先生曾分別在Morphics及Ageia兩家公司的創(chuàng)業(yè)期任職市場副總裁,這兩家公司主要為電信以及消費品行業(yè)開發(fā)并行計算技術(shù)。在此以前,Andy Keane先生曾為3dfx公司和QED公司的快速發(fā)展以及最后公開上市做出了卓越貢獻。其中,3dfx公司帶動了消費級3D圖形加速器的發(fā)展,而QED公司則是世界首批多核處理器供應商之一。
不僅如此,Andy Keane先生在Xilinx公司早期進行的可重配置計算以及FPGA系統(tǒng)的開發(fā)過程中,也發(fā)揮了重要作用。此外,Keane還曾任職于英特爾生產(chǎn)設計部門,從事容錯并行計算技術(shù)的生產(chǎn)設計。
Andy Keane先生擁有伯克利商學院(Berkeley Business School)的MBA學位和倫斯勒理工學院(Rensselaer)的物理學學位。
Walter Mundt-Blum—專業(yè)解決方案事業(yè)部全球銷售副總裁
Walter Mundt-Blum先生1955年生于德國,1978年獲得電子工程碩士學位。在1978年至2000年間,Mundt-Blum先生任職于三菱電器歐洲公司,擔任歐洲外圍設備業(yè)務部門主管。
2000年至2002年,Mundt-Blum先生擔任艾爾莎(ELSA)公司專業(yè)圖形業(yè)務執(zhí)行副總裁。Mundt-Blum先生于2002年加盟NVIDIA公司,現(xiàn)今擔任NVIDIA公司專業(yè)解決方案事業(yè)部全球銷售副總裁。