siemens x
人工智能

7nm后,AI芯片三大架構(gòu),誰與爭鋒

2025China.cn   2019年08月12日

  2018年被稱為AI元年,在這一年,谷歌公布了第三代人工智能芯片TPU,專門對自家TensorFlow進(jìn)行了優(yōu)化,這塊芯片比傳統(tǒng)CPU運(yùn)算快30倍,能效比高出200倍,如此驚艷表現(xiàn)讓大量AI公司著手規(guī)劃自己的芯片,AI技術(shù)的芯片化成為了當(dāng)前AI產(chǎn)業(yè)發(fā)展的一種世界級現(xiàn)象。

  除了谷歌,AWS,微軟,蘋果,百度等世界IT巨頭,依圖,地平線,寒武紀(jì)等本土AI獨(dú)角獸也在積極研發(fā)自己的AI芯片。新近AI創(chuàng)業(yè)公司大多選擇以算法的芯片化作為市場的切入點(diǎn)。AI產(chǎn)業(yè)也正處在從算法輸出走向芯片研發(fā)的轉(zhuǎn)型過程中。

  目前主流的芯片架構(gòu)主要分為GPU、FPGA、ASIC等技術(shù)流派,代表玩家分別為英偉達(dá),谷歌、賽靈思。

GPU

  GPU其實(shí)就是我們平時用到的顯卡芯片,每塊顯卡當(dāng)中都會有一塊GPU協(xié)同電腦的CPU來進(jìn)行圖形加速運(yùn)算,與CPU相比GPU擁有更多的算數(shù)邏輯單元ALU,這可以很方便地執(zhí)行AI這種相對小型化的零散型任務(wù),GPU擁有更多算數(shù)邏輯單元,可以形成數(shù)量可觀的任務(wù)流水線,將運(yùn)算進(jìn)行并行處理。

  談到GPU就不得不提及計(jì)算機(jī)圖形顯示領(lǐng)域的巨人英偉達(dá),英偉達(dá)在人工智能領(lǐng)域起步很早,積累扎實(shí),從2007年以后通用計(jì)算需求下降,CPU市場企穩(wěn),在游戲市場的推動下GPU的性能和帶寬不斷提升,DNN的需求也在這一時間顯現(xiàn),英偉達(dá)的GPU恰好滿足了當(dāng)時AI市場需求,從此以后AI便成為了英偉達(dá)投資的一個重要市場。

  英偉達(dá)在算力和開發(fā)環(huán)境方面一直處于業(yè)界領(lǐng)先地位,2018年英偉達(dá)上市了最新的Volta架構(gòu)GPU,算力高達(dá)960 Tensor TFLOPS,其基于C語言的CUDA編程環(huán)境擁有廣泛的開發(fā)者基礎(chǔ)。與AWS的合作,讓開發(fā)者能夠在云端執(zhí)行深度學(xué)習(xí)運(yùn)算,不需要額外購買GPU設(shè)備。

  無處不在的安裝基礎(chǔ)讓英偉達(dá)在用戶生態(tài)和采購成本方面上占絕有對優(yōu)勢,很多初創(chuàng)公司以及院校研究機(jī)構(gòu)都會選擇英偉達(dá)GPU作為主要平臺切入市場,這也使得英偉達(dá)生態(tài)擴(kuò)張很快,市場占有率不斷走強(qiáng),根據(jù)最新公布的數(shù)字,英偉達(dá)在AI芯片市場占有率已經(jīng)達(dá)到了50%,絕對的NO.1

  雖然GPU運(yùn)算能力很強(qiáng)但缺點(diǎn)也不少,比如在訓(xùn)練型運(yùn)算如ADAS等應(yīng)用上表現(xiàn)出色,占絕對支配地位,但對于推理類運(yùn)算相對FPGA較弱,此外由于內(nèi)部是采用的是公版架構(gòu)設(shè)計(jì),所以GPU的晶體管數(shù)量非常龐大,要比ASIC高出十倍,這樣最直接的問題就是堆料嚴(yán)重,導(dǎo)致成本高和功耗巨大,這也是英偉達(dá)GPU被詬病最多的地方。市場目前對于這些缺點(diǎn)還算比較能容忍,客戶現(xiàn)階段最關(guān)心的還是算力,畢竟節(jié)約AI訓(xùn)練時間更加關(guān)鍵。英偉達(dá)目前也擁有自己的ASIC產(chǎn)品Xaier專門用于ADAS,這是一款車規(guī)級的產(chǎn)品,雖然已經(jīng)實(shí)現(xiàn)了量產(chǎn),但規(guī)模小,價(jià)格偏貴,主要面向與L5級自動駕駛高端市場。

TPU (ASIC)

  ASIC全稱 Application Specific Integrated Circuits專用集成電路,這種架構(gòu)可以被理解為專門為某一項(xiàng)算法定制的芯片,這樣的產(chǎn)品優(yōu)點(diǎn)非常突出,比如由于其依據(jù)特定算法設(shè)計(jì),不像GPU那樣堆料,容易控制硬件成本,功耗自然也低,但缺點(diǎn)也很突出,由于沒有重構(gòu)能力,一旦算法發(fā)生迭代,其優(yōu)化的效果就會失效,比如此前的比特大陸ASIC礦機(jī),挖礦機(jī)制更新后性能就會變差,設(shè)備只能進(jìn)行重新設(shè)計(jì)。

  TPU Tensor processing unit就是ASIC類型芯片的代表,財(cái)力雄厚的谷歌不僅在軟件算法上投資發(fā)力,也在定制自己的AI芯片,TPU同時也是Alpha Go的大腦。其實(shí)谷歌最早采用的也是英偉達(dá)的GPU,但后期出于多種考慮開始轉(zhuǎn)向研發(fā)自家芯片,這也導(dǎo)致了英偉達(dá)轉(zhuǎn)向與AWS進(jìn)行深度合作。谷歌的商業(yè)模式一直非常具有創(chuàng)意,在AI上也是一樣,雖然開放了底層架構(gòu)TensorFlow,但在芯片業(yè)務(wù)上,選擇了只租不賣,對比英偉達(dá)的芯片出售模式,谷歌似乎規(guī)劃更長遠(yuǎn),希望開發(fā)一套通用平臺直接服務(wù)最終用戶,當(dāng)然這樣的商業(yè)模式最后能不能成功暫且不論,單單是開發(fā)ASIC就非常具有戰(zhàn)略意義,相比FPGA和GPU,ASIC無論是在功耗還是堆料成本上都要節(jié)約得多,計(jì)算效率也要高出很多。但谷歌這枚TPU從嚴(yán)格的意義上講是擁有少部分可重構(gòu)能力的,所以應(yīng)該算是FPGA與ASIC之間的芯片,但隨著谷歌算法不斷的升級和完善,這部分重構(gòu)能力很可能會被谷歌抹掉,將其設(shè)計(jì)成為完全獨(dú)立的ASIC芯片。值得注意的是,依圖也借鑒了谷歌這種商業(yè)模式,開發(fā)自研芯片,而且只供自己的服務(wù)器使用,不對外出售,亞馬遜的AWS也可能是出于對功耗的顧慮,近期也在轉(zhuǎn)向自家ASIC的研究。

FPGA

  FPGA全稱Field Programmable Gate Array,現(xiàn)場可編程邏輯門陣列,可以被理解為一種半成品的ASIC,擁有極其優(yōu)秀的可重構(gòu)能力,其硬件加速性能比DSP更加優(yōu)秀,擁有類似GPU那樣多的小單元來將任務(wù)流水線并行處理掉,在推理運(yùn)算方面明顯優(yōu)于GPU。

  FPGA 的主要玩家是賽靈思,很多AI初創(chuàng)公司都選擇賽靈思平臺作為市場切入工具,如深鑒科技(已被賽靈思收購),這樣的趨勢下也進(jìn)一步擴(kuò)大了FPGA的市場占有率,讓賽靈思成為了能夠和英偉達(dá)分庭抗禮的另外一個生態(tài)陣營,其老對手Altera被英特爾收購后,在AIOT領(lǐng)域明顯發(fā)力不足,在AI市場上的競爭基本不足為慮。

  FPGA很好的解決了現(xiàn)階段AI開發(fā)者面臨的問題,在大多數(shù)初創(chuàng)公司都還處在尋找應(yīng)用場景的階段,F(xiàn)PGA給算法的迭代提供了一個比較節(jié)約的選擇。利用FPGA的可重構(gòu)能力,開發(fā)者可以多次改變項(xiàng)目的特征,實(shí)現(xiàn)芯片的復(fù)用。使用FPGA雖然能夠省掉了流片成本,但相對來說還是較貴,而且由于其追求可重構(gòu)的能力,在設(shè)計(jì)上就沒能達(dá)到極致優(yōu)化,功耗比ASIC要高出不少,且技術(shù)難度較大,高級開發(fā)人員較少,項(xiàng)目成本較高,在訓(xùn)練型計(jì)算中表現(xiàn)中低于GPU。

  就像GPU一樣,雖然FPGA有不少缺點(diǎn),但也沒辦法擋住其火爆的趨勢,大量AI公司選擇FPGA來進(jìn)行算法的開發(fā)驗(yàn)證以及芯片的前期定制,甚至蘋果這種大公司也將FPGA嵌入到自家A12芯片中,提供AI能力。

類腦芯片

  類腦芯片完全擺脫了傳統(tǒng)的馮諾依曼結(jié)構(gòu),把內(nèi)存和CPU以及通訊元件集成在一起,DSP作為神經(jīng)元,內(nèi)存作為突觸。這樣設(shè)計(jì)的好處是,每個單元完全獨(dú)立工作,根據(jù)任務(wù)量調(diào)配單元使用,運(yùn)算能力驚人且功耗極低。其代表芯片是IBM的TrueNorth和Intel Loihi 。

  TrueNorth,可以幾厘米空間里,集成4096個內(nèi)核、100萬個DSP和2.56億個內(nèi)存突觸,能耗只有不到70毫瓦。而Loihi 擁有13萬個硅“神經(jīng)元”,復(fù)雜程度幾乎等同老鼠的大腦。目前兩款芯片還都停留在概念階段,沒有投放市場。

  作為CPU時代的芯片巨頭,Intel其實(shí)一直在布局AI市場,先后收購了Altera,Mobileye ,Nervana,Movidius等與AI相關(guān)的公司,但似乎聲音上遠(yuǎn)不如谷歌和英偉達(dá)。當(dāng)然就目前情況來看,Intel似乎也并不是很上心。

未來誰將勝利

  一方面是在AI訓(xùn)練市場占有絕對領(lǐng)導(dǎo)地位,另一方面自動駕駛技術(shù)尚未成熟,市場反哺還需時日,英偉達(dá)面臨的挑戰(zhàn)是在未來持續(xù)保持GPU對FPGA和ASIC算力上的優(yōu)勢,但由于摩爾定律已經(jīng)失效,7nm后制程升級越來越困難,英偉達(dá)若想繼續(xù)保持算力的優(yōu)勢只能不斷的堆料將產(chǎn)品做大,但“功耗”依舊是擺在面前的問題,顯然云端市場并不買賬這樣的堆料方式,紛紛轉(zhuǎn)向開發(fā)自己的ASIC,而終端市場則被靈活的FPGA切掉了不少份額。

  國內(nèi)的許多創(chuàng)業(yè)公司初期平臺都會選擇FPGA,這種芯片是公司業(yè)務(wù)從初創(chuàng)到成型的過渡中非常理想的一種選擇,深鑒,寒武紀(jì),地平線,比特大陸都先后使用過FPGA,商湯等視覺安防AI公司也會用到GPU+FPGA的方案,但當(dāng)業(yè)務(wù)發(fā)展到一定程度后,也都會逐步轉(zhuǎn)向ASIC,如近期依圖發(fā)布的“求索”,未來AI芯片一定會更加定制化,這也確實(shí)是提高AI運(yùn)行效率,降低成本的一個最有效的途徑。

  此外,由于云端市場門檻相對較高,且大廠完全把持,創(chuàng)業(yè)公司的主要機(jī)會將集中在邊緣端,這時低功耗,面向場景開發(fā)的AI芯片將是未來主流發(fā)展方向,或者說全行業(yè)面臨著一場AI升級,很多傳統(tǒng)企業(yè)會借助多年在行業(yè)積累的優(yōu)勢切入進(jìn)AI市場,而這時ASIC應(yīng)該會有更多大展拳腳的機(jī)會。

  當(dāng)然從場景開發(fā)到業(yè)務(wù)的成型是一個漫長過程,目前行業(yè)還處在大量企業(yè)和人才的涌入階段,這些企業(yè)在前期初創(chuàng)時基本都離不開英賽兩大廠的產(chǎn)品,所以在很長時間里它們都不會缺乏生意。

標(biāo)簽:2019世界人工智能大會 AI芯片 我要反饋 
2024世界人工智能大會專題
即刻點(diǎn)擊并下載ABB資料,好禮贏不停~
優(yōu)傲機(jī)器人下載中心
西克
2024全景工博會
專題報(bào)道
2024 工博會 | 直播探館 · 全景解讀
2024 工博會 | 直播探館 · 全景解讀

第二十四屆中國工博會于9月24日至28日在國家會展中心(上海)舉行,展會以“工業(yè)聚能 新質(zhì)領(lǐng)航”為全新主題。 [更多]

2024世界人工智能大會
2024世界人工智能大會

WAIC 2024將于7月在上海舉行,論壇時間7月4日-6日,展覽時間7月4日-7日。WAIC 2024將圍繞“以共商促... [更多]

2024漢諾威工業(yè)博覽會專題
2024漢諾威工業(yè)博覽會專題

2024 漢諾威工業(yè)博覽會將于4月22 - 26日在德國漢諾威展覽中心舉行。作為全球首屈一指的工業(yè)貿(mào)易展覽會,本屆展覽會... [更多]