7nm后，AI芯片三大架構(gòu)，誰與爭鋒

ainet.cn 2019年08月12日

　　2018年被稱為AI元年，在這一年，谷歌公布了第三代人工智能芯片TPU，專門對自家TensorFlow進(jìn)行了優(yōu)化，這塊芯片比傳統(tǒng)CPU運算快30倍，能效比高出200倍，如此驚艷表現(xiàn)讓大量AI公司著手規(guī)劃自己的芯片，AI技術(shù)的芯片化成為了當(dāng)前AI產(chǎn)業(yè)發(fā)展的一種世界級現(xiàn)象。

　　除了谷歌，AWS，微軟，蘋果，百度等世界IT巨頭，依圖，地平線，寒武紀(jì)等本土AI獨角獸也在積極研發(fā)自己的AI芯片。新近AI創(chuàng)業(yè)公司大多選擇以算法的芯片化作為市場的切入點。AI產(chǎn)業(yè)也正處在從算法輸出走向芯片研發(fā)的轉(zhuǎn)型過程中。

　　目前主流的芯片架構(gòu)主要分為GPU、FPGA、ASIC等技術(shù)流派，代表玩家分別為英偉達(dá)，谷歌、賽靈思。

GPU

　　GPU其實就是我們平時用到的顯卡芯片，每塊顯卡當(dāng)中都會有一塊GPU協(xié)同電腦的CPU來進(jìn)行圖形加速運算，與CPU相比GPU擁有更多的算數(shù)邏輯單元ALU，這可以很方便地執(zhí)行AI這種相對小型化的零散型任務(wù)，GPU擁有更多算數(shù)邏輯單元，可以形成數(shù)量可觀的任務(wù)流水線，將運算進(jìn)行并行處理。

　　談到GPU就不得不提及計算機圖形顯示領(lǐng)域的巨人英偉達(dá)，英偉達(dá)在人工智能領(lǐng)域起步很早，積累扎實，從2007年以后通用計算需求下降，CPU市場企穩(wěn)，在游戲市場的推動下GPU的性能和帶寬不斷提升，DNN的需求也在這一時間顯現(xiàn)，英偉達(dá)的GPU恰好滿足了當(dāng)時AI市場需求，從此以后AI便成為了英偉達(dá)投資的一個重要市場。

　　英偉達(dá)在算力和開發(fā)環(huán)境方面一直處于業(yè)界領(lǐng)先地位，2018年英偉達(dá)上市了最新的Volta架構(gòu)GPU，算力高達(dá)960 Tensor TFLOPS，其基于C語言的CUDA編程環(huán)境擁有廣泛的開發(fā)者基礎(chǔ)。與AWS的合作，讓開發(fā)者能夠在云端執(zhí)行深度學(xué)習(xí)運算，不需要額外購買GPU設(shè)備。

　　無處不在的安裝基礎(chǔ)讓英偉達(dá)在用戶生態(tài)和采購成本方面上占絕有對優(yōu)勢，很多初創(chuàng)公司以及院校研究機構(gòu)都會選擇英偉達(dá)GPU作為主要平臺切入市場，這也使得英偉達(dá)生態(tài)擴(kuò)張很快，市場占有率不斷走強，根據(jù)最新公布的數(shù)字，英偉達(dá)在AI芯片市場占有率已經(jīng)達(dá)到了50%，絕對的NO.1

　　雖然GPU運算能力很強但缺點也不少，比如在訓(xùn)練型運算如ADAS等應(yīng)用上表現(xiàn)出色，占絕對支配地位，但對于推理類運算相對FPGA較弱，此外由于內(nèi)部是采用的是公版架構(gòu)設(shè)計，所以GPU的晶體管數(shù)量非常龐大，要比ASIC高出十倍，這樣最直接的問題就是堆料嚴(yán)重，導(dǎo)致成本高和功耗巨大，這也是英偉達(dá)GPU被詬病最多的地方。市場目前對于這些缺點還算比較能容忍，客戶現(xiàn)階段最關(guān)心的還是算力，畢竟節(jié)約AI訓(xùn)練時間更加關(guān)鍵。英偉達(dá)目前也擁有自己的ASIC產(chǎn)品Xaier專門用于ADAS，這是一款車規(guī)級的產(chǎn)品，雖然已經(jīng)實現(xiàn)了量產(chǎn)，但規(guī)模小，價格偏貴，主要面向與L5級自動駕駛高端市場。

TPU (ASIC)

　　ASIC全稱 Application Specific Integrated Circuits專用集成電路，這種架構(gòu)可以被理解為專門為某一項算法定制的芯片，這樣的產(chǎn)品優(yōu)點非常突出，比如由于其依據(jù)特定算法設(shè)計，不像GPU那樣堆料，容易控制硬件成本，功耗自然也低，但缺點也很突出，由于沒有重構(gòu)能力，一旦算法發(fā)生迭代，其優(yōu)化的效果就會失效，比如此前的比特大陸ASIC礦機，挖礦機制更新后性能就會變差，設(shè)備只能進(jìn)行重新設(shè)計。

　　TPU Tensor processing unit就是ASIC類型芯片的代表，財力雄厚的谷歌不僅在軟件算法上投資發(fā)力，也在定制自己的AI芯片，TPU同時也是Alpha Go的大腦。其實谷歌最早采用的也是英偉達(dá)的GPU，但后期出于多種考慮開始轉(zhuǎn)向研發(fā)自家芯片，這也導(dǎo)致了英偉達(dá)轉(zhuǎn)向與AWS進(jìn)行深度合作。谷歌的商業(yè)模式一直非常具有創(chuàng)意，在AI上也是一樣，雖然開放了底層架構(gòu)TensorFlow，但在芯片業(yè)務(wù)上，選擇了只租不賣，對比英偉達(dá)的芯片出售模式，谷歌似乎規(guī)劃更長遠(yuǎn)，希望開發(fā)一套通用平臺直接服務(wù)最終用戶，當(dāng)然這樣的商業(yè)模式最后能不能成功暫且不論，單單是開發(fā)ASIC就非常具有戰(zhàn)略意義，相比FPGA和GPU，ASIC無論是在功耗還是堆料成本上都要節(jié)約得多，計算效率也要高出很多。但谷歌這枚TPU從嚴(yán)格的意義上講是擁有少部分可重構(gòu)能力的，所以應(yīng)該算是FPGA與ASIC之間的芯片，但隨著谷歌算法不斷的升級和完善，這部分重構(gòu)能力很可能會被谷歌抹掉，將其設(shè)計成為完全獨立的ASIC芯片。值得注意的是，依圖也借鑒了谷歌這種商業(yè)模式，開發(fā)自研芯片，而且只供自己的服務(wù)器使用，不對外出售，亞馬遜的AWS也可能是出于對功耗的顧慮，近期也在轉(zhuǎn)向自家ASIC的研究。

FPGA

　　FPGA全稱Field Programmable Gate Array，現(xiàn)場可編程邏輯門陣列，可以被理解為一種半成品的ASIC，擁有極其優(yōu)秀的可重構(gòu)能力，其硬件加速性能比DSP更加優(yōu)秀，擁有類似GPU那樣多的小單元來將任務(wù)流水線并行處理掉，在推理運算方面明顯優(yōu)于GPU。

　　FPGA 的主要玩家是賽靈思，很多AI初創(chuàng)公司都選擇賽靈思平臺作為市場切入工具，如深鑒科技(已被賽靈思收購)，這樣的趨勢下也進(jìn)一步擴(kuò)大了FPGA的市場占有率，讓賽靈思成為了能夠和英偉達(dá)分庭抗禮的另外一個生態(tài)陣營，其老對手Altera被英特爾收購后，在AIOT領(lǐng)域明顯發(fā)力不足，在AI市場上的競爭基本不足為慮。

　　FPGA很好的解決了現(xiàn)階段AI開發(fā)者面臨的問題，在大多數(shù)初創(chuàng)公司都還處在尋找應(yīng)用場景的階段，F(xiàn)PGA給算法的迭代提供了一個比較節(jié)約的選擇。利用FPGA的可重構(gòu)能力，開發(fā)者可以多次改變項目的特征，實現(xiàn)芯片的復(fù)用。使用FPGA雖然能夠省掉了流片成本，但相對來說還是較貴，而且由于其追求可重構(gòu)的能力，在設(shè)計上就沒能達(dá)到極致優(yōu)化，功耗比ASIC要高出不少，且技術(shù)難度較大，高級開發(fā)人員較少，項目成本較高，在訓(xùn)練型計算中表現(xiàn)中低于GPU。

　　就像GPU一樣，雖然FPGA有不少缺點，但也沒辦法擋住其火爆的趨勢，大量AI公司選擇FPGA來進(jìn)行算法的開發(fā)驗證以及芯片的前期定制，甚至蘋果這種大公司也將FPGA嵌入到自家A12芯片中，提供AI能力。

類腦芯片

　　類腦芯片完全擺脫了傳統(tǒng)的馮諾依曼結(jié)構(gòu)，把內(nèi)存和CPU以及通訊元件集成在一起，DSP作為神經(jīng)元，內(nèi)存作為突觸。這樣設(shè)計的好處是，每個單元完全獨立工作，根據(jù)任務(wù)量調(diào)配單元使用，運算能力驚人且功耗極低。其代表芯片是IBM的TrueNorth和Intel Loihi 。

　　TrueNorth，可以幾厘米空間里，集成4096個內(nèi)核、100萬個DSP和2.56億個內(nèi)存突觸，能耗只有不到70毫瓦。而Loihi 擁有13萬個硅“神經(jīng)元”，復(fù)雜程度幾乎等同老鼠的大腦。目前兩款芯片還都停留在概念階段，沒有投放市場。

　　作為CPU時代的芯片巨頭，Intel其實一直在布局AI市場，先后收購了Altera，Mobileye ,Nervana，Movidius等與AI相關(guān)的公司，但似乎聲音上遠(yuǎn)不如谷歌和英偉達(dá)。當(dāng)然就目前情況來看，Intel似乎也并不是很上心。

未來誰將勝利

　　一方面是在AI訓(xùn)練市場占有絕對領(lǐng)導(dǎo)地位，另一方面自動駕駛技術(shù)尚未成熟，市場反哺還需時日，英偉達(dá)面臨的挑戰(zhàn)是在未來持續(xù)保持GPU對FPGA和ASIC算力上的優(yōu)勢，但由于摩爾定律已經(jīng)失效，7nm后制程升級越來越困難，英偉達(dá)若想繼續(xù)保持算力的優(yōu)勢只能不斷的堆料將產(chǎn)品做大，但“功耗”依舊是擺在面前的問題，顯然云端市場并不買賬這樣的堆料方式，紛紛轉(zhuǎn)向開發(fā)自己的ASIC，而終端市場則被靈活的FPGA切掉了不少份額。

　　國內(nèi)的許多創(chuàng)業(yè)公司初期平臺都會選擇FPGA，這種芯片是公司業(yè)務(wù)從初創(chuàng)到成型的過渡中非常理想的一種選擇，深鑒，寒武紀(jì)，地平線，比特大陸都先后使用過FPGA，商湯等視覺安防AI公司也會用到GPU+FPGA的方案，但當(dāng)業(yè)務(wù)發(fā)展到一定程度后，也都會逐步轉(zhuǎn)向ASIC，如近期依圖發(fā)布的“求索”，未來AI芯片一定會更加定制化，這也確實是提高AI運行效率，降低成本的一個最有效的途徑。

　　此外，由于云端市場門檻相對較高，且大廠完全把持，創(chuàng)業(yè)公司的主要機會將集中在邊緣端，這時低功耗，面向場景開發(fā)的AI芯片將是未來主流發(fā)展方向，或者說全行業(yè)面臨著一場AI升級，很多傳統(tǒng)企業(yè)會借助多年在行業(yè)積累的優(yōu)勢切入進(jìn)AI市場，而這時ASIC應(yīng)該會有更多大展拳腳的機會。

　　當(dāng)然從場景開發(fā)到業(yè)務(wù)的成型是一個漫長過程，目前行業(yè)還處在大量企業(yè)和人才的涌入階段，這些企業(yè)在前期初創(chuàng)時基本都離不開英賽兩大廠的產(chǎn)品，所以在很長時間里它們都不會缺乏生意。

標(biāo)簽：2019世界人工智能大會 AI芯片

我要反饋

自從人類進(jìn)入PC時代開始，微軟（Microsoft）便成為了耳熟能詳?shù)拿?，大量裝嵌在PC內(nèi)部的Windows系統(tǒng)已經(jīng)證明了這家企業(yè)在商業(yè)領(lǐng)域獲得的成功，微軟強大的技術(shù)積累與AI這項引領(lǐng)全球產(chǎn)... [詳情]

2019年08月12日 2019世界人工智能大會微軟

WAIC相遇西岸 | 2019全球人工智能健康峰會六大亮點逐個數(shù)

人工智能持續(xù)驅(qū)動健康產(chǎn)業(yè)變革，已成為技術(shù)強者和資本云集的熱門賽道。人工智能如何賦能健康產(chǎn)業(yè)發(fā)展?AI醫(yī)療行業(yè)監(jiān)管趨勢走向何方?AI應(yīng)用前景如何?上述這些行業(yè)所關(guān)注的熱點問題，都可... [詳情]

2019年08月12日 2019世界人工智能大會健康

倒計時19天，本土品牌閃耀醫(yī)療科智能化優(yōu)勢

近年來，在上海建設(shè)科創(chuàng)中心和人工智能高地的戰(zhàn)略指引下，不少上海本土企業(yè)如中國平安、復(fù)星醫(yī)藥等企業(yè)的創(chuàng)新業(yè)務(wù)在申城迅速布局，成為科技創(chuàng)新城市建設(shè)的重要力量貢獻(xiàn)者。站在上海這... [詳情]

2019年08月12日 2019世界人工智能大會醫(yī)療