能效管理

人工智能引發(fā)能源問(wèn)題,我們?cè)撛趺崔k?(一)

ainet.cn   2019年12月27日

  在 2014 年,斯坦福大學(xué)教授 Mark Horowitz 發(fā)表了一篇題目為“計(jì)算的能源問(wèn)題(以及我們?cè)撛趺崔k)”的論文。這篇具有深遠(yuǎn)意義的論文,討論了當(dāng)前半導(dǎo)體行業(yè)所面臨的最熱門的、與登納德縮放比例定律 (Dennard Scaling )和摩爾定律 (Moore’s Law) 失效相關(guān)的挑戰(zhàn)。

  如果可以的話,我想借用并改編一下 Mark 的論文標(biāo)題,這樣我就可以就機(jī)器學(xué)習(xí)推斷應(yīng)用為什么應(yīng)該考慮專用硬件,分享一下我的一些觀點(diǎn)。

專用硬件加速實(shí)在必行

  首先,讓我們考慮一下問(wèn)題的癥結(jié)所在。大約在2005 年,處理器內(nèi)核時(shí)鐘頻率的增長(zhǎng)進(jìn)入了瓶頸??s小工藝尺寸和降低內(nèi)核電壓不再像以前一樣能夠?yàn)槲覀儙?lái)優(yōu)勢(shì)。其根本的問(wèn)題,就是計(jì)算已經(jīng)達(dá)到了功率密度(W/mm2)的極限。

  如果我們?cè)谕粋€(gè)裸片上放置更多的內(nèi)核,我們就可以在相同的功耗預(yù)算下增加運(yùn)算數(shù)量,但其前提是我們還還要在一定程度上降低時(shí)鐘頻率,以抵消額外內(nèi)核所消耗的能量。AMD 和英特爾都是在 2005-2006 年期間發(fā)布了他們的首個(gè)雙核處理器,這并不是巧合。然而,隨著我們繼續(xù)嘗試增加內(nèi)核的數(shù)量,我們必須考慮每個(gè)運(yùn)算所消耗的能量和每個(gè)運(yùn)算所需的芯片面積。此外,我們還需要確保我們能夠通過(guò) N 來(lái)有效地實(shí)現(xiàn)并行算法,其中 N 是內(nèi)核的數(shù)量。對(duì)于所有的算法來(lái)說(shuō),這一問(wèn)題的通用解決方案,或者說(shuō)“計(jì)算飽和的靈丹妙藥”仍然是一個(gè)難以捉摸的問(wèn)題,現(xiàn)在最好的解決方法就是應(yīng)用“自適應(yīng)硬件”。

  事實(shí)證明,無(wú)論您的處理器設(shè)計(jì)是使用多核 CPU、GPU 還是 SoC 實(shí)現(xiàn)的,在處理器級(jí)的總體功耗分布都將大致相同。所以假若我們估算出以下的情況便較為接近真實(shí)情況:

  內(nèi)核 = 30%

  內(nèi)部存儲(chǔ)器(L1、L2、L3)= 30%

  外部存儲(chǔ)器(DDR)= 40%

  在上面的分析中,我們沒(méi)有考慮的是還存在另外一個(gè)總體優(yōu)化的方式,那就是專用硬件加速器優(yōu)化的實(shí)現(xiàn)方式。我們可以對(duì)專用硬件進(jìn)行優(yōu)化以極高效地執(zhí)行特定的功能。通常情況下,這種硬件是為了減少外部存儲(chǔ)器訪問(wèn)而設(shè)計(jì)的,其同時(shí)減少了時(shí)延與功耗。我們可以對(duì)專用硬件進(jìn)行優(yōu)化,以便給定算法的數(shù)據(jù)運(yùn)動(dòng)部分使用本地化存儲(chǔ)器 (BlockRAM、UltraRAM) 來(lái)進(jìn)行中間結(jié)果的存儲(chǔ)。

  設(shè)計(jì)高效的加速器是多維度的設(shè)計(jì)問(wèn)題:

  我們?nèi)绾螌?shí)現(xiàn)硬件優(yōu)化來(lái)處理我們的特定算法?(Mark 很好地回答了這一問(wèn)題,即必須將算法從“所有算法的空間”移動(dòng)到“受限空間”。)

  我們?nèi)绾伪3謹(jǐn)y帶數(shù)據(jù)的加速器,以確保我們的計(jì)算加速器在每個(gè)時(shí)鐘周期都是飽和的?

  我們?nèi)绾巫畲笙薅鹊販p少通信開(kāi)銷?

  我們?nèi)绾蝺?yōu)化正在處理的運(yùn)算符的動(dòng)態(tài)范圍?

  我們?nèi)绾巫畲笙薅鹊販p少外部存儲(chǔ)器,甚至是本地存儲(chǔ)器的使用?

  我們?nèi)绾蜗噶钐幚砉艿篱_(kāi)銷?

  我們?nèi)绾伟才挪僮饕源_保數(shù)據(jù)重用,從而使存儲(chǔ)器流量最小化,并且使存儲(chǔ)器訪問(wèn)相關(guān)的運(yùn)算數(shù)量最大化?

  自適應(yīng)硬件的戰(zhàn)略優(yōu)勢(shì)這里,我們將討論和評(píng)估賽靈思的自適應(yīng)硬件及 DNNDK 如何應(yīng)對(duì)上述這些尖銳的問(wèn)題和挑戰(zhàn),特別是當(dāng)它涉及到機(jī)器學(xué)習(xí)推斷時(shí)。在進(jìn)行下一次設(shè)計(jì)之前,我建議您回顧一下 Mark 有關(guān)這個(gè)主題的精彩演講,然后再考慮如何在您的下一次設(shè)計(jì)中使用自適應(yīng)硬件來(lái)實(shí)現(xiàn)您的戰(zhàn)略優(yōu)勢(shì)。

  在這篇文章的第 2 部分中,我們將討論和評(píng)估賽靈思的自適應(yīng)硬件及 DNNDK (現(xiàn)在已經(jīng)發(fā)布Vitis AI 統(tǒng)一軟件平臺(tái)) 如何應(yīng)對(duì)這些挑戰(zhàn),特別是當(dāng)它涉及到機(jī)器學(xué)習(xí)推斷時(shí)。

(轉(zhuǎn)載)

標(biāo)簽:賽靈思 我要反饋 
泰科電子ECK、ECP系列高壓直流接觸器白皮書(shū)下載
優(yōu)傲機(jī)器人下載中心
億萬(wàn)克
專題報(bào)道
聚力同行 · 新智“碳”索
聚力同行 · 新智“碳”索

“新華社-智能·零碳”項(xiàng)目策劃以“聚力同行·新智‘碳’索”為主題的新能源專題,主要圍繞光伏、儲(chǔ)能、鋰電、氫能、風(fēng)能五大新... [更多]

2025中國(guó)國(guó)際機(jī)床展覽會(huì)
2025中國(guó)國(guó)際機(jī)床展覽會(huì)

4月21至26日,以“融合創(chuàng)新,數(shù)智未來(lái)”為主題的第十九屆中國(guó)國(guó)際機(jī)床展覽會(huì)在首都國(guó)際會(huì)展中心盛大舉辦。憑借場(chǎng)館的卓越服... [更多]

2023-2024 智能·零碳成果展映
2023-2024 智能·零碳成果展映

“2023-2024智能·零碳成果展映”展示國(guó)內(nèi)外企業(yè)推進(jìn)“雙碳”實(shí)踐的最新成果,鼓勵(lì)更多企業(yè)、科研機(jī)構(gòu)、投資機(jī)構(gòu)等廣泛... [更多]