商湯科技董事長(zhǎng)兼CEO徐立：AI 2.0時(shí)代的 “新質(zhì)生產(chǎn)力工具”

ainet.cn 2024年03月25日

“AI 2.0時(shí)代，生成式AI被視為推動(dòng)生產(chǎn)力進(jìn)步的重要技術(shù)，如果能在知識(shí)、推理、執(zhí)行三層能力上實(shí)現(xiàn)突破，將真正帶來(lái)整個(gè)社會(huì)生產(chǎn)力的跨越式發(fā)展。” 商湯科技董事長(zhǎng)兼CEO徐立在2024 GDC上提出了這一前瞻性觀點(diǎn)。

3月23-24日，2024全球開(kāi)發(fā)者先鋒大會(huì)(GDC)在上海隆重召開(kāi)。商湯科技董事長(zhǎng)兼CEO徐立受邀出席開(kāi)幕式，并發(fā)表《AI 2.0時(shí)代的“新質(zhì)生產(chǎn)力工具”》主旨演講，分享了對(duì)AI 2.0時(shí)代生產(chǎn)力工具“質(zhì)”變背后的思考和突破路徑。

以下為徐立演講內(nèi)容梳理。

新生產(chǎn)力工具仍需持續(xù)進(jìn)化

最近，“新質(zhì)生產(chǎn)力”成為熱議話題，尤其在開(kāi)發(fā)者領(lǐng)域，生成式AI被視為引領(lǐng)生產(chǎn)力突破的技術(shù)，也標(biāo)志著人工智能進(jìn)入了一個(gè)新的發(fā)展階段，我們稱之為AI 2.0時(shí)代。

ChatGPT、Copilot、Blackwell是AI2.0時(shí)代的熱度代名詞。搜索數(shù)據(jù)顯示，中國(guó)對(duì)于這些詞的關(guān)注熱度位居世界榜首，這代表著中國(guó)近千萬(wàn)的開(kāi)發(fā)者以及普羅大眾對(duì)于AI能夠帶來(lái)的變化熱切關(guān)注。當(dāng)然，這也是中國(guó)AI發(fā)展的非常好的基礎(chǔ)。

隨著AI 2.0時(shí)代的來(lái)臨，GitHub上的相關(guān)項(xiàng)目數(shù)量呈指數(shù)級(jí)增長(zhǎng)。生成式AI項(xiàng)目、大模型項(xiàng)目以及輔助編程、輔助開(kāi)發(fā)的工具項(xiàng)目層出不窮。但反過(guò)來(lái)看，中國(guó)數(shù)字人才缺口也在逐年增大，且短缺比例在快速擴(kuò)大。

還有一組數(shù)據(jù)值得關(guān)注。盡管中國(guó)對(duì)AI 2.0的關(guān)注極高，但在實(shí)際應(yīng)用方面排名卻落后于美國(guó)和印度等國(guó)家。這其中，語(yǔ)言是一個(gè)不容忽視的問(wèn)題。以通過(guò)自然語(yǔ)言完成編程任務(wù)為例，英語(yǔ)與現(xiàn)有程序的匹配度相當(dāng)高，而優(yōu)秀的中文語(yǔ)言工具相對(duì)欠缺。

雖然我們已經(jīng)開(kāi)始使用AI 2.0時(shí)代的生產(chǎn)力工具，但這些工具帶來(lái)的生產(chǎn)效率提升效果并不明顯，所能解決的問(wèn)題占比不足10%，給生產(chǎn)鏈路帶來(lái)的突破相對(duì)有限。

眾所周知，軟件開(kāi)發(fā)全生命周期包括需求分析、設(shè)計(jì)、開(kāi)發(fā)、測(cè)試、部署和維護(hù)諸多環(huán)節(jié)。雖然目前AI能夠帶來(lái)很多革新，或者擴(kuò)展到很多場(chǎng)景，但目前僅能解決其中非常小眾的部分。

具體而言，AI目前能解決的是在過(guò)往基礎(chǔ)上抽象成比較標(biāo)準(zhǔn)化、甚至以知識(shí)庫(kù)的形式固化下來(lái)的內(nèi)容，包括代碼補(bǔ)全、代碼增寫(xiě)以及部分測(cè)試用例等。如果把它分?jǐn)偟秸麄€(gè)軟件或者產(chǎn)品設(shè)計(jì)的全流程當(dāng)中，占比并不高。

當(dāng)然，隨著擴(kuò)展能力變強(qiáng)，很多工具會(huì)從前端的設(shè)計(jì)、測(cè)試用例再到維護(hù)的橫向拓展，一步步往前演進(jìn)。

除了橫向能力的拓展，從縱向來(lái)看，當(dāng)前，新生產(chǎn)力工具的準(zhǔn)確率和完成度也普遍較低。

根據(jù)SWE-bench評(píng)估，Claude 2 和 GPT-4在特定任務(wù)上僅不到5%的任務(wù)完成度，即使是最新的Devin完成度也僅13%，雖然整個(gè)行業(yè)在往前走，但目前還是處于相對(duì)雛形。

另一個(gè)有意思的現(xiàn)象是，編程經(jīng)驗(yàn)越豐富，不代表就越能用好新的生產(chǎn)力工具。統(tǒng)計(jì)數(shù)據(jù)顯示是相反的：工作五年以下的程序員使用新生產(chǎn)力工具解決問(wèn)題時(shí)長(zhǎng)超過(guò)一小時(shí)，但五年以上的程序員反而更短。這意味著越是高階、復(fù)雜的任務(wù)，對(duì)于當(dāng)前新生產(chǎn)力工具來(lái)說(shuō)還有一定的挑戰(zhàn)。

大模型能力的三層架構(gòu)

大模型能力可分為三層架構(gòu)，而且這三層之間互有依賴，但又相對(duì)獨(dú)立。

第一層知識(shí)(Knowledge)，世界知識(shí)的全面灌注。目前，許多生產(chǎn)力工具解決的都是知識(shí)層的問(wèn)題，當(dāng)用戶提出問(wèn)題時(shí)，其底層的邏輯都來(lái)自于“世上無(wú)新事”——你所面臨的問(wèn)題，前人可能已經(jīng)遇到過(guò)并解決了，因此通過(guò)大模型可以很好地完成這些任務(wù)。

第二層推理(Reasoning)，理性思維的質(zhì)變提升。有了世界知識(shí)之后，再往前演進(jìn)。即使不知道這件事實(shí)，也可通過(guò)AI逐步把這個(gè)事實(shí)推理出來(lái)，給出更多的可能性。

知識(shí)和推理是作為生產(chǎn)力工具——大模型最重要的兩層，但目前在推理層，成長(zhǎng)還相對(duì)有限，這也是今后要集中突破的能力之一。

第三層執(zhí)行(Execution)，世界內(nèi)容的互動(dòng)變革，即如何跟這個(gè)世界互動(dòng)反饋。某種意義上，如今火熱的具身智能，在執(zhí)行上會(huì)有很大的突破。

總體來(lái)講，這三層可以組成一個(gè)完備的對(duì)于世界提供生產(chǎn)力工具模型的三層能力。

“KRE”三層架構(gòu)實(shí)踐：商湯“小浣熊”快速進(jìn)化

商湯結(jié)合“KRE”三層架構(gòu)打造出一個(gè)辦公輔助軟件——“小浣熊”。

在一個(gè)已開(kāi)發(fā)完成的基模型的基礎(chǔ)上，我們從需求分析到最終完成產(chǎn)品開(kāi)發(fā)，共需投入100人天的工作量。

如果去年用“小浣熊”代碼補(bǔ)助工具，可節(jié)省30%的工作量。它在整個(gè)過(guò)程中主要解決的還是一些重復(fù)性的勞動(dòng)，在一個(gè)很好的代碼庫(kù)基礎(chǔ)上，能夠做一些代碼的完成任務(wù)。

在此基礎(chǔ)上，我們進(jìn)一步整合了從需求分析、需求設(shè)計(jì)到長(zhǎng)尾應(yīng)用等各個(gè)環(huán)節(jié)，推出了更為強(qiáng)大的“小浣熊”2.0版本。它真正意義上基于我們給出的海量數(shù)據(jù)篩選出需求，制定產(chǎn)品特征，在產(chǎn)品的特征之上完成產(chǎn)品的自主開(kāi)發(fā)。

最終，我們期待它在獲得世界知識(shí)的基礎(chǔ)上，在真實(shí)的世界當(dāng)中應(yīng)用到更多的機(jī)器人場(chǎng)景當(dāng)中。

再以“KRE”三層來(lái)理解“小浣熊”。知識(shí)層是代碼的補(bǔ)全，補(bǔ)全的代碼來(lái)自他人寫(xiě)過(guò)的代碼;推理層則深入到軟件開(kāi)發(fā)的全流程;執(zhí)行層進(jìn)入切分到垂直場(chǎng)景當(dāng)中，以場(chǎng)景化的智能為依歸。

那么知識(shí)、推理，這兩層是不是相關(guān)?以GPT4為例，它擁有強(qiáng)大的代碼解釋器，能夠處理各種數(shù)學(xué)問(wèn)題。在面對(duì)某些特定問(wèn)題時(shí)，例如“請(qǐng)列出一百以內(nèi)所有的兩個(gè)質(zhì)數(shù)相乘”以及“一百以內(nèi)兩個(gè)質(zhì)數(shù)相乘加1”，它能夠正確地列出前者，但在處理后者時(shí)卻出現(xiàn)了錯(cuò)誤。兩個(gè)問(wèn)題難度一樣，為什么會(huì)出錯(cuò)?原因在于這類(lèi)問(wèn)題沒(méi)有見(jiàn)過(guò)，它的世界知識(shí)沒(méi)有辦法直接給出答案，需要調(diào)用代碼解釋器，但生成代碼正確率不可能是100%，所以會(huì)有出錯(cuò)的概率。

可以說(shuō)，知識(shí)層主要解決高頻、標(biāo)準(zhǔn)化問(wèn)題，做別人做過(guò)的問(wèn)題，顯然準(zhǔn)確率高。推理主要解決長(zhǎng)尾、碎片化的問(wèn)題。

舉兩個(gè)“小浣熊”場(chǎng)景化的例子。

場(chǎng)景一：管理智能化。在交通分析的場(chǎng)景中，大屏上的數(shù)據(jù)往往是固定化的，比如某個(gè)路口的流量、某個(gè)時(shí)間的流量分析等等，是一個(gè)標(biāo)準(zhǔn)化的問(wèn)題。然而，當(dāng)要結(jié)合天氣因素、輿論因素、新聞因素，過(guò)去沒(méi)有此類(lèi)的分析結(jié)果，可以用軟件強(qiáng)推理能力來(lái)完成一些長(zhǎng)尾應(yīng)用的分析。

場(chǎng)景二：辦公智能化。當(dāng)需要為產(chǎn)品推廣制定預(yù)算時(shí)，把財(cái)務(wù)報(bào)表、賬戶信息、產(chǎn)品介紹等各類(lèi)文檔資源全部輸入到商湯的“辦公小浣熊”當(dāng)中，它能夠根據(jù)輸入的數(shù)據(jù)和需求，給出一個(gè)既合理又科學(xué)的預(yù)算方案，展現(xiàn)出強(qiáng)大的推理能力。

總之，生產(chǎn)力工具如果在知識(shí)能力、推理能力、執(zhí)行能力三層能力上都有突破，首先受益的是廣大開(kāi)發(fā)者以及場(chǎng)景化的核心應(yīng)用，最終將真正帶來(lái)整個(gè)社會(huì)生產(chǎn)力的跨越式發(fā)展。

（來(lái)源：商湯科技）

標(biāo)簽：商湯科技

我要反饋

近日，2023年商湯獎(jiǎng)學(xué)金頒獎(jiǎng)典禮暨冬令營(yíng)學(xué)術(shù)交流活動(dòng)成功舉辦。來(lái)自清華大學(xué)、北京大學(xué)、上海交通大學(xué)、中國(guó)科學(xué)技術(shù)大學(xué)、浙江大學(xué)等全國(guó)知名學(xué)府的30名學(xué)子獲獎(jiǎng)。其中，有26名同學(xué)... [詳情]

2024年03月25日商湯科技

“年味兒”遠(yuǎn)飄海外，商湯AIGC助力阿布扎比新年慶典活動(dòng)

農(nóng)歷春節(jié)期間，中國(guó)“年味兒”遠(yuǎn)飄海外!近日，阿聯(lián)酋亞斯島(YasIsland)舉行了一系列中國(guó)春節(jié)慶祝活動(dòng)，年味十足。商湯科技AIGC技術(shù)賦能園區(qū)慶?；顒?dòng)，為在阿華人及各地游客... [詳情]

2024年03月25日商湯科技

2023世界人工智能大會(huì)總結(jié)會(huì)暨2024世界人工智能大會(huì)啟動(dòng)會(huì)順利召開(kāi)

3月7日，2023世界人工智能大會(huì)總結(jié)會(huì)暨2024世界人工智能大會(huì)啟動(dòng)會(huì)在上海世博中心舉行。上海市經(jīng)濟(jì)信息化委人工智能發(fā)展處處長(zhǎng)王志佳，市有關(guān)委辦局相關(guān)同志，東浩蘭生集團(tuán)、上海廣播... [詳情]

2024年03月25日世界人工智能大會(huì)