原創(chuàng)

圓桌對話:從技術到應用,大模型如何轉向?

2025China.cn   2024年08月02日

智能網原創(chuàng),轉載請注明來源

從ChatGPT橫空出世,引發(fā)了無數的猜想和商機,到撥開迷霧,積極尋找大模型應用落地的支點,短短1年多的時間,大模型市場就迎來了從狂熱到冷靜的理性回歸。但是大模型與產業(yè)如何結合?開源模型和閉源模型如何選擇?除了資金企業(yè)還應該做好哪些準備?在產業(yè)應用之前,大模型依然有很多待解的難題。

近日,一場圍繞AI大模型的圓桌對話試圖從不同維度對上述問題給出答案。

安筱鵬:安筱鵬 阿里云智能集團副總裁

討論嘉賓:

殷宇輝 360集團副總裁、數智化集團CEO、人工智能研究院院長

周亞靈 華為云工業(yè)數字化首席產業(yè)架構師,總監(jiān)

杜夏威 中科曙光總裁助理兼智能計算產品事業(yè)部總經理

馬超 潤和軟件首席AI技術官

圓桌討論實錄

安筱鵬:歡迎大家來到圓桌對話環(huán)節(jié)!首先請4位嘉賓分別用一個關鍵詞來分享對于當下火熱的AI大模型的觀察。

殷宇輝:如果說用一個詞的話,我覺得是新質生產力的場明星場景。大模型是新質生產力的核心引擎,但基于 AI怎么樣找到場景去落地,其實是今年百行千業(yè)都面臨的問題。對此,每家企業(yè)都有自己的一些方法論和實踐,但是這些實踐怎么樣變得更通用,推動大模型更完善,或者更行業(yè)化、更垂直化,可能是我們下一步要探索的重點。

周亞靈:如果用一個詞的話,就是大模型代際技術升級帶來的商業(yè)價值閉環(huán)。

通信從3G到4G,手機從功能機到智能機,汽車從燃油車到新能源汽車都是代際升級,那么大模型或者人工智能的代際升級在哪里?能否像新能源汽車一樣帶來代際上的差異。其次,人工智能的具身智能,能夠真正帶來大規(guī)模顆粒變現,顆粒正循環(huán)的場景在哪里?這對于對行業(yè)的示范意義和引導意義非常重大。

杜夏威 :用一個關鍵詞的話,我個人會選擇落地。大家都能夠感知到現在大模型的火熱程度,但是如何實現整個技術鏈條的閉環(huán),形成產業(yè)級的應用,不僅是眼下的主要問題,也是決定大模型和AIGC技術持續(xù)可循環(huán)發(fā)展的一個關鍵問題。

馬超:用一個詞來形容大模型,我關注的是企業(yè)級應用。

企業(yè)應用大模型的時候會面臨成本、數據收集,行業(yè)KNOW-HOW沉淀等很多問題。相比AI1.0時代,大模型讓我們看到了人工智能的上限,同時也增加了企業(yè)級AI應用的落地成本,這個也是我今年比較關注的。

安筱鵬:AI大模型是一次技術的升級,還是會帶來一次技術的產業(yè)革命,業(yè)界有不同的認識和判斷。各位看來,這一輪的AI大模型跟5、6年前的傳統AI或者說判別式人工智能的本質區(qū)別是什么?它會不會帶來顛覆式的產業(yè)影響?

殷宇輝:AI大模型跟傳統AI或者大數據技術不同的幾個方面:第一在生成,第二是在邏輯性推理的增強,第三,也是最重要的是對交互方式的改變。

從Chat GPT開始,不管數字人還是各類問答,新的交互方式已經改變了我們的生活,這是大語言模型最本質的功能或特性。從GPT開始到現在文生視頻,基于transform架構可以實現文本的對齊,圖片的對齊,甚至視頻拆成一個立體空間再小塊的對齊,這和原來的技術架構是完全不一樣的。所以我同意您講的后半句,就是說這是一次產業(yè)革命,是產業(yè)革命一定是它給人們的使用帶來了交互式的革新。

第二,AI大模型的技術能隨著時間推演,逐步升維,同時成本還在持續(xù)降低。下一步,從泛互聯網延伸到傳統產業(yè),這個模式最后會席卷所有產業(yè),我覺得它會是一次真正的 AGI(通用人工智能)的革命。

馬超:我認為大模型跟傳統判別式模型的關鍵區(qū)別之一在開放域問題上。判別式模型要求在特定任務范圍產生相應的能力,而生成式模型更擅長于對開放域的問題進行相應的解決。

另外的區(qū)別是大模型的參數量,訓練數據量,還有智能化程度。比如,一些開源大模型,它不需要做任何的訓練就可以直接用于實際的應用,而且能取得比較好的效果,傳統的判別式模型需要從0開始訓練。另外,從產業(yè)顛覆的角度來講,AI的出現使得原本沒有進入賽道的企業(yè),有可能通過AI技術進入客戶視野,可能會引起市場的重新洗牌。

其次,技術供應商的合作模式也發(fā)生了很大的改變。AI 1.0時代因為成本比較低,AI技術服務提供商可以一站式提供技術或方案。但是大模型出來之后,算力成本、數據成本、模型成本都在提高,不是一家供應商能夠完成的,所以形成了算力服務商、數據標注服務商、基礎模型服務商和解決方案服務商,4個角色共同為1家企業(yè)提供人工智能服務,技術供應商的體系結構分工更加明確。

安筱鵬:今年的漢諾威工業(yè)博覽會上提出了一個問題,美國的大模型和德國的制造業(yè)在結合之后做什么。中國也在探討大模型跟實體經濟的結合,在結合融合落地的過程中面臨哪些問題挑戰(zhàn)?加速推進應該具備哪些基礎?

周亞靈:大模型跟實體經濟的結合跟制造業(yè)數字化轉型一樣,很難有一個放之四海而皆準的法則,但是我們可以從細枝末節(jié)里看到一些通用的方法。基于華為公司自身去做大模型和應用大模型過程中形成的一些經驗,我們認為,做企業(yè)大模型首先要回答三個基本問題:第一,公司內部業(yè)務用大模型到底有沒有達成統一的共識,有沒有行動綱領。第二,公司有沒有核心的業(yè)務場景。第三、有沒有明確的組織,應用大模型一定要有組織和人才。

在應用大模型的過程中,華為形成了“四位一體”概念,即將業(yè)務場景、數據、算力和算法結合,在公司內部達成共識。

在核心業(yè)務場景方面,華為梳理了三大類的業(yè)務場景:第一類是價值最高的,生產力和競爭力提升的場景。第二類是防控風險防控場景,如合同大模型,供應鏈大模型。第三類是業(yè)務和體驗效率提升的場景,如員工的數字助理。

此外,在服務客戶的過程中又定義了“五有”,即有意愿、有場景、有數據、有人才、有計劃,并形成場景應用的價值閉環(huán),運營閉環(huán),生態(tài)閉環(huán)。

杜夏威 :我覺得當下的大模型,如果僅僅作為一個技術研究領域,或者類似于一個純娛樂性的東西,可能并不需要去考慮太多的可治理性和嚴謹性。一旦回到工業(yè)化應用層面,就會變成一個非常嚴肅的問題,比如,故障率,穩(wěn)定性,容錯率怎么做。

我覺得可能有兩個層面需要嚴肅探討。第一,如果做工業(yè)級的應用,工業(yè)領域的專家首先要思考清楚,到底打算把它用在什么場景上,或者什么樣的場景適合和AI技術結合。并不是所有的場景都需要大模型,可能5年、10年前的AI技術完全可以把當前的問題解決掉。第二,原則上不存在一種萬能的大模型,或者說可能存在但未必是最高效的。探討工業(yè)級應用可能又是一個高度耦合的問題,需要復合型人才,需要多領域的協同來解決。

安筱鵬:下一個問題,當企業(yè)要解決特定行業(yè)發(fā)展中的問題時,基于一個基礎模型,如何能夠快速、低成本、高質量的訓練符合自己業(yè)務需要的模型?在算力數據、人才算法上有沒有什么樣的挑戰(zhàn)和問題?

殷宇輝 :坦白講,在當前階段要想快速、低成本還要高質量,會有一些悖論。

今天,泛互聯網的業(yè)務基本上是在一個通用大模型上針對各種應用場景做微調。但是在to B場景里面,首先數據是一個特別大的壁壘,怎么懂專家知識,怎么讓大模型懂行話,這個是必須得邁過去的一道坎。

還有幾點我們在實際案例中摸索出來的經驗,首先,企業(yè)不一定需要一個參數量特別大的通用大模型,可能是又小又專的大模型的組合,針對不同場景可以用最輕量的微調方式,得到一個最適合自身場景的大模型應用。

周亞靈:現在大模型成本還是比較高的,又快速又便宜目前還是有挑戰(zhàn)的。

從我實際接觸的項目來看,有幾點觀察和可以跟各位分享。第一,模型的選型要結合場景,看企業(yè)自身的技術路線是什么。第二、根據自身能力選擇實施方式,選擇開源意味著你有組織和能力去不斷優(yōu)化、調優(yōu),但是很多公司特別是中型企業(yè)或傳統企業(yè),如果沒有這個能力,可以選擇一些商用的大模型,由供應商來提供端到端的高質量服務。第三、實施的時候可以從從輔助場景開始,一方面能快速看到價值,另一方面也是讓團隊快速成長起來。

我個人認為,大模型最終要重構所有的企業(yè),重構所有人員,公司無論規(guī)模大小,自己一定要有構建能力,如果完全依賴供應商,很難把大模型用到實處。因為大模型有一個特點,會根據數據積累,根據應用場景越用越好用,如果完全不清楚怎么用的話,企業(yè)很難發(fā)揮好這個特點,這樣跟使用小模型相比,其實沒有任何的競爭力了。

安筱鵬:好,第三個好我們再問4位嘉賓最后一個問題?,F在數字技術體系的競爭是一個這個國家的競爭,生態(tài)的競爭,在這個過程中,怎么來看大模型的開源和閉源在整個產業(yè)發(fā)展中的作用?

馬超:我說一句比較客觀的話,閉源模型無論從數據投入還是算力投入,在通用的領域里面是要超越開源的。但是在在一些特定行業(yè),經過微調后的開源模型能力不輸于沒法微調的商業(yè)模型。

商業(yè)模型可以生成一些數據,幫助引導訓練開源模型開源模型可能更適合于解決固定的場景化、低成本的解決方案,而商業(yè)模型更適合去推動整個行業(yè)發(fā)展,然后去輔助落實這些解決方案。

杜夏威:開源模型還是閉源模型,如果從用的角度上說,最后一定會變成你適合的是哪個。

閉源模型有它自身的一些技術優(yōu)勢,畢竟它通過了很多數據資產的凝練打磨,還有技術迭代,但是未必所有人都支付得起。開源在一定維度上提升了大模型技術的覆蓋面,讓更多的領域和用戶都有機會去嘗試。所以我覺得這個問題可能還會延續(xù)下去,兩者還是一個并存的狀態(tài)。

周亞靈 :我個人覺得從整個信息產業(yè)來說,開源是個好事情。對于供應商來說,開源和閉源其實主要取決于商業(yè)決策,靠什么去變現,本質上它是商業(yè)行為,并不是技術路線的問題。開源也不意味著免費,閉源也并不意味著落后。

對用戶來說,開源和閉源還是和組織能力和場景選擇有關系。如果用戶真正的想把大模型融入骨子里,做成產品的一部分,可能選擇開源更好。從我們的經驗來說,閉源其實更方便,因為有商業(yè)保障,有商業(yè)服務。

殷宇輝 :我特別贊同的說法是,開源真的改變了世界。

但是企業(yè)如果真正要用,還是要從自身定位出發(fā),像互聯網企業(yè)大多數的基礎設施都是構建于開源軟件,因為互聯網場景多又復雜,如果基于閉源軟件很多情況需要持續(xù)去調優(yōu)。但是對于很多傳統企業(yè),坦白講我覺得閉源可能用起來更放心,更穩(wěn)定更好用。

安筱鵬:根據大家的討論,我們的結論是:今天的AI大模型不是一次技術的簡單升級,而是一次技術的革命。

如果再去追問到底是什么革命,我覺得是三場革命:第一場革命就是人機交互革命。第二個場革命叫做認知協作,互聯網的本質是信息的供需精準匹配,而大模型帶來的認知協作是從問題到答案給出了最短路徑。第三個是計算范式的革命。今天我們看到全球芯片廠商市值在高速增長,這個革命如果是一場馬拉松的話,我們可能才跑出一公里,這是一個長跑,在這個過程中需要有爆發(fā)力,需要有耐力,它不僅僅是一個大模型本身的競爭,也是一個整個產業(yè)生態(tài)體系的競爭。

標簽:大模型 我要反饋 
2024世界人工智能大會專題
ABB電機與發(fā)電機拼圖挑戰(zhàn)賽
優(yōu)傲機器人下載中心
西克
專題報道
2024世界人工智能大會
2024世界人工智能大會

WAIC 2024將于7月在上海舉行,論壇時間7月4日-6日,展覽時間7月4日-7日。WAIC 2024將圍繞“以共商促... [更多]

2024漢諾威工業(yè)博覽會專題
2024漢諾威工業(yè)博覽會專題

2024 漢諾威工業(yè)博覽會將于4月22 - 26日在德國漢諾威展覽中心舉行。作為全球首屈一指的工業(yè)貿易展覽會,本屆展覽會... [更多]

第三屆EESA儲能展
第三屆EESA儲能展

EESA儲能展是由儲能領跑者聯盟主辦的品牌展會,創(chuàng)辦至今已經連續(xù)舉辦了兩屆。為加快適應儲能規(guī)模化發(fā)展的步伐,促進儲能行業(yè)... [更多]