首發(fā) | 昆侖芯 | 國產(chǎn)AI卡Deepseek訓(xùn)練推理全版本適配、性能卓越，一鍵部署等您來

ainet.cn 2025年02月06日

編者按：本文是昆侖芯適配DeepSeek系列推文第一篇，將于近期分別推出在昆侖芯P800上進(jìn)行DeepSeek-V3/R1推理、訓(xùn)練的深度文章，干貨滿滿、持續(xù)關(guān)注!

短短兩周，DeepSeek成為全球增速最快的AI應(yīng)用。憑借卓越的性能和廣泛的應(yīng)用場景，這匹大模型黑馬已然成為行業(yè)標(biāo)桿，為千行百業(yè)提供了AI解決方案新選擇。蛇年開工當(dāng)天，昆侖芯新一代產(chǎn)品P800萬卡集群點(diǎn)亮的消息引發(fā)關(guān)注，三萬卡集群也將于近日點(diǎn)亮，為國產(chǎn)AI算力注入強(qiáng)大勢能。

昆侖芯在大模型時(shí)代爆發(fā)出卓越的競爭力，而這正是基于十余年真實(shí)業(yè)務(wù)場景歷練以及獨(dú)特的自研優(yōu)勢。作為國產(chǎn)AI芯片引領(lǐng)者，昆侖芯已完成Deepseek訓(xùn)練推理全版本適配，且性能卓越、成本效率極致，一鍵部署，為廣大開發(fā)者提供更快、更強(qiáng)、更省的訓(xùn)推體驗(yàn)。

全版本：率先完成訓(xùn)練推理DeepSeek全版本適配

在模型適配方面，昆侖芯領(lǐng)先業(yè)界。在DeepSeek-V3/R1上線不久，昆侖芯便率先完成全版本模型適配，這其中包括DeepSeek MoE 模型及其蒸餾的Llama/Qwen等小規(guī)模dense模型(詳見下方海報(bào))。

同時(shí)，昆侖芯也已全面適配文心系列、Llama、Qwen、ChatGLM、Baichuan等各類大模型的推理和訓(xùn)練任務(wù)，性能優(yōu)勢明顯。在各個(gè)行業(yè)客戶、合作伙伴的業(yè)務(wù)場景中，昆侖芯已實(shí)際上線運(yùn)行各類大模型任務(wù);通過千卡和萬卡集群為客戶提供了穩(wěn)定的服務(wù)和優(yōu)秀的性能表現(xiàn)。

性能卓越：前瞻產(chǎn)品定義、極致成本效率

得益于昆侖芯前瞻的產(chǎn)品定義，昆侖芯產(chǎn)品性能表現(xiàn)卓越，成本優(yōu)勢領(lǐng)先。

昆侖芯P800可以較好的支撐Deepseek系列MoE模型大規(guī)模訓(xùn)練任務(wù)，全面支持MLA、多專家并行等特性，僅需32臺(tái)即可支持模型全參訓(xùn)練，高效完成模型持續(xù)訓(xùn)練和微調(diào)。

P800顯存規(guī)格優(yōu)于同類主流GPU20%-50%，對MoE架構(gòu)更加友好，且率先支持8bit推理，單機(jī)8卡即可運(yùn)行 671B 模型。正因如此，昆侖芯相較同類產(chǎn)品更加易于部署，同時(shí)可顯著降低運(yùn)行成本，輕松完成DeepSeek-V3/R1全版本推理任務(wù)。

開發(fā)者友好：一鍵部署、即刻上線

P800生態(tài)完備，易用性強(qiáng)，可以實(shí)現(xiàn)對訓(xùn)練和推理任務(wù)的快速適配。P800快速適配支持了Deepseek-V3/R1的持續(xù)全參數(shù)訓(xùn)練，LoRA等PEFT能力，提供給用戶開箱即用的訓(xùn)練體驗(yàn)?；诶鲂就暾能浖鷳B(tài)棧，兩個(gè)步驟即可輕松實(shí)現(xiàn)在昆侖芯P800上進(jìn)行DeepSeek-V3/R1推理部署，對廣大開發(fā)者十分友好。

歡迎體驗(yàn)：兩步完成DeepSeek-V3/R1模型推理部署

1 .資源準(zhǔn)備

主要是鏡像和模型，鏡像提供完整的依賴環(huán)境開箱即用。

模型準(zhǔn)備

昆侖芯P800支持8bit推理，下載官方權(quán)重后使用如下命令進(jìn)行量化(后文附有下載方式);其他不同尺寸蒸餾模型則通過huggingface下載即可。

鏡像準(zhǔn)備(后文附有下載方式)

2 .啟動(dòng)服務(wù)&請求示例

server和client使用方式和vllm社區(qū)基本一致，零成本上手，如下：

啟動(dòng)服務(wù)

鏡像中一鍵啟動(dòng)，采樣和推理參數(shù)可根據(jù)實(shí)際業(yè)務(wù)場景在腳本中配置。

請求示例

下圖為一個(gè)簡單的請求示例：

以下兩種方式均可快速獲取文檔：

掃碼獲取

發(fā)送郵件至：kunlunxin01@baidu.com

*本文借助DeepSeek生成

（來源：昆侖芯科技）

標(biāo)簽：昆侖芯科技

我要反饋

相關(guān)鏈接

英特爾發(fā)布2024年第四季度及全年財(cái)報(bào)

●第四季度營收143億美元，同比下降7%。全年?duì)I收531億美元，同比下降2%?！裼⑻貭柕谒募径让抗墒找?EPS)為-0.03美元;非通用會(huì)計(jì)準(zhǔn)則每股收益為0.13美元。全年每股收益為-4.38美元;非通... [詳情]

2025年02月06日英特爾

深度復(fù)盤！DeepSeek引起的全球技術(shù)圈恐慌是如何形成的?

1月27日一早，DeepSeek在中國區(qū)和美國區(qū)蘋果AppStore免費(fèi)榜上同時(shí)沖到了下載量第一，超過原先霸榜的ChatGPT，這也是國產(chǎn)應(yīng)用首次實(shí)現(xiàn)這一成就。而半個(gè)月前(1月11日)，DeepSeek的App才... [詳情]

2025年02月06日 DeepSeek

市場監(jiān)管總局依法對谷歌立案調(diào)查；ST考慮裁員3000多人；傳蘋果接近敲定折疊顯示屏供應(yīng)商

市場監(jiān)管總局依法對谷歌立案調(diào)查DeepSeekV3和R1模型完成海光DCU國產(chǎn)化適配并正式上線ST考慮裁員3000多人本田汽車提議收購日產(chǎn)股份并將其納入子公司，但遭到強(qiáng)烈反對傳蘋果接近敲定折疊... [詳情]

2025年02月06日谷歌蘋果英特爾

資訊熱點(diǎn)

安森美推出面向工業(yè)應(yīng)用的先進(jìn)深度傳感器研華攜手生態(tài)伙伴，引領(lǐng)AI驅(qū)動(dòng)機(jī)器人新時(shí)代收購正式落地！ABB構(gòu)筑智慧建筑業(yè)務(wù)線閉環(huán) 康普觀點(diǎn)：在2025年推動(dòng)采用更廣泛、更可持續(xù)發(fā)展的網(wǎng)絡(luò)技術(shù) 中國信通院與GSMA簽署Open Gateway合作備忘錄，共筑全球算力互聯(lián)新生態(tài) 新品揭秘 | 研華AIMB-789如何重新定義工業(yè)計(jì)算性能? 達(dá)明力量感知功能丨突破工業(yè)觸覺邊界，讓協(xié)作機(jī)器人「感知力」爆棚艾睿電子推出機(jī)器人解決方案技術(shù)資源新國標(biāo)《汽車空調(diào)用電動(dòng)壓縮機(jī)總成》發(fā)布，威靈汽車部件助力行業(yè)健康發(fā)展

專題報(bào)道

2023-2024 智能·零碳成果展映

“2023-2024智能·零碳成果展映”展示國內(nèi)外企業(yè)推進(jìn)“雙碳”實(shí)踐的最新成果，鼓勵(lì)更多企業(yè)、科研機(jī)構(gòu)、投資機(jī)構(gòu)等廣泛... [更多]

中國國際進(jìn)口博覽會(huì)

11月5日至10日，第七屆中國國際進(jìn)口博覽會(huì)在國家會(huì)展中心（上海）舉行。152個(gè)國家、地區(qū)和國際組織，近3500家參展企... [更多]

2024 工博會(huì) | 直播探館 · 全景解讀

第二十四屆中國工博會(huì)于9月24日至28日在國家會(huì)展中心(上海)舉行，展會(huì)以“工業(yè)聚能新質(zhì)領(lǐng)航”為全新主題。 [更多]

視頻

/resupload/guangzhi/AS00012420/1735897073649_1.jpg

日本黛杰—以獨(dú)創(chuàng)的技術(shù)力和創(chuàng)造力服務(wù)全球用戶德國波龍F(tuán)ormControl X 測量及自動(dòng)化軟件蔡司智能服務(wù)看板魏因加特納最新公司宣傳片上?！癆I+”進(jìn)行時(shí)，科技創(chuàng)新加速人工智能走深向?qū)?/a> 2025年新能源方向：緊隨政策引領(lǐng)，洞悉市場化準(zhǔn)則 “星辰計(jì)劃”：以生態(tài)力量共創(chuàng)制造業(yè)明天

首發(fā) | 昆侖芯 | 國產(chǎn)AI卡Deepseek訓(xùn)練推理全版本適配、性能卓越，一鍵部署等您來

首發(fā) | 昆侖芯 | 國產(chǎn)AI卡Deepseek訓(xùn)練推理全版本適配、性能卓越，一鍵部署等您來