您的當前位置:首頁 >休閑 >【中原計算機】人工智能專題:后R1時代,DeepSeek發(fā)展的三大階段 正文
時間:2025-12-01 04:26:16 來源:網絡整理編輯:休閑
報告正文DeepSeek在年初發(fā)布了R1以后,受到了各界普遍關注。后續(xù)來看,DeepSeek并沒有如期發(fā)布更先進的模型R2,而是在進行更多小版本的更新換代。結合每個階段的發(fā)展重點,我們將其劃分為3個主

報告正文
DeepSeek在年初發(fā)布了R1以后,中原展受到了各界普遍關注。計算機人后續(xù)來看,工智DeepSeek并沒有如期發(fā)布更先進的題后模型R2,而是代D大階段在進行更多小版本的更新換代。結合每個階段的中原展發(fā)展重點,我們將其劃分為3個主要的計算機人發(fā)展階段。
1. 階段一:性能提升
DeepSeek在3月推出的工智V3-0324和5月推出的R1-0528,還是題后以基礎模型DeepSeek-V3-Base為基座,通過后訓練實現了模型能力的代D大階段提升,彌補了和頭部模型之間的中原展差距。

2. 階段二:實現混合推理架構、計算機人Agent能力提升、工智與國產芯片協(xié)同優(yōu)化
從8月以后,題后DeepSeek也順應了海外混合推理架構和Agent能力提升的代D大階段大趨勢,推出了V3.1和V3.1-Terminus。這次升級中,DeepSeek的基座模型DeepSeek-V3.1-Base在DeepSeek-V3-Base基礎上做了大規(guī)模外擴訓練,Agent能力有了較大提升,思考效率也有提升。


8月21日,Deep在發(fā)布V3.1的同時,也宣布了在國產芯片適配方面的新進展。V3.1采用UE8M0 FP8縮放格式訓練,為對即將發(fā)布的下一代國產芯片設計。
此前,國內芯片企業(yè)僅有較少支持了FP8數據格式,多數芯片僅能支持FP16格式。FP8雖然可以提升計算速度和降低存儲需求,但是由于計算精度不高,容易損失數據信息,所以V3以前的大模型訓練中多會選用BF16或FP32/TF32精度進行數據計算和存儲。DeepSeek是首個在開源超大規(guī)模大模型中成功落地FP8混合精度訓練的公司,推動了FP8技術的規(guī)?;瘧?,也極大地提升了市場對H20等支持FP8格式芯片的需求。

UE8M0 FP8是對FP8格式的深度優(yōu)化。該格式僅表示非負數(U代表Unisigned,無符號),尾數位為0(M0,尾數位為0),8個比特全部用來表示指數(E8,指數位占8位),Scale通過對數據進行分塊縮放,保持其能夠在FP8表示的范圍內。UE8M0 FP8作為FP8格式的變體,通過減少數據存儲和傳輸的損耗,能最大限度利用硬件計算能力,彌補國產芯片在HBM等高速內存帶寬方面的不足,從而實現國產大模型和國產芯片協(xié)同設計的優(yōu)化,對于國產化芯片的應用起到積極的推動作用。

3. 階段三:提效降價,國產適配加速
9月發(fā)布的V3.2-Exp,基于V3.1-Terminus構建,引入了新的注意力機制DSA,在保持模型性能的穩(wěn)定的同時,在訓練推理效率方面有了較大的提升,帶來了模型較大幅度的降價。
對比R1來看,V3.2-Exp的輸入緩存命中時價格為R1的20%(0.2元/百萬Tokens),輸入緩存未命中時價格為R1的50%(2元/百萬Tokens),輸出價格為R1的19%(3元/百萬Tokens),降幅最為明顯。
考慮到當前大模型之間能力差距在縮小,成本的下降意味著模型具有更好的性價比和可推廣性,也將促進應用端實現更多功能的落地。

在國產適配方面進度明顯加快。在V3.2-Exp發(fā)布的當天,國產芯片華為昇騰和寒武紀同步宣布完成對V3.2-Exp的零日適配。這是繼V3.1采用UE8M0 FP8實現國產大模型和芯片協(xié)同設計的優(yōu)化以后,國產AI產業(yè)從“單點突破”邁向“系統(tǒng)協(xié)同”的又一個標志性事件。
同時值得注意的是DeepSeek還同時開源TileLang和CUDA兩個版本的算子。TileLang是一種采用類Python語法的領域專用語言(DSL),于2025年1月由北大計算機學院楊智團隊開源,旨在實現硬件調度與開發(fā)者算法邏輯的解耦,從而降低GPU編程的技術門檻,同時通過分層設計來實現不同技術背景開發(fā)者,從簡單上手到深度優(yōu)化的不同需求。由于TileLang可以實現對不同硬件平臺的支撐,極大地改善了國產卡目前所面對的CUDA帶來的生態(tài)壁壘問題。

DeepSeek選用TileLang這個新興AI編程語言,再次體現了其強大的創(chuàng)新精神,同時為國產大模型軟硬件生態(tài)建立起到了極大的推動作用。
4. 風險提示
國際形勢變化。
證券分析師承諾:
本報告署名分析師具有中國證券業(yè)協(xié)會授予的證券分析師執(zhí)業(yè)資格,本人任職符合監(jiān)管機構相關合規(guī)要求。本人基于認真審慎的職業(yè)態(tài)度、專業(yè)嚴謹的研究方法與分析邏輯,獨立、客觀的制作本報告。本報告準確的反映了本人的研究觀點,本人對報告內容和觀點負責,保證報告信息來源合法合規(guī)。
重要聲明:
伊普斯客場爆5.3倍冷負 足彩頭獎開6注110萬元2025-12-01 04:25
蓉城穩(wěn)住了 韋世豪穩(wěn)住了 沖擊隊史首座足協(xié)杯冠軍2025-12-01 03:53
剛果(金)一飛機失事 機上7人全部遇難 — 新京報2025-12-01 03:47
大樂透1形態(tài)近期極具升溫 周六這些特征太明顯!2025-12-01 03:38
律師談14歲男生刺死同學被判無期:補刀情節(jié)相當惡劣,理應頂格刑罰2025-12-01 03:37
[新浪彩票]足彩25104期冷熱指數:國際圖實力取分2025-12-01 03:34
小米汽車時速133公里越線超車,致對向本田車4死1重傷,律師:是否主觀故意決定犯罪定性2025-12-01 03:06
收官!成都世運會中國隊36金17銀11銅位居金牌、獎牌榜首位 — 新京報2025-12-01 02:12
鄧炳強:有人散布假消息,想搞亂香港社會2025-12-01 02:08
暴雨洪流中的“生命鏟斗”,內蒙古包頭民警5小時救助8人 — 新京報2025-12-01 01:39
全港下半旗,李家超等悼念火災遇難者2025-12-01 04:22
剛果(金)一飛機失事 機上7人全部遇難 — 新京報2025-12-01 04:15
蓉城穩(wěn)住了 韋世豪穩(wěn)住了 沖擊隊史首座足協(xié)杯冠軍2025-12-01 04:14
首屆龍飛虎杯青少年賽圓滿收官 王梓允公開組摘冠2025-12-01 03:34
競彩大勢:利物浦客場取勝 亞特蘭大值得信任2025-12-01 03:14
[新浪彩票]足彩25104期冷熱指數:國際圖實力取分2025-12-01 02:51
3M公開賽奧利森一桿進洞并列領先沖冠 北山60桿T32025-12-01 02:41
男子守號4年多擒大樂透41萬 能中就很知足2025-12-01 02:14
美國暫停向持有阿富汗護照的個人簽發(fā)簽證2025-12-01 01:50
女子圍甲三箭齊發(fā)零封粵軍 平原桃花開隊大獲全勝2025-12-01 01:44