1、NPU能提高AI算法運(yùn)行效率
根據(jù)觀研報告網(wǎng)發(fā)布的《中國NPU行業(yè)現(xiàn)狀深度分析與投資前景研究報告(2025-2032)》顯示,NPU即神經(jīng)網(wǎng)絡(luò)處理單元,采用專門優(yōu)化的神經(jīng)網(wǎng)絡(luò)計(jì)算架構(gòu),來處理特定的任務(wù),主要被用于加速計(jì)算。通過對NPU硬件層面優(yōu)化,能高效處理神經(jīng)網(wǎng)絡(luò)算法中矩陣乘法、卷積等數(shù)學(xué)運(yùn)算。相較于GPU和CPU,NPU在AI計(jì)算上性能和能效有了明顯提升,用來提高AI算法運(yùn)行效率。
NPU與GPU區(qū)別
特性 |
NPU |
GPU |
設(shè)計(jì)初衷 |
專用于神經(jīng)網(wǎng)絡(luò)計(jì)算 |
最初用于圖形渲染,現(xiàn)廣泛用于通用計(jì)算 |
計(jì)算能力 |
高效的神經(jīng)網(wǎng)絡(luò)推理 |
強(qiáng)大的并行計(jì)算能力,主要用于云端 |
靈活性 |
專用硬件,較低的靈活性 |
通用性高,可以編程實(shí)現(xiàn)各種計(jì)算任務(wù) |
能效比 |
高 |
相對較低 |
典型應(yīng)用 |
深度學(xué)習(xí)推理,邊緣計(jì)算,實(shí)時處理 |
圖形渲染,深度學(xué)習(xí)訓(xùn)練和推理,科學(xué)計(jì)算 |
資料來源:觀研天下整理
2、AI算力提升帶來NPU行業(yè)需求端爆發(fā)
NPU專用于AI運(yùn)算,核心是矩陣乘法運(yùn)算,CNN是主要算法之一,本質(zhì)上由大量的乘法累加計(jì)算組成。隨新AI應(yīng)用、模型與需求的發(fā)展,NPU有望快速上量。根據(jù)數(shù)據(jù),2020-2024年我國AI算力規(guī)模由134.2 EFLOPS增長至725.3 EFLOPS,CAGR為52.5%。
數(shù)據(jù)來源:觀研天下整理
同時,在智能手機(jī)上運(yùn)行端側(cè)生成式AI的AI算力門檻約為30TOPS,旗艦智能機(jī)在2021-2022年逐步達(dá)到這一標(biāo)準(zhǔn)、且仍在進(jìn)步,預(yù)計(jì)2025年將達(dá)到60TOPS以上。而生成式AI應(yīng)用的繁榮,將驅(qū)動所需算力的實(shí)質(zhì)性增長。根據(jù)相關(guān)資料,每天基于生成式AI的搜索查詢超過100億次,其中移動端占比超過60%;智能手機(jī)基于精準(zhǔn)的端側(cè)用戶畫像,與大模型結(jié)合,伴隨對話功能的不斷改進(jìn),將逐步成為真正的個人助手。
手機(jī)廠商內(nèi)嵌AI大模型概況
手機(jī)廠商 |
大模型研發(fā) |
應(yīng)用進(jìn)展 |
|
蘋果 |
與中國多廠商測試大模型 |
iOS18發(fā)布Apple Intelligence大模型(端側(cè)30億),并積極與OPENAI和谷歌接觸 |
宣布年內(nèi)國行機(jī)引入通義大模型 |
華為 |
HarmonyOS4接入盤古大模型 |
HarmonyOSNEXT搭載盤古大模型5.0(端側(cè)15-70億) |
小藝接入DeepSeek |
三星 |
自研大模型Gauss |
GalaxyZ系列首次引入谷歌GeminiNano大模型(端側(cè)約30億) |
推出自有生成式多模態(tài)AI模型Gauss2;Bixby接入智譜智能AI |
OPPO |
ColorOS14搭載AndesGPT大模型 |
大模型升級為AndesGPT-2.0(端側(cè)70億) |
宣布折疊旗艦OPPO Find N5接入DeepSeek-R1 |
vivo |
OriginOS4搭載藍(lán)心大模型 |
OriginOS5搭載全新藍(lán)心大模型矩陣(最高端側(cè)跑通130億參數(shù)) |
OriginOS官宣將深度融合滿血版DeepSeek |
榮耀 |
逐步開始引入 |
MagicOS9.0支持30億參數(shù)的端側(cè)大語言模型 |
YOYO智能體商店上線DeepSeek-R1嘗鮮版 |
資料來源:觀研天下整理
3、智駕滲透率提升,驅(qū)動更高算力需求,我國NPU行業(yè)需求將持續(xù)釋放
而在智能駕駛方面,以高通智駕系統(tǒng)為例,其感知軟件棧和駕駛策略軟件棧需始終于本地運(yùn)行,所以智駕對時延的要求極其嚴(yán)苛,云端無法針對此類工作負(fù)載發(fā)揮任何作用。高通在2024年末發(fā)布的座艙與智駕芯片,應(yīng)用增強(qiáng)的Hexagon NPU,較此前一代AI算力有大幅提升,且后期可繼續(xù)通過外掛NPU的方式繼續(xù)擴(kuò)展算力。
高通車載NPU芯片參數(shù)
類別 |
型號 |
發(fā)布年份 |
制程 |
核心數(shù) |
場景 |
座艙 |
驍龍Cockpit Elite(8397) |
2024 |
4nm |
- |
配對Ride Elite |
驍龍SA8295 |
2023 |
5nm |
8 |
/ |
|
驍龍SA8155 |
2021 |
7nm |
8 |
/ |
|
智駕 |
驍龍RideElite(8797)(艙駕一體) |
2024 |
4nm |
- |
針對L2+L3 |
驍龍8650 |
2023 |
4nm |
8 |
已應(yīng)用于零跑、大疆車載“成行平臺”,本田、通用、大眾、寶馬等預(yù)計(jì)25-26年逐步搭載。 |
|
驍龍8540 |
2023 |
5nm |
16 |
未量產(chǎn) |
資料來源:觀研天下整理
由此可見,隨著智駕解決方案支持GenAI模型,汽車對端側(cè)算力的要求將進(jìn)一步提升,并且伴隨越來越多車企布局智能駕駛市場,我國NPU行業(yè)在該領(lǐng)域的需求將持續(xù)釋放。
各車企智能駕駛布局情況一覽
車企 |
產(chǎn)品 |
是否依賴高精地圖 |
感知算法/大模型 |
端到端規(guī)劃 |
城市NOA開城進(jìn)展(需陸續(xù)OTA) |
特斯拉 |
FSD12 |
無需高精地圖 |
首個端到端自動駕駛系統(tǒng) |
(已推送北美所有內(nèi)部員工)FSDV12可用于北美全地區(qū)道路 |
/ |
蔚來 |
NAD |
不依賴高精地圖 |
BEV Transformer大模型:0ccupany占用網(wǎng)絡(luò) |
實(shí)現(xiàn)數(shù)據(jù)驅(qū)動(端到端前置能力)的規(guī)劃網(wǎng)絡(luò) |
覆蓋726城 |
理想 |
ADMax3.0 |
不依賴高精地圖 |
BEV大模型:0ccupancy占用網(wǎng)絡(luò) |
規(guī)劃算法逐步切換為時空聯(lián)合規(guī)劃算法;模塊化架構(gòu)提升為大模型為主的端到端架構(gòu) |
覆蓋全國 |
小鵬 |
XNGP |
不依賴高精地圖 |
基于BEV Transformer的Xnet(24年Xnet2.0具備0ccupancy) |
2024年XNGP+有望實(shí)現(xiàn)端到端 |
覆蓋全國 |
華為 |
ADS2.0 |
不依賴高精地圖 |
Bev Transformer大模型:基于0ccupancy的GOD2.0 |
- |
覆蓋全國 |
資料來源:觀研天下整理
4、機(jī)器人產(chǎn)業(yè)進(jìn)入快速發(fā)展期,市場需求驅(qū)動NPU行業(yè)爆發(fā)
NPU在機(jī)器人使用廣泛,有加速計(jì)算、降低系統(tǒng)功耗、實(shí)現(xiàn)實(shí)時交互和決策等優(yōu)勢。在機(jī)器人進(jìn)行深度學(xué)習(xí)任務(wù),如語音識別、圖像分類、目標(biāo)跟蹤時,NPU能顯著加快計(jì)算速度,比傳統(tǒng)CPU和GPU更高效地處理大量數(shù)據(jù)。進(jìn)入2025年,國內(nèi)多家人形機(jī)器人企業(yè)相繼宣布各自的量產(chǎn)消息,市場需求驅(qū)動NPU行業(yè)爆發(fā)。2025年1月17日,樂聚(深圳)機(jī)器人技術(shù)有限公司在北汽越野車公司舉行了樂聚第100臺全尺寸人形機(jī)器人交付儀式。該公司表示,樂聚人形機(jī)器人已邁入批量交付新階段。未來如果技術(shù)加速突破、成本快速下降,我國人形機(jī)器人規(guī)模展望千億元甚至萬億元市場,預(yù)計(jì)2030年有望達(dá)約8700億元。
數(shù)據(jù)來源:觀研天下整理(WYD)

【版權(quán)提示】觀研報告網(wǎng)倡導(dǎo)尊重與保護(hù)知識產(chǎn)權(quán)。未經(jīng)許可,任何人不得復(fù)制、轉(zhuǎn)載、或以其他方式使用本網(wǎng)站的內(nèi)容。如發(fā)現(xiàn)本站文章存在版權(quán)問題,煩請?zhí)峁┌鏅?quán)疑問、身份證明、版權(quán)證明、聯(lián)系方式等發(fā)郵件至kf@chinabaogao.com,我們將及時溝通與處理。