說起半導體行業面臨的難題,人們第一時間想到的是什么?是光刻機?是5nm?是一塊方方正正的芯片,我們造不出來?
是,但也不完全是。
人們往往將芯片半導體劃分為硬件產業,但事實上,這是一個高度軟硬件集成的產業——軟件甚至更多時候占了大頭。
所以,即便我們在20年前就研發出了CPU,現在仍會面對如此局面。同樣,如今更受人關注的GPU產業也遇到了同樣困局,因為我們面臨的真正難題,不是硬件,而是軟件。
01. 當我們說芯片困局時,我們在說什么?
芯片的硬件指的是運行指令的物理平臺,包括處理器、內存、存儲設備等等。芯片數據中常出現的“晶體管數量”、“7nm制程”、“存儲”等,往往指的就是硬件參數。
軟件則包括固件、驅動程序、操作系統、應用程序、算子、編譯器和開發工具、模型優化和部署工具、應用生態等等。這些軟件指導硬件如何響應用戶指令、處理數據和任務,同時通過特定的算法和策略優化硬件資源的使用。芯片數據中常出現的“x86指令集”、“深度學習算子”、“CUDA平臺”等,往往指的就是芯片軟件。
沒有硬件,軟件就無法執行;可沒有軟件,硬件就只是一堆毫無意義的硅片。
以英偉達的CUDA平臺為例。
2012年,隨著深度學習+GPU的組合在ImageNet大賽上一炮打響,人工智能一夜之間火遍全球,全球科技界都將目光轉向了這一領域。多年深耕CUDA人工智能計算平臺的英偉達股價自然是一路走紅,成為了新時代的霸主。
軟件,成為了人工智能時代的核心技術壁壘。
為了打破英偉達一家獨大的局面,前任全球芯片老大英特爾和多年老對手AMD對標CUDA都分別推出了OneAPI和ROCm,Linux基金會更是聯合英特爾、谷歌、高通、ARM、三星等公司聯合成立了民間號稱“反CUDA聯盟”的UXL基金會,以開發全新的開源軟件套件,讓AI開發者能夠在基金會成員的任何芯片上進行編程,試圖讓其取代CUDA,成為AI開發者的首選開發平臺。
反過來,英偉達也在不斷深挖CUDA的護城河。
早在2021年,英偉達就曾公開表示過“禁止使用轉換層在其他硬件平臺上運行基于CUDA的軟件”,2024年3月,英偉達更是將其升級為“CUDA禁令”,直接添加在了CUDA的最終用戶許可協議中,已禁止用轉譯層在其他GPU上運行CUDA軟件
對于中國用戶而言,這一禁令的打擊面要更大。
早在2022年,英偉達就已被要求對中國市場斷供高端GPU芯片,死死地卡住中國GPU芯片購買渠道。
如今連在其他芯片上運行CUDA軟件都被英偉達禁止了,中國人工智能公司們,怎么辦?
02. 國內AI芯片全面崛起
其實,在這條禁令下發之前很久,中國芯片公司們就已經有所準備了。
2015年,國內人工智能產業如火如荼,“AI四小龍”崛起,連帶著整個產業步入發展快車道。
在這波由CNN(卷積神經網絡)技術引領的人工智能行業熱潮之中,就有大量中國企業看到了打造國內AI芯片的重要性。
在此期間,國內陸續涌現出了近百家國內AI芯片公司,其中既有如寒武紀、地平線、壁仞科技、后摩智能等的明星創業公司,也有如華為、阿里、百度等的科技巨頭,還有傳統芯片廠商與礦機廠商。
各家紛紛入局,產業如烈火烹油、鮮花著錦,大家的共同目標只有一個,打造自主可控的國內AI芯片生態。
國內AI芯片玩家們早早就意識到了軟件、工具、生態對于芯片的重要性,因此在不斷升級迭代硬件產品之余,也投入了大量的時間、精力,試圖解決軟件生態建設中存在的問題。
CUDA是一個封閉的軟件平臺,因此,從底層開始打造原創的軟件棧是打破CUDA生態壁壘的關鍵路線。