">
自ChatGPT引發新一波人工智能熱潮以來,全球人工智能產業一度形成了“堆算力”的路徑依賴。然而,隨著中國人工智能企業DeepSeek發布開源模型,通過優化算法降低算力需求,達到與ChatGPT比肩的性能。這也提出了新問題:推動人工智能產業發展,是否依舊有必要大規模投資算力?
市政協委員、華東師范大學計算機科學與技術學院副院長賀樑認為,這次DeepSeek開源模型的問世對于我國在人工智能領域突破西方的科技封鎖意義重大,但這并不代表算力不再重要。訓練新的進階模型和將模型用于全行業,擁有更強的算力基礎設施依舊是成功的關鍵要素之一。算力依舊是重要戰略資源,在很長一段時間里需求仍將持續增長,而美國將用各種手段“卡算力”,以影響我們的人工智能科研進度。
“DeepSeek開源模型的出現,標志著通過算力來限制中國人工智能發展的策略并不成功。在有限算力的‘非公平競爭’下,中國不再抄作業,中國的年輕人提出了我們自己的原創技術,成果震動全球并向全球開源。”賀樑說,“但算力還是非常重要的戰略資源,我們需更堅定地加以儲備,支撐優秀的團隊開展研究,更優的算力儲備意味著研發下一代模型的時間成本優勢,為此國產算力芯片自主制造和生態能力必須爭分奪秒地迎頭趕上。”
相關論文表明,DeepSeek-V3的訓練總成本約為557.6萬美元。其訓練成本雖較同類產品大幅降低,但母公司為了這次訓練所付出的前期試錯成本,外界則不得而知。有報道稱,DeepSeek母公司幻方量化曾囤積上萬張GPU芯片。沒有這些算力的儲備,DeepSeek的這次突破是不太可能的。
同時,訓練大模型所需算力下降,不意味著社會總的算力需求下降。一個好用的模型帶來的是千行萬業的大規模應用,在不遠的將來,使用大模型將嵌入生活的方方面面,模型后訓練和推理需求會大幅超過預訓練算力需求。
賀樑還認為,算力基礎設施的投入回報要用長遠的、發展的眼光。“政府需要科學評估著眼未來的硬件情況和市場需求,更多考慮如何為有創造力的科研團隊提供算力保障,降低創新成本,提高創新速度,即使不賺錢、折舊快,依然要堅定地加速建設智能算力功能性公共服務設施。”