科技日報記者 劉霞
美國斯坦福大學日前發布研究報告指出,在能力與采用率方面,中國的人工智能(AI)模型——尤其是開放權重的大語言模型,已接近甚至部分領先于國際先進水平。
報告彰顯了這樣一個事實:當今年1月DeepSeek公司推出的推理模型DeepSeek-R1震動全球投資界、令英偉達單日市值蒸發近千億美元時,這家杭州初創企業并非中國AI領域的“孤勇者”,而是一個更龐大而多元生態體系的縮影。中國開放權重AI模型在全球范圍內的廣泛采用,正悄然重塑全球AI技術領域的競爭格局。

中國開放權重模型表現優異
開放權重指AI模型的參數權重可被公開下載、使用與修改,開發者能在官方應用或接口之外獨立運行并調整模型,以適應自身需求。美國OpenAI公司的ChatGPT、谷歌公司的“雙子座”(Gemini)等閉源模型的內部機制受到嚴密保護,相比之下,阿里巴巴、DeepSeek等公司提供的開源模型,則允許開發者按需定制軟件內容。
斯坦福報告重點分析了4個具有代表性的中國大語言模型系列:阿里巴巴的通義千問、DeepSeek-R1、月之暗面的Kimi K2,以及智譜AI(現已更名為Z.ai)的GLM-4.5。
報告顯示,在涵蓋通用推理、代碼生成與工具使用等多項基準測試中,這些中國AI模型已接近全球頂尖水平。所有進入前22名的中國開放權重模型,均超越了OpenAI的開源模型GPT-oss。
多項數據指向同一結論:在開源大模型領域,中國已從追趕者轉變為領跑者。例如,通義千問的能力可媲美Anthropic的Claude,并接近OpenAI與谷歌公司的最佳模型,同時還具備顯著的成本優勢。
中國AI模型獲海外青睞
憑借開源、低成本等優勢,中國AI模型的成本效益正在重塑全球商業決策。
開發平臺OpenRouter與美國硅谷著名風投機構“安德里森·霍羅威茨”12月發布的報告顯示,中國開放權重模型在全球的使用率從2024年底的1.2%大幅攀升至今年8月的近30%。
中國人民大學重陽金融研究院院長王文指出,中國的開源模型“價格實惠,部分甚至免費,且性能良好”。一位匿名美國企業家表示,其公司通過采用通義千問而非ChatGPT等專有模型,每年節省約40萬美元。“如果追求頂尖功能,或許會選擇OpenAI、Anthropic或谷歌的模型,但大多數應用場景其實并不需要。”
英偉達、人工智能公司Perplexity以及斯坦福大學員工均在工作中使用通義千問。Airbnb首席執行官布萊恩·切斯基今年11月透露,公司客服聊天機器人選用通義千問而非ChatGPT,原因很簡單:“(通義千問)又快又便宜”。
據美國前哨網站報道,2025年9月,通義千問正式超越Meta的Llama,成為“抱抱臉”(Hugging Face)平臺下載量最高的大語言模型。截至12月中旬,其累計下載量已達約3.85億次,高于Llama的3.46億次。MiniMax與Z.ai的模型在海外同樣廣受歡迎。
中國AI模型開發持續快速迭代。不少企業已投身于AI代理的研發競賽——這類具備推理能力的程序能通過聊天機器人完成在線任務,如訂票、管理日程等。友好且開源的設計,如月之暗面去年11月發布的Kimi K2,已被廣泛視為生成式AI發展的下一個前沿。
引領全球AI生態與治理
斯坦福報告指出,中國AI模型的快速崛起助推了全球AI技術的廣泛采用。前哨網站的報道也指出,今年1月以來,基于通義千問與DeepSeek衍生的模型數量持續增長。截至今年9月,中國模型的衍生版本已占“抱抱臉”當月新增衍生模型的63%。這意味著全球開發者社區正以前所未有的速度,圍繞中國模型構建應用生態。
該報告同樣認為,中國開放權重模型在全球的廣泛采用可能重塑全球技術獲取和依賴模式,影響全球AI治理、安全以及競爭格局。
報告主要作者、斯坦福大學以人為本AI研究所政策研究負責人卡羅琳·邁因哈特認為,開放模型的本質有利于技術接受更廣泛的審視。中國AI健康平臺BOK Health首席技術官高飛對此表示認同,他強調,開源的透明度與共享特質,本身就是建立信任的最佳途徑。
DeepSeek-R1的發布甚至影響了美國對開放權重模型的政策態度。2025年7月,白宮發布《美國AI行動計劃》,將開放權重模型提升為戰略資產。一個月后,OpenAI時隔近6年首次發布采用Apache 2.0許可證的開放權重模型。其首席執行官薩姆·奧爾特曼在與記者交流時坦言,中國開源模型的競爭是促成該決定的關鍵因素。
邁因哈特強調,AI領域的全球領導地位,不僅取決于專有系統的先進程度,也依賴于開放權重模型在全球的覆蓋、采納與規范影響力。