圖:Meta創(chuàng)辦人朱克伯格(左)和妻子普莉希拉.陳。無效更新\路透社
當?shù)貢r間8月5日,推開OpenAI宣布推出兩款全新開源模型。源模這是型被自2019年發(fā)布GPT-2以來,OpenAI再次釋出開源模型。無效更新外界認為,推開近年來中國AI公司如DeepSeek、源模阿里巴巴等在開放AI領域發(fā)展迅猛,型被Meta近期又以重金挖走多位OpenAI研究人員,無效更新再加上新一代模型GPT-5遲遲未能面世,推開面對各方種種壓力,源模OpenAI不得不被迫轉(zhuǎn)型。型被公司CEO阿爾特曼早前坦言,無效更新在是推開否開源的問題上,OpenAI站在了“歷史錯誤的源模一邊”。
【大公報訊】OpenAI于8月5日推出兩款開源模型,GPT-oss-120b和GPT-oss-20b,可在開源技術(shù)平臺Hugging Face上免費下載。這也是OpenAI自2019年發(fā)布GPT-2以來,時隔6年再次釋出開源模型。
不過,由于新模型在性能上未有質(zhì)的飛躍,此次釋出的兩個開源模型也被網(wǎng)友戲稱是“擠牙膏式無效更新”。
“AI幻覺”多 未公開訓練數(shù)據(jù)
根據(jù)科技媒體TechCrunch披露的技術(shù)數(shù)據(jù),在多項測試中,GPT-oss-120b和GPT-oss-20b的表現(xiàn)均遜于OpenAI的o3和o4-mini模型。
此外,這兩款新模型回答問題時出現(xiàn)“AI幻覺”的比例分別高達49%和53%,是o1模型(16%)的三倍多,也高于o4-mini模型(36%)。
雖然OpenAI并未透露用于訓練新模型的數(shù)據(jù),因此還未能達到完全“開源”的標準,但其自2022年發(fā)布聊天機器人ChatGPT并引發(fā)AI熱潮以來,便對自家技術(shù)嚴格保密,此次發(fā)布開源模型可以說是一次巨大轉(zhuǎn)變。
當被問及“為什么突然又開源”時,OpenAI稱是為了“加速前沿研究,促進創(chuàng)新,并推動在廣泛應用場景下實現(xiàn)更安全、更透明的AI開發(fā)”。
但外界認為,種種壓力之下,OpenAI不得不作出改變。
中國開源模型的爆發(fā)式發(fā)展很難不觸動OpenAI以及硅谷的神經(jīng)。今年年初,中國AI初創(chuàng)公司深度求索(DeepSeek)釋出震撼硅谷的開源模型R1,此后大批中國模型走上開源之路。
以阿里巴巴集團開發(fā)的AI模型Qwen為例,Qwen2.5去年在Hugging Face上的下載量甚至超過美科企巨頭Meta旗下的Llama系列,成為全球下載量最多的開源模型。
在美國國內(nèi),自6月以來,Meta創(chuàng)辦人朱克伯格對OpenAI展開大規(guī)模挖角,迄今已聘用其中至少10人,加入自家AI研發(fā)團隊“超級智能實驗室”。
中國開源AI領跑 美業(yè)界難追
除外部壓力,OpenAI自身也面臨困境,其最新模型GPT-5已“難產(chǎn)”數(shù)月。為緩解外界焦慮,OpenAI只得一次次釋出新產(chǎn)品。
分析指出,全球科企在AI方面的競爭已趨白熱化,美國公司在開源模型方面已落后于中國同業(yè)。
全球知名AI基準測試機構(gòu)Artificial Analysis發(fā)現(xiàn),在排名前15的AI模型中,僅有5個為開源,且全部來自中國的AI公司。
隨著開源AI浪潮席卷全球,業(yè)界預估,到2030年,先進AI模型的平均開發(fā)成本預計下降40%,令更多小企業(yè)能夠負擔得起。
8月4日,美國業(yè)界正式啟動了一項名為“美國真正開源模型”(ATOM)的新計劃,擬集中資源開發(fā)強大的AI開源模型。但有評論指出,這項計劃雖然雄心勃勃,但仍存在人才缺失、協(xié)調(diào)不足和成本高昂等問題。
?。ňC合報道)
