開 源
開源指的是發(fā)布的模型源碼開源、論文或技術(shù)文章開源、預(yù)訓(xùn)練的參數(shù)開源,可以供研究人員和開發(fā)人員訪問和修改。
DeepSeek(深度求索)
?中國AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布的開源模型,其最新版本R1以低成本實現(xiàn)新效能,引發(fā)全球關(guān)注。
Qwen(阿里巴巴)
?阿里巴巴集團研發(fā),最新版為Qwen2.5。去年,Qwen2.5在全球最大的AI模型社區(qū)Hugging Face上,超越美國Meta旗下的Llama系列,成為全球下載量最多的開源模型。
Llama(Meta)
?Meta于2023年2月發(fā)布,最新版為Llama 3.1。Facebook創(chuàng)辦人朱克伯格稱,開源是AI積極發(fā)展的必要條件。
Gemma(谷歌)
?谷歌于去年2月發(fā)布,據(jù)稱性能超過Meta的Llama 2。此前,谷歌的AI模型(Gemini系列)均為閉源。
閉 源
閉源只提供API接口或網(wǎng)絡(luò)頁面訪問服務(wù),一般由公司運營優(yōu)化,服務(wù)分為免費版和收費版。
ChatGPT系列(OpenAI)
?由美國AI巨頭OpenAI開發(fā),從GPT-1至GPT-4均為閉源,不公開技術(shù)細節(jié),只能通過應(yīng)用程序接口(API)使用。馬斯克曾公開嘲諷OpenAI(開放AI)應(yīng)改名為“CloseAI(閉源AI)”。
Claude(Ahthropic)
?由OpenAI前高管創(chuàng)立的Anthropic研發(fā),最新版本為Claude 3.5 Sonnet,被視為ChatGPT的有力競爭者。Claude系列同樣均為閉源模型,其技術(shù)報告并不提供具體的模型結(jié)構(gòu)、訓(xùn)練方法。
大公報整理