8月7日,国内又一家AI创业公司发布了自己的开源且免费可商用的AI大模型:XVERSE-13B。这家名为元象XVERSE的公司,由前腾讯副总裁、腾讯AI lab创始人姚星创立。
自从Meta在7月发布了开源可免费商用的LLaMA 2系列大模型,AI大模型市场上正在酝酿一波“开源”的新浪潮。
8月2日,百度旗下的AI大模型平台文心千帆,宣布接入LLaMA2全系列开源模型,平台可调用的大模型数量增至33款,除了3款文心模型,其他30款均为开源模型,其中包括ChatGLM2、RWKV、MPT、Dolly、OpenLLaMA、Falcon等。
此后一天,阿里云也宣布加入开源模型行列。开源通义千问70亿参数模型,包括通用模型Qwen-7B和对话模型Qwen-7B-Chat,两款模型已上线魔搭社区,开源、免费、可商用。
有趣的是,这种对开源开放的积极态度,正是始于闭源大模型ChatGPT的大东家——微软。7月18日,微软宣布携手Meta发布开源可商用版本的LLaMA 2模型,为企业提供OpenAI和谷歌模型的平替产品。OpenAI在AI大模型市场的垄断地位,似乎正在遭到全行业的“针对”,甚至是自己最亲密的合作伙伴。
作为全球公认的大语言模型第一名,OpenAI的GPT-4是目前唯一一个有大量用户愿意为其买单的大语言模型。
班里第一名的同学,通常没有参加学习小组的动力。同样,OpenAI也没有什么开源的理由和动力。
然而,随着LLaMA 2的全面开源,越来越多的开发者投入了Meta以及各种开源模型的阵营。就像Android用开源对抗iOS一样,一众开源AI大模型,正在绕过GPT-4的技术壁垒,以开源生态包围OpenAI。
为什么开源?
OpenAI刚刚推出插件功能的时候,就有很多人把AI大模型比做未来的Windows、iOS、Android。如今,随着LLaMA 2的发布,AI大模型不只是功能,连市场格局也正在朝着操作系统的方向发展。
由UC伯克利主导的组织LMSYS Org发起的,一项针对大语言模型(LLMs)的排位赛;截至7月20日的最新版排名共统计了40款AI大模型,前五名仍是闭源模型(Proprietary),分别是GPT-4、GPT-3.5-turbo和Claude的三款模型。不过,后边的34款模型,除了谷歌的PaLM-Chat-Bison-001,均为开源模型,其中15款为不可商用(Non-commercial)。