天气转凉,夏天即将过去。如果有人问,云计算厂商在这个火热的夏天做了什么。答案是,他们做了三件事:大模型、大模型,以及大模型。
7月,在华为开发者大会2023(Cloud)期间,华为云公布了盘古大模型3.0,随后进行了生态等方面的升级。而在此前更早时候,阿里云公布了通义千问大模型,并在8月3日宣布其正式开源。
来到9月,云计算厂商的大模型发布更加密集。9月5日,百度智能云在2023百度云智大会发布了千帆大模型平台2.0,进一步集成百度的文心系列大模型,只隔两天,腾讯就在2023腾讯全球数字生态大会发布了混元大模型,其主要出口则是腾讯云。
至此,中国几大云计算厂商可以说是在大模型领域重兵集结。相较于AI算法公司与研究机构,云计算厂商做的大模型更贴近产业与应用的一线,而且大模型与云厂商原本的业务体系、营收模块有着相对复杂的关系。因此,云厂商的大模型之争,绝不是简单的模型之间技术对比。
那么,云计算大厂做大模型究竟是为什么?云+大模型之战的决胜点在哪?
本文中,我们希望通过多个层次的对比与梳理,和大家一起解答这个问题。
首先要明确两个前提:一是伴随着各行业IT投入的降低,云计算厂商普遍面临着增速放缓,营收不利的情况。根据IDC报告预测,未来五年中国云计算行业的平均增长速度将下调10%左右,云计算厂商的正在普遍降低业务预期。因此,大模型突然爆火,对于云计算行业来说是难得的窗口,这个机会或许利益没有想象中大,但目前也不得不做。
另一个情况是,从用户界面来看云+大模型的需求是十分复杂的。有的用户需要直接调取模型,有的用户需要AI算力来自己训练模型,还有用户需要大量的模型定制化与解决方案集成。因此云厂商做大模型并不是很多人想象的短兵相接白刃战。大模型相关业务,需要面向多个市场,多种商业模式。这场赛事更像是一场阵地战,各个战略节点都不能出现缺口。
在这场大模型鏖战的各个层面,都有一条明线和一条暗线在牵引着局势的发展。
IaaS层:明线堆卡,暗线启动国产AI算力
大模型带给云计算厂商最直接的变化,其实并不来自于模型本身,而是大模型火了之后,涌现出来的大模型热潮需要庞大的AI算力。大模型数据规模巨大,且训练模型需要专属的AI算力,这就给云计算服务商短期带来了用云量的升级。在云计算IaaS层市场整体相对低迷的情况下,大模型的出现也算是注入了一针强心剂。
这个层面上云计算厂商的竞争节点,用一个词概括就是“堆卡”。谁能提供充沛少排队,且尽量价格低廉的AI算力,谁就算赢了。而AI算力的来源主要是英伟达的GPU,于是就出现了云计算厂商买空市面上GPU的现象,以及“云厂商都是给英伟达打工”的说法。
但不管怎么说,云计算厂商在IaaS层的堆卡竞赛都不会结束,大量用户依旧会以计算成本和计算效率来作为选择公有云AI算力的考量依据。这个层面上,云计算厂商就需要提升在计算集群性、计算兼容性方面的能力,尽量发挥出每一张GPU的价值。