AIGC算力更行业内的动向,现在曝光了。
新款服务器还没发布便已爆单;
云计算厂商不单求N卡,同样关注国产厂商;
相比预训练而言,推理需求如今更加被关注、热议。
在量子位智库最新举办的AIGC算力沙龙上,算力领域数月来备受关注的趋势发展、行业挑战及最新动向,都有了更加明确的解读。
来自国产芯片厂商、服务器厂商、云厂商以及加速方案明星玩家,分别从各自角度出发带来分享,由此构成对AIGC算力产业更加全面的认知。
他们分别是昆仑芯、天数智芯、联想集团、首都在线和潞晨科技。
作为算力领域不同层玩家,在最新趋势下他们有哪些切身感受?对未来进程又有哪些思考和看法?
量子位在不改变嘉宾原意的基础上,对分享内容及圆桌对话进行了编辑整理。希望能够给你带来更多的启发与思考。
本次沙龙邀请的嘉宾分别是:
王志鹏,昆仑芯互联网行业总经理
郭为,天数智芯副总裁
黄山,联想集团ISG服务器产品总监
朱湛峰,首都在线产品中心总经理
李永彬,潞晨科技生态负责人
01 ChatGPT之前算力需求趋势已有显现
单卡推理成本面临挑战
国产芯片厂商昆仑芯最新分享了对大模型推理方面的关注。
目前行业内已经达成了一种共识,市场对于推理的需求正在快速增长。随着大模型生态的持续发展,大模型的效果不断提升,同时推理成本也在逐步下降,这些因素都将加速大模型的商业化应用。随之而来的便是对模型推理的海量需求。
昆仑芯互联网行业总经理王志鹏表示:
当百亿、千亿规模参数的模型需要部署推理时,推理技术面临分布式化的挑战。具体来说,需要把一个大模型拆分到单台机器多张加速卡上并行存放、并行计算。