揭开大模型“混元”的面纱两个月后,10月26日,腾讯混元迎来第一次“批量上新”,并且对外开放。
首先,通过测试申请的用户,都能够在“混元”上画画了——从生成图像的准确度、美观度而言,如今混元搭载的“灵感”模块,已经能生成相当合理、逼真的图像。
文生图是AIGC领域的核心技术之一,也是体现通用大模型能力的试金石,对模型算法、训练平台、算力设施都有较高的要求。在用户侧,这又是一个和广大用户联系紧密的应用入口。
智能涌现尝试用简单的指令让混元画图,生成速度基本在10秒左右,效果可以说风格各异,细节比此前更为丰富。
如果指令更复杂一点呢?
手部细节是可以说是文生图的一个难点。但在输入弹奏古筝的指令后,如图所见,手部细节可以说比较逼真,没有出现多指、扭曲等问题。
文生图能力升级:不仅要美,更重要的是“对”
这两个月,混元在文生图领域的技术研发目标,用一句话可以总结:“AI图像不仅要美,更重要是的是‘对’。”腾讯混元大模型文生图技术负责人芦清林表示。