据悉,快手“AI玩评”依托于快手自研文生图大模型“可图”(Kolors)强大的图像生成能力实现。可图大模型具备文本理解、丰富的细节刻画、多样的风格转换三大特点。
据了解,快手AI构建了数十亿的图文训练,这些数据覆盖了常见的三千万中文实体概念,兼具世界知识。快手AI利用自研的中文LLM,融合CLIP的图文特征作为文生图的文本理解模块,不但实现了中文特色概念的理解,更解决了复杂概念、属性混淆等文生图领域常见问题。同时,快手AI更改了去噪算法的底层公式和加噪公式,实现了单一基座模型在主体完整的前提下,可生成具有丰富细节和纹理的图片。