
CogAgent
介绍 介绍 CogAgent...
混元-DiT文生图大模型是腾讯公司开发的一种先进的文生图(Text-to-Image)模型,它能够根据用户输入的文字描述生成相应的图像。该模型采用了与Sora一致的DiT(Diffusion with Transformer)架构,支持中英文双语输入及理解,参数量达到15亿。
腾讯开源混元文生图大模型的目的是为了与行业共享腾讯在文生图领域的实践经验和研究成果,丰富中文文生图开源生态,推动大模型行业加速发展。通过开源,开发者及企业可以直接使用模型进行推理,无需重头训练,节约大量人力及算力。同时,开源也有助于在中文为主的文生图开源生态中形成更多样的原生插件,推动中文文生图技术研发和应用。
腾讯混元文生图能力已被广泛应用于素材创作、商品合成、游戏出图等多项业务及场景中。例如,腾讯广告基于混元大模型发布了一站式AI广告创意平台腾讯广告妙思,为广告主提供文生图、图生图、商品背景合成等多场景创意工具。此外,多家媒体如《央视新闻》、《新华日报》等也将腾讯混元文生图用于新闻内容生产。
腾讯一直持开放态度,已开源了超过170个优质项目,这些项目来源于腾讯真实业务场景,覆盖微信、腾讯云、腾讯游戏、腾讯AI、腾讯安全等核心业务板块。在Github上,腾讯的开源项目已累计获得超过47万开发者的关注及点赞。





