Stable Diffusion 3来啦!文本理解更好,图像质量更强,AI算力消耗更低,推理速度更快! 简介 Stable Diffusion 3是由stability.ai开放社区在2022年2月23日推出的新版本。这个版本相比于Stable Diffusion 2在文本语义理解、色彩饱和度、图像构图... AI前沿# AI# AI模型# FlowMatching 1年前30,3070
cogvideoX-fun 5B版本:突破性Transformer架构引领视频生成新纪元 什么是模型? cogvideoX-fun模型是一个先进的视频生成模型。最初,这款模型逐渐发展,从2B版本升级到了最新的5B版本。它的进步主要体现在性能和效果的飞跃上。 为什么5B版本表现更加出色? ... AI前沿# 5B版本# PokeVideoX# Transformer 1年前22,5900
AI语音模型:从文本到逼真人声的技术革命 什么是AI语音模型?#AI语音模型 #TTS #语音合成 大家好,欢迎来到硅谷幺零幺!今天,我们将一起探索令人惊叹的AI语音模型,揭秘这项技术如何从输入文字到输出逼真的人声。这项技术也被称为 文本转语... AI前沿# AI伦理# AI语音模型# FastSpeech 6个月前11,8270
LLM反思力觉醒:预训练是基石,指令Wait是密钥,推理能力跃迁! LLM 的自我反思能力研究:预训练是关键? 研究背景:LLM 如何涌现自我反思能力? 最近的研究表明,强化学习可以有效激发大语言模型的反思能力,但是一个更基本的问题是,这种能力是否在预训练阶段就已经显... AI前言# keywords# LLM# Transformer 7个月前11,7830