标签:音频驱动

阿里云自研EMO模型今天正式上线通义千问App!免费生成高逼真数字人!

阿里云宣布推出通义实验室研发的AI模型EMO,通过上传肖像照片合成演戏唱歌视频。该模型是音频驱动的AI肖像视频生成系统,展示了AI技术在视觉和音频处理方面的...

EMO: 激活表情肖像视频的生成 – 在弱条件下利用Audio2Video扩散模型

作者:Linrui Tian, Qi Wang, Bang Zhang, Liefeng Bo 机构:阿里巴巴集团智能计算研究院 概述 我们提出了EMO,一个表情丰富的音频驱动的肖像视频生成框...