首页 > IT资讯

阿里云宣布自研EMO模型上线通义App,用照片+音频生成唱歌视频


阿里云今日宣布,通义实验室研发的AI模型——EMO正式上线通义App,并开放给所有用户免费使用。借助这一功能,用户可以在歌曲、热梗、表情包中任选一款模板,然后通过上传一张肖像照片就能让EMO合成演戏唱歌视频。

EMO(EmotePortraitAlive)是一个由阿里巴巴集团智能计算研究院开发的框架,一个音频驱动的AI肖像视频生成系统,能够通过输入单一的参考图像和语音音频,生成具有表现力的面部表情和各种头部姿势的视频。

本文链接:https://www.zhanque.net/note/5022.html