最新动态
AI工具测评 - AniPortrait:让照片唱歌说话
2024-12-31 21:22
给大家介绍一款由腾讯游戏智迹团队开发的创新技术——AniPortrait。
这款技术能够通过音频和参考肖像图片生成高质量的肖像动画。无论是静态图片还是视频,AniPortrait都能实现逼真的面部再现,使动画效果更加生动。山楂在使用中,尤其对面部再现功能印象深刻,这个功能能够精准捕捉参考视频的表情变化,并将其迁移到新的肖像上,非常适合虚拟主持人或数字人物的创作。
话不多说,我们直接来看效果:

rame class="video_iframe rich_pages" data-w="1032" data-ratio="2" data-cover="http%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_jpg%2FKmXPKA19gW8icOo4rXRvs9CJCqw9t80Y2AicZQDru6Usiam2prNUBTfNtavR2iaRaOLXPVMWI3ibaHUFCvuQ84JvZhg%2F0%3Fwx_fmt%3Djpeg" data-mpvid="wxv_3396568434757369861" data-vidtype="2" allowfullscreen="" frameborder="0" style="border-radius: 4px;" data-src="https://mp.weixin.qq.com/mp/readtemplate?t=pages/video_player_tmpl&action=mpvideo&auto=0&vid=wxv_3396568434757369861">rame>

rame class="video_iframe rich_pages" data-w="1030" data-ratio="1.996124031007752" data-cover="http%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_jpg%2FKmXPKA19gW8icOo4rXRvs9CJCqw9t80Y2OdlpYHrg5fFHSZ5WyIBe275LhoPaHy3jzIRHhdnHegicKQzfoNXyc9Q%2F0%3Fwx_fmt%3Djpeg" data-mpvid="wxv_3396568922840137728" data-vidtype="2" allowfullscreen="" frameborder="0" style="border-radius: 4px;" data-src="https://mp.weixin.qq.com/mp/readtemplate?t=pages/video_player_tmpl&action=mpvideo&auto=0&vid=wxv_3396568922840137728">rame>

要使用 AniPortrait,首先需要配置一个符合要求的计算环境。推荐使用 Python 3.10 版本及 CUDA 11.7。具体操作步骤如下:

运行以下命令来安装必要的 Python 库:

pip install -r requirements.txt
需要下载预训练权重文件,并将它们放置在 https://mp.weixin.qq.com/pretrained_weights 目录下。这些权重包括去噪网络、参考图像网络、姿态引导器、动作模块、音频转网格模型、音频到姿态模型和 FILM 网络等多个组件。具体权重文件和下载路径如下:
  • StableDiffusion V1.5

  • sd-vae-ft-mse

  • image_encoder

  • wav2vec2-base-960h
下载并整理好权重文件后,可以在配置文件(如 https://mp.weixin.qq.com/config/prompts/animation.yaml)中指定权重文件的路径。
AniPortrait 提供了多种命令行工具,支持不同的动画生成需求。

通过指定动画配置文件,并使用 -acc 参数来加速视频生成。命令如下:

python -m scripts.pose2vid --config https://mp.weixin.qq.com/configs/prompts/animation.yaml -W 512 -H 512 -acc

添加源面部视频和参考图像,通过以下命令生成面部动画:

python -m scripts.vid2vid --config https://mp.weixin.qq.com/configs/prompts/animation_facereenac.yaml -W 512 -H 512 -acc

在配置文件中添加音频和参考图像后,运行以下命令生成音频驱动的视频动画:

python -m scripts.audio2vid --config https://mp.weixin.qq.com/configs/prompts/animation_audio.yaml -W 512 -H 512 -acc

用户还可以通过 HuggingFace Spaces 上的 Gradio 界面体验 AniPortrait 的 Web 演示。运行以下命令即可启动本地演示:

python -m scripts.app
热门推荐
  • AI工具测评 - BrushNet:局部重绘神器

  • 姓氏头像:张、王、陈、赵、黄、杨、彭、朱、程、郑、贺、肖、潘、唐、杜、吴、钱、秦、林、魏、常、岳、金、姜、佟、雷、贾、……

  • AI工具测评 - so-vits-svc:实现AI歌曲翻唱自由

点分享

点收藏

点点赞

点在看

    以上就是本篇文章【AI工具测评 - AniPortrait:让照片唱歌说话】的全部内容了,欢迎阅览 ! 文章地址:https://sicmodule.kub2b.com/quote/17278.html 
     栏目首页      相关文章      动态      同类文章      热门文章      网站地图      返回首页 企库往资讯移动站https://sicmodule.kub2b.com/mobile/,查看更多   
发表评论
0评