FaceLift是由Adobe Research与加州大学默塞德分校合作开发的一项深度学习技术,其主要功能是将单张普通的人脸照片转换为高质量的三维(3D)头部模型。这项技术不仅能够生成静态的3D模型,还可以为生成的3D头像添加动态效果,例如表情变化等功能。
相关链接
-
主页: https://www.wlyu.me/FaceLift -
GitHub: https://github.com/weijielyu/FaceLift -
论文: https://arxiv.org/pdf/2412.17812
FaceLift功能特点
FaceLift技术采用了一种两阶段方法来实现高质量的3D重建:
- 多视角生成阶段:首先,通过基于扩散模型的方法从单张人脸照片生成侧面和背面视图。这些视图通过多视角一致性的合成数据进行微调,以增强模型的泛化能力和视角一致性。
- 3D重建阶段:接着,利用大规模重建模型GS-LRM(Generative SDF Reconstruction Model),将生成的稀疏多视角图像融合成完整的3D高斯SDF(Signed Distance Field)表示。这种方法确保了生成的3D头部模型在几何结构和纹理上更加接近真实情况。
FaceLift技术在多个方面具有显著优势:
- 高保真度:生成的3D头部模型不仅颜色准确,而且几何结构接近实际情况,新视角图像与真实情况更加温和。
- 动态效果支持:FaceLift可以处理视频输入,并结合2D动画技术实现3D面部动画,从而为生成的3D头像添加动态效果。
- 适应性强:该技术能够适应真实世界中的人脸数据,即使面对未见过的数据也能保持良好的表现。
FaceLift技术在多个公开数据集上表现优异,特别是在DreamSim度量中取得了领先成绩。此外,该技术还展示了其在处理动态视频和生成逼真3D动画方面的潜力。
需要注意的是,尽管FaceLift技术在学术界和工业界都引起了广泛关注,但目前尚未开源