美团开源 LongCat-Video-Avatar 1.5:数字人视频从“彩排”走向“真舞台”,生成 10 秒视频仅需 1 分钟

美团技术团队今日正式开源了其数字人视频生成模型 LongCat-Video-Avatar 1.5。 官方介绍称,该版本在唇形同步、物理合理性、长视频稳定性、多人互动及推理效率方面均实现了升级,旨在推动数字人视频生成从“高拟真”走向“真可用”的商业化场景。该版本在 1.0 版本的基础上完成全面升级,定位从“开源 SOTA”走向“商业级应用”。 据介绍,这一版本在基础体验上进行了强化,能够应对长句、快语速、歌唱等复杂语音输入,使唇部运动更精准平滑,同时面部表情、头部姿态与肢体动作也更为协调。 在场景支持方面,借助高质量数据体系,模型可稳定处理真人、动漫、动物等多种主体,并在多人对话场景中自然区分说...

上一篇:

下一篇:

联系我们

18658854422

微信号:JZL99876

邮件:474804@qq.com

工作时间:周一至周五,9:00-18:00,节假日休息