谷歌AI模型Veo-3手术视频生成存逻辑缺陷 医学理解能力待提升

国际研究团队针对谷歌视频生成模型Veo-3,依托SurgVeo基准评估体系开展专项测试,以真实手术录像为参照。测试显示,该模型生成的腹腔及脑部手术视频虽具视觉呈现力,但医学逻辑性评分均低于1.8分;经四位外科医生多维度评估,神经外科场景下模型表现更差,手术逻辑性评分骤降至1.13分。研究指出,93%的错误源于医学逻辑层面,涵盖虚构手术器械、违背生理规律的组织反应等问题。即便补充额外上下文线索,模型对医学知识的理解能力仍无改善。专家警示,此类AI若用于医学培训,可能误导手术机器人或医学生习得错误技术。目前研究团队计划开源SurgVeo数据集,推动学界提升AI医学认知能力。值得注意的是,当前视频生成模型仅能模仿手术表象,尚未掌握真实手术的因果逻辑与生物机制。免责声明:本文内容由开放的智能模型自动生成,仅供参考。

上一篇:

下一篇:

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

17764557165

微信号:JZL99876

邮件:474804@qq.com

工作时间:周一至周五,9:00-18:00,节假日休息