谷歌AI模型Veo-3手术视频生成存逻辑缺陷医学理解能力待提升

国际研究团队针对谷歌视频生成模型Veo-3，依托SurgVeo基准评估体系开展专项测试，以真实手术录像为参照。测试显示，该模型生成的腹腔及脑部手术视频虽具视觉呈现力，但医学逻辑性评分均低于1.8分；经四位外科医生多维度评估，神经外科场景下模型表现更差，手术逻辑性评分骤降至1.13分。研究指出，93%的错误源于医学逻辑层面，涵盖虚构手术器械、违背生理规律的组织反应等问题。即便补充额外上下文线索，模型对医学知识的理解能力仍无改善。专家警示，此类AI若用于医学培训，可能误导手术机器人或医学生习得错误技术。目前研究团队计划开源SurgVeo数据集，推动学界提升AI医学认知能力。值得注意的是，当前视频生成模型仅能模仿手术表象，尚未掌握真实手术的因果逻辑与生物机制。免责声明：本文内容由开放的智能模型自动生成，仅供参考。

谷歌AI模型Veo-3手术视频生成存逻辑缺陷医学理解能力待提升

联系我们

18658854422

谷歌AI模型Veo-3手术视频生成存逻辑缺陷 医学理解能力待提升

联系我们

18658854422

谷歌AI模型Veo-3手术视频生成存逻辑缺陷医学理解能力待提升