您当前所在位置:网站首页 > 卓越头条 >

西安光机所最新科研成果发布!

来源:卓越陕西网|发布时间:2026-03-310

近日,记者从中国科学院西安光机所获悉:该所光谱成像技术研究室研究员王荃团队在计算机视觉领域的零样本异常检测领域取得新进展。他们提出的新方法能在不依赖海量异常样本标注数据的情况下,实现对复杂场景中微小异常的精准检测与定位。相关成果已被第43届计算机视觉与模式识别会议(CVPR 2026)接收。

640

图1 FB-CLIP整体结构。(a) 多策略文本特征融合(MSTFF)生成任务感知的文本嵌入;(b) 多视角前景-背景增强(MVFBE)分离并增强前景与背景特征;(c) 背景抑制(Background Suppression)减少残余背景干扰;(d) 语义一致性正则化(SCR)强化置信且具有判别力的视觉-文本对齐。


在工业质检、医学影像分析等应用场景中,自动检测异常(如产品瑕疵或患者病灶)的需求十分迫切。但现实是,异常样本往往稀少且难以提前收集,传统依赖大量异常样本标注数据的方法行不通。


近年来,虽然像基于CLIP这样的视觉—语言模型的零样本异常检测方法提供了有前景的解决方案,但其需要借助大规模预训练知识,在面对更加精细的异常检测任务时,存在前景目标与复杂背景难以区分、单一文本描述难以准确表达异常类型、图像与文本的语义匹配不够准确等挑战。


“针对上述问题,我们提出了FB-CLIP框架,让模型能更精准地聚焦目标区域、更灵活地理解异常语义,并作出判断。”团队成员胡明介绍,在视觉建模上,该框架通过设计专门机制将图像中的前景目标与背景分离,并抑制背景干扰,使模型更精准专注于异常区域;在文本建模上,综合运用多种不同的策略来提取图像特征,让模型对“什么是异常”理解得更精细、更灵活;在跨模态对齐上,引入语义一致性的训练原则,增强图像与文本之间的匹配可信度,拉开正常与异常样本的判别距离。


实验结果表明,该方法在多个工业检测和医学影像数据集上展现出优异性能,尤其在高精度的异常定位任务中表现突出,达到国际领先水平。


“这意味着,该成果有望在医学影像辅助诊断、工业缺陷检测等领域发挥实际作用。”胡明告诉记者,“下一步,我们计划和武汉大学中南医院开展验证合作,进一步探索其在现实场景中的适用性。”


据悉,王荃团队长期深耕于计算机视觉与生物医学成像、脑机智能等交叉方向,并取得了一系列重要进展,研究成果均发表于相关领域国内外极具影响力的学术会议或期刊上。团队此次研究得到了陕西省技术创新引导计划项目、湖北省自然科学基金资助,中国科学院以及西安市重点实验室支持。


来源:陕西日报中国科学院西安光机所



生成海报

版权所有和免责声明

1. 凡本网注明“来源:卓越陕西网”的所有作品,版权均属本网所有,未经本网授权不得转载。已经本网授权,必须注明“来源:卓越陕西网”,违者将追究法律责任。

2. 凡本网注明“来源:XXX(非卓越陕西网)”的作品,转载此文是出于传递更多信息之目的。

3. 若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本网联系,我们将及时更正、删除,谢谢。

电话:17749134140 电子邮箱:1607756458@qq.com

Copyright © 2024 陕西求真务实文化传媒有限公司 All Rights Reserved. 陕ICP备2024042476号 XML地图