科研进展

所在位置 首页 科研进展 正文

Infor-X • 学术 | 人工智能交叉研究院4篇论文被人工智能领域顶级会议ICML 2026录用

发布时间:2026-05-22点击量:


近日,世界杯足球人工智能交叉研究院4项研究成果被人工智能与机器学习领域顶级国际会议International Conference on Machine Learning(简称ICML)录用。ICML是中国计算机学会(CCF)推荐的A类会议,是人工智能领域最具影响力的顶级国际学术会议之一,与NeurIPS、ICLR并称为机器学习领域代表性顶级会议。ICML 2026共收到23918篇提交论文,最终录用6352篇,录用率为26.6%,会议将于7月6日至11日在韩国首尔举行。被录用论文简要介绍如下:


论文一

论文题目:PSMix: Robust Point Cloud Recognition through Spectral Domain Mixing

论文作者:卫鑫,杨钦,赵鸿基,高飞,朱明瑞,王楠楠(通讯作者),高新波

作者单位:西安电子科技大学

论文概述:点云识别是三维计算机视觉中的基础任务,在自动驾驶、机器人感知和具身智能等领域具有重要应用。然而,现有点云深度模型在噪声、遮挡、密度变化和几何变换等分布外扰动下往往性能明显下降。针对现有Mixup类方法多在空间域进行坐标插值或局部替换、易破坏几何连续性和拓扑结构的问题,本文提出频谱域点云增强框架PSMix。该方法利用球谐变换将点云映射到统一频谱空间,并在频谱系数上进行旋转感知的层次化混合,在增强样本多样性的同时保持结构连续性。进一步结合对抗旋转优化策略,提升模型对复杂方向变化的鲁棒表征能力。

论文二

论文题目:Robust Cross-Modal Retrieval via Generative Semantic Refinement and Exclusion-Guided Adaptation

论文作者:杨钦,卫鑫(通讯作者),李彦嘉,冯嘉孙,朱明瑞,王楠楠(通讯作者),高新波

作者单位:西安电子科技大学,西安交通大学,Video Rebirth

论文概述:跨模态检索旨在实现图像与文本之间的语义对齐,是图文搜索、内容推荐和多模态理解的重要基础。现有视觉语言预训练模型虽在标准数据集上表现优异,但在场景中容易受到字符插入、替换、交换、删除及OCR错误等文本噪声影响,导致分词结果破坏和语义表征偏移,从而显著降低检索性能。针对现有测试时自适应方法过度依赖高置信度样本、忽视低置信度查询中有效监督信息的问题,本文提出鲁棒跨模态检索框架。该框架结合生成式语义修正和排除引导对比学习,可在恢复文本结构的同时避免语义漂移,并将低置信度查询中的负向信息转化为有效约束,从而稳定利用整个测试查询流进行自适应更新,在噪声查询和跨域分布偏移场景下均展现出更强鲁棒性。


论文三

论文题目:Symbiosis-Inspired Knowledge Distillation for Incremental Object Detection

论文作者:曾明月,程德(通讯作者),许志鹏,王怀杰,王楠楠,高新波

作者单位:西安电子科技大学

论文概述:增量目标检测旨在持续学习新类别并保持旧类别检测能力,但当前阶段图像通常只标注新类别,未标注旧目标易被误判为背景或新类别,导致灾难性遗忘。现有方法多依赖旧模型挖掘旧类信息,并保留高置信度、低重叠的干净预测,往往忽略了真实场景中物体共现和遮挡带来的高重叠旧类响应。本文认为这类响应包含有价值的空间与语义依赖关系,提出Symbiosis-Inspired Knowledge Distillation(SIKD)。该方法从空间和语义两方面利用目标共生关系:Spatial Symbiosis Distillation关注高重叠共生区域,通过一致性特征增强提取可迁移旧类线索并蒸馏给新模型;Semantic Symbiosis Distillation构建置信度加权旧类原型,并对齐旧类相对语义结构,保持语义空间稳定。


论文四

论文题目:Task-Driven Subspace Decomposition for Knowledge Sharing and Isolation in LoRA-based Continual Learning

论文作者:何凌峰,程德(通讯作者),王怀杰,杨曦,王楠楠,高新波

作者单位:西安电子科技大学

论文概述:持续学习旨在让模型不断学新任务时不遗忘旧知识。现有基于LoRA的持续学习方法多依赖正交约束,易丢弃任务间可共享知识,且难以获得真正有利于新任务学习的特殊方向。针对该问题,本文提出LoDA,一种任务驱动的低秩子空间分解与适配框架。LoDA基于新旧数据统计量为LoRA下投影矩阵构建通用和隔离子空间:前者最大化新旧任务总体投影能量以捕获共享方向,后者最大化相对投影能量以挖掘对新任务有效且对旧任务干扰小的方向。训练时固定下投影基,仅优化上投影矩阵,并引入梯度对齐策略提升鲁棒性。训练后,设计闭式重标定缓解通用分支带来的旧任务特征漂移。

   素材来源 | 人工智能交叉研究院

   编       辑 | 景思豪

   审       核 | 相关团队、朱桐