Learning High Coverage Discriminative Parsimonious Rulesets
学习高覆盖判别性简约规则集
发表机构 * Indian Institute of Science(印度科学研究所) ; Compass
AI总结 提出CDPR方法,通过子模最大化算法学习高覆盖、判别性且简约的规则集,在保持高准确率的同时显著提升可解释性,覆盖率比次优算法提升2.5倍以上。
学习高覆盖判别性简约规则集
发表机构 * Indian Institute of Science(印度科学研究所) ; Compass
AI总结 提出CDPR方法,通过子模最大化算法学习高覆盖、判别性且简约的规则集,在保持高准确率的同时显著提升可解释性,覆盖率比次优算法提升2.5倍以上。
基于图的目标反向传播用于多LLM智能体系统中的上下文自适应
发表机构 * Retail Intelligence, Walmart Global Tech(零售智能,沃尔玛全球技术)
AI总结 提出GTBP框架,通过图结构反向传播局部目标输出,实现多LLM智能体工作流的上下文自适应,理论保证稳定性,实验优于基线。
编码器胜者无法可靠跨VLA骨干网络规模迁移:一种冻结骨干嫁接诊断方法
发表机构 * Tsinghua University(清华大学)
AI总结 提出冻结骨干嫁接诊断方法,发现小规模VLA上最优的视觉编码器在大规模骨干上并非最优,编码器选择依赖于骨干网络规模。
Comments 23 pages, 5 figures, 8 tables
小型LLM:剪枝 vs. 从头训练
发表机构 * Princeton University(普林斯顿大学) ; New York University(纽约大学) ; Carnegie Mellon University(卡内基梅隆大学)
AI总结 本文通过六种剪枝方法在Llama-3.1-8B上比较剪枝与从头训练,发现有限预算下剪枝更优,预算充足时粗粒度剪枝可被超越。
Comments Our code is available at https://github.com/zlab-princeton/llm-pruning-collection
信任但验证:通过事后对抗审计和多智能体反馈循环减轻医学幻觉
发表机构 * Data Science and Machine Learning Lab, SINES, NUST(NUST SINES数据科学与机器学习实验室) ; SINES, NUST(NUST SINES) ; CEME, NUST(NUST CEME)
AI总结 本研究提出一种五智能体“信任但验证”系统,通过事后对抗审计和多智能体反馈循环,将大型语言模型在临床问题中推荐禁用药品的幻觉错误率降低约53%。
个人护理公用设施:健康作为日常基础设施
发表机构 * University of California, Irvine(加利福尼亚大学尔湾分校)
AI总结 提出个人护理公用设施(PCU)分层事件驱动架构,将健康视为日常基础设施,通过Personicle组织连续信号,分离临床决策与语言表达,以2型糖尿病为例验证其生成实时干预和知识引导的能力。
Comments 12 pages, 2 figures, 3 tables
动态声源的时空音频语言建模
发表机构 * POSTECH(浦项科技大学) ; Sony AI(索尼AI) ; Sony Group Corporation(索尼集团) ; Sungkyunkwan University(成均馆大学) ; KAIST(韩国科学技术院)
AI总结 提出ST-AudioLM模型,通过时空音频编码器联合学习事件语义与源轨迹,在ST-AudioQA基准上提升动态声源问答的语义-定位权衡。
全波形反演的扩散模型解耦潜变量优化
发表机构 * School of Mathematical Sciences, Shanghai Jiao Tong University(上海交通大学数学科学学院) ; CMA-Shanghai, Shanghai Jiao Tong University(上海交通大学CMA-上海)
AI总结 提出解耦潜变量优化(DLO),通过二次惩罚目标分离物理变量和潜变量,结合数据保真度梯度和扩散先验,在OpenFWI基准上优于经典正则化和现有扩散方法。
Comments 35 pages, 14 figures
基于合约的组合屏蔽实现安全多智能体强化学习
发表机构 * Imperial College London(伦敦帝国学院) ; University of Manchester(曼彻斯特大学)
AI总结 提出一种去中心化屏蔽方法,通过合约机制协调智能体局部LTL安全义务,在无集中运行时控制下保证全局安全并优化团队奖励。
BoRAD: 自举表示实现多类异常检测
发表机构 * Department of Artificial Intelligence, FPT University(FPT大学人工智能系) ; Department of IT, FPT University(FPT大学信息技术系) ; Department of Computing Fundamental, FPT University(FPT大学计算基础系)
AI总结 提出BoRAD框架,通过原型正则化解决多类异常检测中重建模型的捷径和误重建问题,无需标签即可实现单模型多类检测。
条件至关重要:稳定扩散图像编辑中的反演与注意力
发表机构 * State Key Laboratory of Blockchain and Data Security, Zhejiang University(浙江大学区块链与数据安全全国重点实验室) ; HangZhou High-Tech Zong (Binjiang) Institute of Blockchain and Data Security(杭州高新技术产业开发区(滨江)区块链与数据安全研究院) ; College of Computer Science, Zhejiang University(浙江大学计算机科学与技术学院) ; University at Buffalo, State University of New York(纽约州立大学布法罗分校)
AI总结 本文提出SimEdit框架,通过优化文本条件精度和令牌级跨分支注意力控制,提升扩散模型反演稳定性和编辑保真度,在PIE-Bench上显著优于先前方法。
Comments Accepted to ECML PKDD 2026 Research Track
知识追踪中恢复被搁置的区分能力:通过经验贝叶斯收缩进行逐项偏差校正
发表机构 * Kyushu University(九州大学)
AI总结 提出SLC方法,利用Laplace/IRLS将二值观测转化为高斯伪观测,通过卡尔曼平滑器进行经验贝叶斯收缩,并拟合偏移Platt链接,以校正知识追踪模型中的逐项偏差,恢复被搁置的区分能力,在多个数据集和骨干网络上提升AUC和NLL。
Comments 25 pages, 3 figures. Accepted at ECML PKDD 2026 (Research Track). Code: https://github.com/xiaoran-y/SLC
超越困惑度:字节感知语言模型中的 UTF-8 有效性
发表机构 * University of Tokyo(东京大学) ; National Institute of Information and Communications Technology(信息通信技术国家研究所)
AI总结 研究字节级分词语言模型生成无效UTF-8序列的问题,通过多语言训练实验发现UTF-8有效性收敛比困惑度慢约一倍,且罕见字符结构有效性更高,表明可靠UTF-8生成是需要单独评估的能力。
FactoryLLM:用于评估智能工厂中大语言模型的安全开源AI实验场
发表机构 * GitHub ; arXiv
AI总结 提出FactoryLLM,一个安全开源的AI实验场,通过多机器文档分析评估基于RAG的大语言模型,采用RAGAS和NVIDIA LLM-as-a-Judge双评估机制,案例验证了跨机器文档推理的有效性。
Comments 6 pages, 3 figures, IEEE INDIN 2026
DTVEM-RE:差分时变效应模型的分层随机效应扩展,用于密集纵向数据中个体特异性多滞后估计
发表机构 * Geisel School of Medicine, Dartmouth College(达特茅斯学院盖泽尔医学院)
AI总结 针对DTVEM假设所有人共享相同滞后结构的局限,提出DTVEM-RE扩展,允许个体拥有自己的滞后系数,通过贝叶斯分层VAR和连续时间OU模型实现,模拟和实证表明其能恢复个体间变异并提升预测性能。
数字本身已携带其嵌入
发表机构 * Department of Mathematics, Korea University(高丽大学数学系)
AI总结 提出无训练嵌入方法AOE,同时保留数字的实数值与p-adic模签名,实现即插即用并在代数组合基准上首次达到完美精度。
Comments Presented at the MATH-AI Workshop at NeurIPS 2025
FEMOT: 使用帧和事件摄像机的多目标跟踪
发表机构 * School of Computer Science and Technology, Anhui University(安徽大学计算机科学与技术学院) ; Peng Cheng Laboratory(鹏城实验室) ; National Key Laboratory for Multimedia Information Processing, School of Computer Science, Peking University(北京大学计算机学院多媒体信息处理全国重点实验室) ; School of Electronic and Computer Engineering, Shenzhen Graduate School, Peking University(北京大学深圳研究生院电子与计算机工程学院) ; Harbin Institute of Technology, Shenzhen(哈尔滨工业大学(深圳))
AI总结 提出FEMOT大规模RGB-事件多目标跟踪数据集和FEMOTR多模态跟踪框架,通过频域融合解耦特征,有效利用互补信息实现鲁棒跟踪。
一种具有增强田间性能的模块化双臂苹果采摘机器人
发表机构 * Michigan State University(密歇根州立大学) ; United States Department of Agriculture Agricultural Research Service(美国农业部农业研究局)
AI总结 提出一种模块化双臂苹果采摘机器人,采用垂直堆叠臂实现单树上下区域同时作业,结合基础模型感知、7阶加加速度轨迹生成、线性扫描采摘策略等5项改进,在商业果园中达到80.0%采摘成功率和7.53秒平均单臂周期,91.2%果实达到特级标准。
使用置信度分数和强化学习修正语音情感描述子的可解释且可信的语音情感识别
发表机构 * The Chinese University of Hong Kong(香港中文大学) ; Institute of Software, Chinese Academy of Sciences(中国科学院软件研究所) ; National Research Council Canada(加拿大国家研究委员会) ; Tsinghua University(清华大学)
AI总结 提出基于置信度分数和强化学习的在线语音情感描述子修正方法,用于后训练语音情感识别系统,在IEMOCAP和MELD上分别取得2.9%和3.3%的绝对性能提升。
Comments Accepted by Interspeech2026
自我改进的VLA策略:用于抗伪影动作平滑的选择性扩散噪声
发表机构 * Center for AI Research, VinUniversity(VinUniversity人工智能研究中心) ; VinRobotics ; KAIST(韩国科学技术院) ; University of Stuttgart(斯图加特大学) ; IMPRS-IS(国际马克斯·普朗克智能系统研究学院) ; National University of Singapore(新加坡国立大学) ; DFKI(德国人工智能研究中心) ; University of Oldenburg(奥尔登堡大学) ; Monash University(莫纳什大学) ; University of Arkansas(阿肯色大学) ; TU Darmstadt(达姆施塔特工业大学)
AI总结 提出一种无需训练的选择性扩散噪声方法,通过动态采样噪声向量增强视觉-语言-动作策略的鲁棒性和动作平滑性,在仿真和真实场景中成功率分别提升8%和10%。
N2D 触觉手套:用于接触丰富操作的多指二维方向力反馈手套
发表机构 * University of California San Diego(加州大学圣地亚哥分校)
AI总结 提出 N2D 触觉手套,通过绞盘驱动在指尖提供二维弯曲-伸展力反馈,显著降低遥操作中的接触力误差并提高一致性。
随机动力系统的嵌入潜转移算子深度谱学习
发表机构 * Graduate School of Information Science and Technology, The University of Osaka(大阪大学信息科学与技术研究生院) ; Center for Advanced Intelligence Project, RIKEN(理化学研究所先进智能项目中心)
AI总结 提出一种深度谱编码器方法,通过可学习的非线性特征映射定义马尔可夫潜状态,利用泛函典型相关分析和Galerkin投影估计转移与观测算子,实现贝叶斯滤波和Koopman谱分解,在噪声和部分可观测条件下表现稳定优越。
Comments Accepted at the 42nd Conference on Uncertainty in Artificial Intelligence (UAI 2026)
通过持续学习中的灾难性遗忘视角重新思考后门对抗性去学习
发表机构 * Harbin Institute of Technology, Shenzhen(哈尔滨工业大学(深圳)) ; Shenzhen Key Laboratory of Media Security, Shenzhen University(深圳大学媒体安全深圳市重点实验室)
AI总结 本文将后门学习与去学习建模为持续学习视角下的三阶段过程,基于灾难性遗忘机制推导完全后门去学习的必要条件,并提出盲反演-后门对抗性去学习(BI-BAU)方法,通过期望最大化算法优化最大后验目标,有效消除后门效应。
Comments Accepted by ACM CCS 2026
扩散细化分割与视觉-语言解释用于儿童脑肿瘤MRI
发表机构 * Department of Mechanical Engineering, Stanford University(斯坦福大学机械工程系) ; School of Medicine, Stanford University(斯坦福大学医学院)
AI总结 提出两阶段框架,先用Swin-UNETR粗分割,再用条件扩散模型细化边界,最后结合多模态语言模型生成结构化报告,提升儿童脑肿瘤分割精度和可解释性。
ShearFuse-UNet: Hadamard、DCT和Shearlet变换融合用于次日野火蔓延预测
发表机构 * University of Illinois Chicago(伊利诺伊大学芝加哥分校) ; US Forest Service, Pacific Wildland Fire Science Laboratory(美国林务局太平洋野火科学实验室)
AI总结 提出ShearFuse-UNet,一种轻量级深度学习模型,通过融合WHT、DCT和Shearlet变换分支,在U-Net编码器中实现多模态卫星数据的次日野火蔓延预测,以267k参数达到0.596 F1分数,优于ResNet18 U-Net。
使用X形连杆的铰接差动机构的三通下水道管道检测机器人开发
发表机构 * Ritsumeikan University(立命馆大学)
AI总结 提出一种改进的三通下水道管道检测机器人,通过铰接差动机构提升牵引力和越障能力,并设计基于驱动轮电流检测的线缆松弛控制方法,实验验证了其越障性能。
Comments The 23rd International Conference on Ubiquitous Robots (UR 2026), 15-18 July, Osaka Ibaraki Campus, Ritsumeikan University, Ibaraki, Osaka, Japan
对男性更严厉?评估LLM在不同冲突场景中的性别不对称道德框架
发表机构 * University of Science and Technology of China(中国科学技术大学) ; Eastern Institute of Technology, Ningbo(宁波东方理工大学)
AI总结 提出GAMA-Bench基准,通过性别镜像场景评估LLM对相同负面行为的回应,发现模型对男性更倾向于惩罚和责备,对女性则更强调共情和治疗。
Comments underreview
无碰撞运动规划的半定松弛
发表机构 * Department of Electrical Engineering and Computer Science, Massachusetts Institute of Technology(麻省理工学院电气工程与计算机科学系)
AI总结 研究点机器人通过球形障碍物的无碰撞运动规划,提出半定松弛方法,理论分析其紧性并利用对称性降低计算复杂度,比直接非线性规划快10-100倍。
非参数化机器文本检测:基于多视角高斯过程
发表机构 * Johns Hopkins University(约翰霍普金斯大学)
AI总结 提出多视角非参数检测框架,通过高斯过程集成互补特征视图,提高对对抗攻击的鲁棒性,并提供校准概率和分布外输入的原则性弃权。
ReactSim-Bench:自动驾驶中反应性行为世界模型模拟的基准测试
发表机构 * School of Computer Science & School of Artificial Intelligence, Shanghai Jiao Tong University(上海交通大学计算机科学与技术学院、人工智能学院) ; Great Wall Motor(长城汽车) ; Institute of Trustworthy Embodied AI (TEAI), Fudan University(复旦大学可信具身人工智能研究所) ; School of Computer Science, Wuhan University(武汉大学计算机学院) ; University of Science and Technology of China(中国科学技术大学)
AI总结 提出ReactSim-Bench,通过解耦自车与周围智能体控制,使用偏离日志的自车行为作为输入,评估行为世界模型模拟的反应性能力,并基于碰撞、地图和运动学指标系统评测多种模型。