TxBench-PP: Analyzing AI Agent Performance on Small-Molecule Preclinical Pharmacology
TxBench-PP:分析AI代理在小分子临床前药理学中的表现
发表机构 * LatchBio
AI总结 提出TxBench-PP基准,用于评估AI代理从真实实验数据中恢复临床前药理学结论的能力,测试显示最强配置Claude Opus 4.8 / Pi仅通过59.3%的端点尝试。
TxBench-PP:分析AI代理在小分子临床前药理学中的表现
发表机构 * LatchBio
AI总结 提出TxBench-PP基准,用于评估AI代理从真实实验数据中恢复临床前药理学结论的能力,测试显示最强配置Claude Opus 4.8 / Pi仅通过59.3%的端点尝试。
透过遮挡:机器人遥操作的确定性手臂运动学校正
发表机构 * University of Waterloo(滑铁卢大学)
AI总结 提出手臂运动学校正方法,利用恒定臂长几何约束和勾股定理确定性地重建遮挡关节深度,无需复杂建模,经Vicon验证有效,并成功应用于遥操作。
STARE: 基于惊讶度的令牌级优势重加权以实现策略熵稳定性
发表机构 * Shenzhen International Graduate School, Tsinghua University(清华大学深圳国际研究生院) ; Tencent Hunyuan(腾讯混元)
AI总结 针对GRPO等RL算法中策略熵崩溃问题,提出STARE方法,通过惊讶度分位数识别熵关键令牌并重加权其优势,结合目标熵闭环门控稳定熵,在1.5B-32B模型和多种任务上实现稳定训练,AIME24/25准确率提升4%-8%。
Comments LLM, Reinforcement Learning
基于轮式双足机器人分层控制的移动式腿部操作物体滑动
发表机构 * University of Michigan(密歇根大学)
AI总结 提出一种分层控制框架,使轮式双足机器人能用腿部滑动平面物体,通过简化三刚体动力学模型和轨迹优化运动规划器,在实验中成功实现1kg物体取回和4kg物体滑动。
Comments 8 pages, 7 figures
一种面向约束感知的生物过程开发的人机协同贝叶斯优化框架
发表机构 * Imperial College London(伦敦帝国理工学院) ; DataHow AG ; ETH Zurich(苏黎世联邦理工学院)
AI总结 提出一种扩展的帕累托前沿引导采样框架,通过将高斯过程代理的约束满足概率和鲁棒性作为多目标优化目标,结合交互式仪表盘实现人机协同的约束感知生物过程优化。
基于神经网络与不变扩展卡尔曼滤波的任意轨迹恒定时间延迟领航跟随
发表机构 * University of Toronto Institute for Aerospace Studies(多伦多大学航空航天研究所) ; School of Computing, Queen’s University(女王大学计算机学院)
AI总结 提出一种结合概率Seq2Seq神经网络与不变扩展卡尔曼滤波的恒定时间延迟轨迹跟踪方法,用于无通信、无全局坐标的车队,在SE(2)流形上准确估计领车轨迹,并利用几何模型预测控制提升性能。
Comments 9 pages, 6 figures
机制引导的选择性遗忘:针对RLVR诱导的推理
发表机构 * School of Engineering, Institute of Science Tokyo, Japan(东京科学大学工学院) ; College of Control Science and Engineering, Zhejiang University, China(浙江大学控制科学与工程学院) ; Department of Electrical and Computer Engineering, National University of Singapore, Singapore(新加坡国立大学电气与计算机工程系)
AI总结 提出MAST方法,通过机制引导选择性更新参数,在遗忘RLVR诱导的推理行为时,显著降低对保留性能的附带损害。
Comments 15 pages, 4 figures, 7 tables
面向网络入侵数据集的XGBoost模型机器遗忘
发表机构 * GECAD, ISEP, Polytechnic of Porto(波尔图理工学院工程学院GECAD研究所)
AI总结 针对XGBoost模型提出XGBoost-Forget遗忘方法,在表格型网络入侵数据集上实现高效遗忘,保持模型性能的同时显著提升遗忘速度。
Comments 12 pages, 7 tables, WorldCist'26 Conference
RECOM:开放式 Reddit 问答中自动评估指标的有效性与区分性权衡
发表机构 * University of Alabama Huntsville(阿拉巴马大学亨茨维尔分校) ; University of North Alabama(北阿拉巴马大学) ; Stanford University(斯坦福大学) ; Meta AI ; Amazon GenAI(亚马逊GenAI)
AI总结 提出 RECOM 数据集,发现自动评估指标在开放式问答中无法同时兼顾有效性和区分性,余弦相似度有效性高但区分性差,BERTScore 区分性受长度影响且有效性弱。
GUMP-Net: 一种用于多类盆腔分割的可解释模型-数据驱动智能算法
发表机构 * State Key Laboratory of Mathematical Sciences, Academy of Mathematics and Systems Science, Chinese Academy of Sciences(中国科学院数学与系统科学研究院数学科学国家重点实验室) ; University of Chinese Academy of Sciences(中国科学院大学) ; Department of Orthopedics, The Fourth Medical Center of Chinese PLA General Hospital(中国人民解放军总医院第四医学中心骨科) ; National Clinical Research Center for Orthopedics, Sports Medicine and Rehabilitation(国家骨科与运动康复临床医学研究中心) ; Department of Trauma and Orthopedics, People’s Hospital Peking University(北京大学人民医院创伤骨科) ; Department of Orthopedics and Traumatology, Beijing Jishuitan Hospital, Capital Medical University(首都医科大学附属北京积水潭医院骨科)
AI总结 提出GUMP-Net,结合改进测地线活动轮廓模型与深度神经网络,实现多类盆腔分割,在小训练数据下表现更优,并提供可解释几何视角。
Comments 26 pages, 8 figures, 3 tables
FineCombo-TTS: 使用文本描述和参考语音的协作式精确可控语音合成
发表机构 * Shenzhen International Graduate School, Tsinghua University(清华大学深圳国际研究生院) ; Inner Mongolia University(内蒙古大学) ; Tencent(腾讯)
AI总结 提出FineCombo-TTS统一框架,通过条件流匹配的语音方差预测器实现基于文本描述的细粒度参考到目标变换,实现灵活精确的声学属性控制。
Comments Accepted by Interspeech 2026
ROSA-TFormer: 一种雷达-光学传感器感知的时间Transformer用于基于GEE导出的Sentinel-1/2时间序列的陕北樟子松人工林分类
发表机构 * Key Laboratory of Remote Sensing and Digital Earth, Aerospace Information Research Institute, Chinese Academy of Sciences (AIRCAS)(中国科学院空天信息创新研究院遥感与数字地球重点实验室)
AI总结 提出ROSA-TFormer模型,集成SAR和光学嵌入分支、传感器感知门和时间注意力池化,利用Sentinel-1/2时间序列数据实现高精度樟子松人工林分类,总体精度达99.67%。
Comments journal in tree classification
预测关键因素:面向决策的强化学习用于未知离开时间的受控电动汽车充电
发表机构 * Ghent University -- imec(根特大学 -- imec)
AI总结 针对电动汽车充电中离开时间未知导致强化学习策略效果差的问题,提出面向决策的强化学习框架,联合训练预测器与控制器,实现端到端优化,使总奖励提升14%,未供应能量减少55%。
Comments ACM e-Energy 2026 5 pages, 1 figure, 1 table
Moebius: 0.2B轻量级图像修复框架,性能达10B级别
发表机构 * Huazhong University of Science and Technology(华中科技大学) ; VIVO AI Lab(维沃人工智能实验室)
AI总结 提出Moebius轻量级图像修复框架,通过局部-λ混合交互模块和自适应多粒度蒸馏策略,以0.22B参数实现与10B级模型FLUX.1-Fill-Dev相当甚至更优的生成质量,推理速度提升15倍以上。
FAST-LIVGO:一种退化鲁棒的LiDAR-惯性-视觉-GNSS融合里程计
发表机构 * College of Mechatronics and Control Engineering, Shenzhen University(深圳大学机电与控制工程学院) ; Department of Mechanical Engineering, The University of Hong Kong(香港大学机械工程系) ; College of Automation, Harbin Engineering University(哈尔滨工程大学自动化学院)
AI总结 提出一种基于误差状态迭代卡尔曼滤波的紧耦合LiDAR-惯性-视觉-GNSS融合框架,通过动态时间规整的时空对齐模块、多普勒和时差载波相位观测模型以及退化感知的双模式异常值拒绝策略,在长期大尺度动态环境中实现高精度鲁棒的状态估计。
Comments Accepted for presentation at the 2026 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS 2026)
学习标注延迟和误报AEB事件:针对极端类别不平衡和非对称标签噪声的实用系统
发表机构 * Li Auto(理想汽车)
AI总结 提出首个自动化AEB标注框架,通过特定数据增强和噪声抑制技术,解决极端类别不平衡和非对称标签噪声问题,将延迟/误报触发召回率提升80%,人工工作量减少50%。
Comments 8 pages, 5 figures, accepted by IEEE International Conference on Robotics and Automation (ICRA)
AGDN:利用各向异性图扩散网络学习求解旅行商问题
发表机构 * Florida State University(佛罗里达州立大学) ; Singapore Management University(新加坡管理大学)
AI总结 提出各向异性图扩散网络(AGDN),通过MixScore转移矩阵和各向异性扩散策略,有效利用图结构信息求解旅行商问题,在多种实例规模和分布上优于现有方法。
Comments Accepted at the 32nd ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD 2026)
当AUC误导:域偏移下深度伪造检测器的极化感知评估
发表机构 * Cristal Laboratory, National School of Computer Sciences, University of Manouba(马努巴大学国家计算机科学学院Cristal实验室)
AI总结 针对现有AUC评估无法反映真实场景中混合数据源和不同伪影类型的问题,提出Cross-dataset AUC(Cross-AUC)指标,通过平均每域AUC并引入预测极化度量(Wasserstein距离)来评估域偏移鲁棒性,实验证明其有效性。
语言模型作为接口而非预言机:用于小儿阑尾炎的混合LLM-ML系统
发表机构 * K. N. Toosi University of Technology(K. N. 图西理工大学)
AI总结 提出ClaMPAPP混合系统,利用LLM从自由文本中提取结构化特征,再由XGBoost分类器进行诊断,在两个独立队列中优于端到端LLM,提高了诊断稳定性和可审计性。
用于自主海上无人机飞行的深度单目位姿估计的硬件与视觉在环验证
发表机构 * George Washington University(乔治华盛顿大学)
AI总结 提出硬件验证的视觉在环框架,结合深度变换器单目位姿估计器和延迟卡尔曼滤波器,在模拟逼真海上环境中实现自主室内飞行,验证了感知延迟等嵌入式效应。
Comments 6 pages 9 figues
用户作为印迹:将每用户记忆内化为局部参数编辑
发表机构 * Pine AI
AI总结 提出User as Engram方法,将用户事实存储为Engram模型的哈希键控记忆表中的局部编辑,推理技能共享一个适配器,实现高精度间接推理且内存占用极小。
Dango:一个严格仅L1的大型语言模型,用于研究第二语言习得
发表机构 * Kyoto University(京都大学) ; NII-LLMC(国立信息学研究所-大规模语言模型中心)
AI总结 提出1.8B参数的Dango模型,通过过滤L2污染和微调L2学习课程,模拟人类L2产出模式,优于未过滤和多语言基线。
Comments 8 pages main text, 20 pages total including references and appendices
超越安全数据:具有正则安全反射的预训练阶段对齐
发表机构 * Institute for Interdisciplinary Information Sciences, Tsinghua University(清华大学交叉信息研究院)
AI总结 提出安全反射预训练方法,在预训练语料中插入安全反思,使模型具备自我监控能力,实验表明该方法能有效降低推理和微调攻击成功率。
多任务学习的本质子空间合并
发表机构 * School of Computer Science and Engineering, Southeast University(东南大学计算机科学与工程学院) ; Key Laboratory of New Generation Artificial Intelligence Technology and Its Interdisciplinary Applications (Southeast University), Ministry of Education(教育部新一代人工智能技术及其跨学科应用重点实验室(东南大学)) ; Huawei Inc.(华为公司)
AI总结 提出本质子空间分解(ESD)和合并(ESM/ESM++)方法,通过正交化任务更新的主成分来减少多任务合并中的干扰,无需训练即可实现高效多任务学习。
奖励一直就在你的数据中:用判别器引导的强化学习纠正流匹配
发表机构 * FAIR at Meta(Meta FAIR) ; Columbia University(哥伦比亚大学) ; McGill University(麦吉尔大学) ; Canada CIFAR AI Chair(加拿大CIFAR人工智能主席)
AI总结 针对流匹配模型因损失函数与样本质量不匹配导致的视觉缺陷,提出判别器引导的强化学习(DRL),利用预训练空间中判别器的logit作为奖励,显著提升无引导FID和语义FD,并改善偏好对齐。
Comments 84 pages, including appendices
HT-Bench:基于自我中心视觉的灵巧全手触觉表示基准与学习
发表机构 * Beihang University(北京航空航天大学) ; Rimbot ; BUPT(北京邮电大学) ; ShanghaiTech University(上海科技大学) ; Tsinghua University(清华大学) ; CAS(中国科学院)
AI总结 提出HT-Bench多任务基准和HandTouch编码器,通过大规模自我中心视觉与全手触觉数据,在触觉相似性检索、掩码修复、视觉到触觉合成等任务上验证了触觉表示的有效性。
Comments 9pages, 4figures
Hand-4DGS: 用于从第一人称视频进行4D手部重建的前馈3D高斯泼溅方法
发表机构 * Yonsei University(延世大学) ; Electronics and Telecommunications Research Institute(韩国电子通信研究院) ; ETH Zurich(苏黎世联邦理工学院) ; Microsoft Spatial AI Lab(微软空间人工智能实验室) ; VGG, University of Oxford(牛津大学VGG实验室)
AI总结 提出Hand-4DGS,首个前馈框架,从第一人称视频直接重建动态4D手部,利用网格引导表示和时间卷积,实现快速推理和强泛化,无需3D真值标注。
Comments Project page: https://jeongminb.github.io/hand-4dgs/
Viking Hill数据集:用于森林场景检测与分割的激光雷达-雷达-相机数据集
发表机构 * Örebro University, AASS research centre, Robot Navigation and Perception Lab(厄勒布鲁大学,AASS研究中心,机器人导航与感知实验室)
AI总结 提出首个包含4D成像雷达的森林多传感器数据集,通过MinkowskiUNet实现雷达与激光雷达点云的语义分割,并评估树干分割质量与树木尺寸的关系。
Comments 33 pages, 11 figures
互补注意力头剪枝用于高效Transformer
发表机构 * Bar-Ilan University(巴伊兰大学)
AI总结 提出CAHP框架,将注意力头选择建模为全局图论问题,通过图聚类和信息论距离保留互补头,自动确定剪枝数量,在SST-5和MNLI上优于现有方法。
Comments 9 pages, 4 figures, 3 tables. Accepted for presentation at the International Joint Conference on Neural Networks (IJCNN) 2026
OrthoReg:混合符号-神经动力系统的正交正则化
发表机构 * Technical University of Munich(慕尼黑工业大学) ; Helmholtz Munich(亥姆霍兹慕尼黑中心)
AI总结 针对混合建模中神经部分可能重复学习符号结构导致模型冗余的问题,提出正交正则化方法OrthoReg,直接惩罚符号与神经组件间的重叠,实现互补分解,提升符号恢复和分布外行为。