pdSTL: Probabilistic Differentiable Signal Temporal Logic for Stochastic Systems
pdSTL: 面向随机系统的概率可微信号时序逻辑
发表机构 * Oklahoma State University(俄克拉荷马州立大学)
AI总结 提出pdSTL框架,将概率语义与可微鲁棒性结合,通过区间值概率语义和LSTM式展开实现线性时间可微监控,在障碍物规避、换道和真实四旋翼飞行实验中优于确定性可微STL。
pdSTL: 面向随机系统的概率可微信号时序逻辑
发表机构 * Oklahoma State University(俄克拉荷马州立大学)
AI总结 提出pdSTL框架,将概率语义与可微鲁棒性结合,通过区间值概率语义和LSTM式展开实现线性时间可微监控,在障碍物规避、换道和真实四旋翼飞行实验中优于确定性可微STL。
从流行病预测理解时间序列基础模型的关键特征
发表机构 * Department of Computer Science, School of Engineering and Applied Science, University of Virginia(弗吉尼亚大学工程与应用科学学院计算机科学系) ; School of Data Science, University of Virginia(弗吉尼亚大学数据科学学院) ; Biocomplexity Institute, University of Virginia(弗吉尼亚大学生物复杂性研究所) ; Department of Electrical and Computer Engineering, School of Engineering and Applied Science, University of Virginia(弗吉尼亚大学工程与应用科学学院电气与计算机工程系)
AI总结 系统评估多种时间序列模型在流感预测中的表现,发现混合专家模型性能最优,预训练在长时域提升显著,而LLM方法效果较差。
Comments 15 pages, 2 figures, 9 tables
LLM代理中寻求澄清的不确定性分解
发表机构 * AI Talent Hub, ITMO University(AI Talent Hub, ITMO大学)
AI总结 提出一种基于提示的不确定性分解方法,将行动置信度与请求不确定性分离,使代理能在任务规范模糊时主动寻求澄清,在五个LLM骨干上平均澄清F1提升36%-73%。
Comments 26 pages, 8 figures. Source code: https://github.com/PE51K/udcs-in-llm-agents
位移不是方向:评估量化LLM部署的保真度指标
发表机构 * ByteShape ; University of Toronto(多伦多大学) ; Vector Institute for Artificial Intelligence(向量人工智能研究所)
AI总结 本文研究KL散度等保真度指标在量化语言模型部署中与下游基准分数的相关性,发现整体强相关但在近基线区域失效,归因于KL散度主要衡量分歧量而非方向。
一种混合锐利-扩散界面方法,用于精确模拟激光加工金属中伴随快速蒸发的熔池动力学
AI总结 提出混合锐利-扩散界面方法,结合锐利界面传热模型和扩散界面多相流模型,精确模拟激光加工中蒸发驱动的熔池热流体动力学,精度比纯扩散模型高一个数量级。
Journal ref Computer Methods in Applied Mechanics and Engineering 457, 119023, 2026
SCAN-Planner:用于路线引导的远程四足导航的空间碰撞感知局部规划
发表机构 * Shanghai Jiao Tong University(上海交通大学)
AI总结 提出SCAN-Planner框架,通过偏航感知双圆柱足迹和投影A*搜索实现空间碰撞感知的局部规划,在密集杂乱、3D非结构化环境和远程导航中生成安全平滑轨迹。
LaViSA:语言与视觉结构歧义基准
发表机构 * Nara Institute of Science and Technology(奈良先端科学技术大学院大学) ; Guardian Robot Project RIKEN(RIKEN守护机器人项目) ; The University of Osaka(大阪大学)
AI总结 提出LaViSA基准,通过七类歧义句及对应图像评估视觉语言模型利用视觉场景解决结构歧义的能力,实验显示现有模型虽能部分利用视觉信息,但在特定歧义类型和细微语义区分上仍有局限。
预测参数高效微调更新的可合并性
发表机构 * Sichuan University(四川大学) ; University of Electronic Science and Technology of China(电子科技大学)
AI总结 提出MergeProbe,通过训练初期信号预测LoRA适配器的可合并性,在MERGE-PEFT基准上实现最佳平均和最差保留性能。
无效度的可靠性:LLM-as-a-Judge 模型在一致性、稳定性和偏差上的系统性大规模评估
发表机构 * UC Berkeley School of Information(加州大学伯克利分校信息学院)
AI总结 本研究通过大规模系统性评估(21个裁判模型、118次运行、约54.1万次判断),发现LLM-as-a-Judge在一致性、稳定性和偏差方面存在普遍问题,包括kappa通缩、排名偏移、高重测信度与严重位置偏差并存,并提出了最小可行验证协议。
利用持续同调追踪大型语言模型中的表示动态
发表机构 * Imperial College London(伦敦帝国学院)
AI总结 通过持续同调分析激活空间拓扑,发现对齐过程中拓扑重组主要发生在训练早期,且不同对齐目标产生可区分的拓扑轨迹。
Comments 29 pages
ITNet: 一种可学习的积分变换,统一卷积、注意力与循环
发表机构 * Indian Institute of Science Education and Research Bhopal(印度科学教育与研究学院博帕尔分校) ; IBM Research(IBM研究院)
AI总结 提出可学习积分变换网络ITNet,通过位置-特征联合核函数统一卷积、注意力和循环架构,实现跨模态高性能。
网格推理:无中心集体智能的形式模型
AI总结 提出网格推理形式模型,通过耦合自由能实现无中心多智能体协作推理,证明收敛唯一性、识别完备性和观测唯一性,并分析线性高斯情况下的延迟代价。
Comments 21 pages, 2 figures
FloatDoor: 大语言模型中的平台触发后门
发表机构 * University of Luebeck(吕贝克大学)
AI总结 提出FloatDoor,首个输入无关、平台触发的后门攻击,利用浮点运算平台差异,通过两个轻量LoRA适配器在目标平台触发恶意行为,同时保持模型正常效用。
PerceptionDLM:基于多模态扩散语言模型的并行区域感知
发表机构 * Peking University(北京大学) ; MSALab ; ByteDance(字节跳动)
AI总结 提出PerceptionDLM,利用扩散语言模型的并行解码特性,通过高效提示和结构化注意力掩码实现多区域并行感知,显著提升推理效率,并构建ParaDLC-Bench基准进行评估。
Comments Code available at https://github.com/MSALab-PKU/PerceptionDLM
基于伊辛模型的自适应概率处理器合成工具
AI总结 提出一种自动合成与仿真概率架构的工具,通过将组合优化问题映射到伊辛模型,自适应选择更新算法,改善收敛行为并支持硬件实现。
Comments ACM/IEEE/SBC/SBMICRO Symposium on Integrated Circuits and Systems Design 2026
Vancomycert: 一种经过认证的神经符号药物递送系统(案例研究)
AI总结 针对抗生素给药神经网络控制器的形式化验证问题,提出一种结合监督学习和定理证明的方法,确保无限时域内自动给药不超过治疗上限。
ImageWAM:世界动作模型真的需要视频生成,还是只需要图像编辑?
发表机构 * Shanghai Jiao Tong University(上海交通大学) ; Eastern Institute of Technology(东方理工学院) ; Tencent Robotics X(腾讯机器人X) ; Tsinghua University(清华大学) ; Zhongguancun Academy(中关村学院)
AI总结 提出ImageWAM框架,利用预训练图像编辑模型替代视频生成进行机器人动作预测,通过编辑去噪的KV缓存作为世界动作上下文,在多个模拟和真实实验中优于基线,计算量降至1/6,延迟降至1/4。
Comments Project Page: https://zhangwenyao1.github.io/ImageWAM/
层拉普拉斯算子:分布式传感网络中数据融合与共识的拓扑框架
AI总结 提出层理论作为传统图模型的替代,利用层拉普拉斯算子实现异构分布式传感网络中的数据融合与共识。
边缘设备上LLM LoRA微调峰值内存降低技术
发表机构 * GitHub
AI总结 针对边缘设备上LLM LoRA微调的内存瓶颈,提出四种互补技术(量化、检查点、softmax近似、logits掩码),在Llama-3.2 3B和Qwen-2.5 3B上实现高达26倍和28倍的峰值内存降低。
Comments Hassan Dbouk and Matthias Reisser contributed equally to this work
涌现对齐
发表机构 * CIIRC, Czech Technical University in Prague(捷克理工大学CIIRC)
AI总结 提出一种在线对齐技术,通过引入良心步骤和基于直接偏好优化的对齐损失,使大语言模型在训练、微调、对抗提示和零样本学习中自我纠正非伦理输出。
Comments Rejected from ICML 2026
SPINE: 面向累积故障下量化神经网络的故障注入分析器
AI总结 提出GDB驱动的分析框架SPINE,通过向边缘CPU目标二进制注入累积权重位翻转,生成逐层故障特征,无需重训练或修改代码,指导选择性加固策略。
Comments ACM/IEEE/SBC/SBMICRO Symposium on Integrated Circuits and Systems Design 2026
自主组件集合的范畴与层论语义
AI总结 针对自主组件集合语言SCEL,提出基于范畴论和层论的多层数学模型,将机器人社会建模为拓扑空间上的层,通过层上同调量化系统故障,将分布式系统验证转化为几何分析。
REVEAL++:用于阿尔茨海默病风险视觉-语言视网膜建模的可微分表型分组
发表机构 * University of Virginia(弗吉尼亚大学) ; J. Crayton Pruitt Family Department of Biomedical Engineering, Herbert Wertheim College of Engineering, University of Florida(佛罗里达大学赫伯特·韦特海姆工程学院J. Crayton Pruitt家庭生物医学工程系)
AI总结 提出可微分连续表型相似性权重函数,替代离散分组,在对比学习中端到端学习跨模态对齐与表型结构,提升AD风险预测。
Comments Accepted for publication at MICCAI 2026
ev-flow: 一个可复现的、基于NHTS的合成插电式电动汽车充电行为生成器,适用于美国八个地区
AI总结 提出ev-flow开源Python包,基于2017年全国家庭旅行调查数据,通过九阶段流水线生成美国八个地区的合成插电式电动汽车充电行为,填补了美国本土化、NHTS驱动的充电行为生成工具空白。
Comments 20 pages
区块链系统的拓扑学解释:共识层与去中心化真理的逻辑
AI总结 本文提出用拓扑论(层范畴理论)作为区块链系统的数学语言,将共识过程建模为局部一致性到全局真理的构造,超越传统有限状态机模型。
LLM介导的人机交互在搜索与救援中的应用:专业知识对注意力分配的影响
AI总结 本研究通过模拟搜索救援任务,比较有无大语言模型(LLM)指导的条件,结合眼动追踪和行为分析,发现LLM提升任务效率但未增加总救援人数,并揭示了注意力-指导权衡,其中专业知识调节了用户对AI的依赖模式。
非惯性地面上仿人机器人的本体感觉不变状态估计
发表机构 * Purdue University(普渡大学)
AI总结 提出一种仅使用本体感觉的InEKF方法,利用足部IMU和运动学约束,实现非惯性地面上仿人机器人的实时状态估计,收敛速度提升96%,位置误差降低80%。
LLM 不知道它不知道什么:通过跨模型归因分歧检测临床表格数据上的认知盲点
发表机构 * Centific AI Research(Centific AI研究)
AI总结 研究大语言模型在结构化临床数据上的认知不确定性,通过跨模型归因分歧分析,发现其口头置信度空洞、存在逆难度效应,并提出基于归因分歧的校准方法,无需训练即可提升准确率并降低校准误差。
Comments Accepted at EIML@ICML 2026
模拟沙地中的机器人运动:开源物理引擎中的阻力理论
发表机构 * Case Western Reserve University(凯斯西储大学) ; University of Vermont(佛蒙特大学)
AI总结 将三维颗粒阻力理论(3D RFT)集成到MuJoCo物理引擎中,实现沙地行走模拟,验证了足端形状、速度和负载对运动的影响,并在六足机器人实验中预测行走距离和沉陷误差在20%以内。
Comments 12 pages, 7 figures
DeXposure-Claw: 一个用于DeFi风险监管的智能体系统
发表机构 * University of Edinburgh(爱丁堡大学) ; University of Glasgow(格拉斯哥大学) ; University of Cambridge(剑桥大学)
AI总结 针对DeFi监管中LLM智能体易误报的问题,提出DeXposure-Claw系统,通过图时间序列基础模型预测风险网络,结合确定性监控和置信度门控生成可审计监管票据,并构建六轴评估基准DeXposure-Bench,实验验证有效性。