A Multi-Agent Framework for Feature-Constrained Difficulty Control in Reading Comprehension Item Generation
一种用于特征约束难度控制的多智能体框架(在阅读理解项目生成中)
AI总结 本文提出MAFIG多智能体框架,通过多个LLM代理和特征特定评估器协作生成并迭代修订项目,以满足特征约束,从而实现更稳定的难度控制。
Comments ACL 2026 Main Conference
一种用于特征约束难度控制的多智能体框架(在阅读理解项目生成中)
AI总结 本文提出MAFIG多智能体框架,通过多个LLM代理和特征特定评估器协作生成并迭代修订项目,以满足特征约束,从而实现更稳定的难度控制。
Comments ACL 2026 Main Conference
ContextFlow:长周期具身智能体的分层任务-状态对齐
AI总结 本文研究了长周期具身智能体中任务-状态不一致问题,提出ContextFlow框架通过显式合同表示阶段、运行时观测转为证据包以及应用作用域更新来实现任务前沿对齐,提高任务执行的连贯性和可审计性。
LSTM网络在时间序列分类中的客观性能评估
AI总结 本文提出了一种评估框架,比较了LSTM分类器与基于模型的期望最大化(EM)分类器在二元时间序列分类中的性能,发现当数据符合假设模型类时,EM分类器表现优异,而LSTM分类器需要更大的噪声统计分离度才能实现可靠的分类,且在模型仅在测量噪声上不同的情况下,其性能低于参考分类器。
Comments Accepted in 2026 29th International Conference on Information Fusion
MetaRA: 多模态大语言模型基于视觉问答系统的元形态鲁棒性评估
AI总结 本文提出MetaRA,一种基于元形态测试的框架,用于评估多模态大语言模型基于视觉问答系统的鲁棒性,通过生成受控的图像-问题输入变体,揭示模型在语言扰动、视觉线索依赖和多模态推理中的弱点。
一种用于在分割可行性条件下可控帕累托前沿学习的两阶段自适应平衡惩罚方法
AI总结 本文提出了一种自适应平衡惩罚算法,用于在分割可行性条件下训练可控帕累托前沿学习的超网络,通过自适应指标驱动的可计算下界,将约束帕累托问题转化为双层标量分割问题,并证明了在标准凸性假设下的完全序列收敛性。
Comments 36 pages, 18 figures, 12 tables. Submitted to Neural Networks (Elsevier)
MMGS: 通过多视图排序基于最优传输的10倍压缩3DGS
AI总结 本文提出了一种基于最优传输聚合的多视图排序方法,通过全局几何分布匹配问题优化高斯参数,实现3DGS的10倍压缩和10倍加速训练速度,同时保持高质量渲染效果。
Comments 19 pages
iGSP:隐式梯度子空间投影用于高效视觉-语言模型的持续学习
AI总结 本文提出iGSP框架,通过隐式梯度子空间投影实现视觉-语言模型的高效持续学习,解决了传统方法在参数效率和任务间对齐一致性上的不足,显著提升了训练效率和知识重用率。
跨范式知识蒸馏:随机森林与深度神经网络之间双向知识转移的综合性研究用于大数据应用
AI总结 本文研究了随机森林与深度神经网络之间双向知识蒸馏,提出了新的方法,通过144次实验展示了双向RF-DL蒸馏在分类和回归任务中的竞争力,同时提供了可解释性和表达性的互补优势。
是什么使合成数据在图像分割中有效
AI总结 本文研究了合成数据在图像分割中的有效性,通过分析最先进的扩散模型生成的合成图像,发现密集场景构成和精细实例保真度是关键因素,并提出了一种统一框架SENSE,以提升分割性能。
Comments Accepted to ICML 2026
理性是否必要且充分?为可解释的虚假信息检测调优大语言模型
AI总结 本文研究了如何通过调优大语言模型(LLM)来提升可解释性虚假信息检测的性能,提出了一种新的数据合成管道LONSREX,用于定位必要且充分的理性,以解决现有方法中因粗粒度标签和过度验证行为导致的理性不足和冗余问题。
Comments Accepted by KDD 2026. 12 pages, 8 figures. Code: https://github.com/wangbing1416/LONSREX
语言模型在 compartmentalization 方面遇到困难
AI总结 研究探讨了大型语言模型在处理统一概念的不同表达方式时的 compartmentalization 问题,发现模型在不同表达方式之间无法有效共享统计信息,导致模型容量浪费和样本效率降低。
Comments 9 pages, 8 figures, plus 9 pages of appendices. Submitted to NeurIPS 2026. Code: https://github.com/vinhowe/compartmentalization. Eval data: https://doi.org/10.5281/zenodo.20171021
EviTrack: 在延迟歧义中选择而非采样
AI总结 本文提出EviTrack框架,通过在潜在轨迹上进行选择而非边际状态,以在延迟歧义中实现更有效的序列推理,其核心方法是基于证据和似然比的轨迹假设选择,从而在数据支持后延迟承诺,优于基于采样的基线方法。
Comments https://github.com/Haq94/EviTrack
重新思考Muon超越预训练:VLA和RLVR中的频谱失败及高频修复
AI总结 本文研究了Muon优化器在预训练之外的局限性,提出Pion通过高频NS迭代机制改进VLA和RLVR任务的性能。
FPED: 一种基于功能网络先验的可解释性脑解码混合专家框架
AI总结 本文提出FPED框架,通过建模不同的功能脑网络作为专家,利用自适应路由机制捕捉其对视觉语义理解的互补贡献,实现可解释的脑解码。
Comments 15 pages,4 figures
迷失在解释中:跨语言解释中的可信度与忠实度的权衡
AI总结 本文研究了跨语言解释中可信度与忠实度之间的权衡,发现以英语为枢纽的解释在与人类理由的一致性上表现更好,但其证据在模型预测中的因果基础较弱。研究发现,英语解释虽然流畅,但与原生语言条件相比,其解释的全面性下降了5.7倍,甚至在任务准确性保持稳定的情况下,也未能保留语义细微差别。因此,建议在输入语言中审计解释,报告多方面的忠实度指标,并将英语解释视为沟通摘要而非忠实的决策轨迹。
DECOR:通过信息操纵理论审计大语言模型的欺骗行为
AI总结 本文提出DECOR框架,基于信息操纵理论,通过细粒度审计实现对大语言模型欺骗行为的有效检测,展示了其在单轮和多轮欺骗检测中的优越性能。
与鲸鱼游泳:对基于权益治理中权力不平衡的分析
AI总结 本文研究了基于权益的投票机制中权力失衡现象,通过计算社会选择理论分析了权益加权投票中权力不平衡的程度,并提供了理论和实证贡献。
AQuaUI: 用于GUI代理的视觉令牌减少方法基于自适应四叉树
AI总结 本文提出AQuaUI,一种无需训练的推理时GUI代理模型的视觉令牌减少方法,利用屏幕截图中的非均匀信息密度,通过自适应四叉树结构保持令牌位置以确保一致性,并通过条件四叉树算法提升多步骤GUI交互的时序一致性,实验表明其在准确性和效率之间取得了改进。
ExECG:用于ECG模型的可解释AI框架
AI总结 本文提出ExECG框架,旨在解决ECG模型在临床应用中缺乏解释性的问题,通过三阶段流程提供可重用和可复现的ECG可解释性。
无需假评分网络的分布匹配蒸馏
AI总结 本文提出无需假评分网络的分布匹配蒸馏(FSF-DMD),通过流图生成器自身诱导的伪速度替代传统假评分网络,实现了分布级校正,并在ImageNet-1K数据集上验证了其有效性。
双通道远程操作与合规6自由度位姿和力感知
AI总结 本文提出了一种基于硬件无关的WinGs操作系统(WOS)中间件的笛卡尔双通道框架,通过低成本的6自由度位姿和力感知末端执行器Delta6实现远程操作,该框架能够稳定跟踪高达120±40ms延迟和1%丢包率的系统,并在接触时匹配规定的虚拟刚度。
Comments 8 pages, 16 figures, 2 tables. Preprint
因果证据:模态冲突幻觉中的注意力头不平衡
AI总结 本文研究了多模态大语言模型在模态冲突中产生幻觉的原因,通过分析注意力头的因果作用,发现驱动幻觉的头部分布更广且权重更大,而抑制幻觉的头部集中在少量重要头部,提出MACI方法在减少幻觉的同时保持准确性。
超越外推:基于双向启发的知识利用范式用于时间序列预测
AI总结 本文提出了一种新的时间序列预测范式KUP-BI,通过从训练历史库中提炼出延续式知识,为双向预测提供结构化知识,从而提升预测性能。
Comments Accepted to ICML 2026. 18 pages, 6 figures
结构化开放端NAS:利用LLM进行半自动设计知识结构化以实现高效的神经架构搜索
AI总结 本文提出一种半自动方法,利用LLM结构化模型设计知识,以指导神经架构搜索过程,通过定义高层结构模板和引入FairNAD算法,实现了高效的开放端搜索空间探索,提升了在多个数据集上的性能。
Comments 42 pages
利用局部距离进行数据的欧几里得嵌入
AI总结 本文研究了在仅给定局部距离图的情况下恢复全局一致的欧几里得嵌入问题,提出了一种能够最优表示这些距离的方法。该方法仅在由成对距离加权的邻域图上操作,不需要任何先前的数据向量表示。通过求解一个变分问题,将图上的局部距离与由嵌入函数微分诱导的欧几里得度量匹配。所得的欧拉-拉格朗日方程以坐标自由形式推导,允许仅从距离图直接评估所有算子。尽管非线性和缺少非线性的显式表达式,这些方程被证明可以作为迭代更新的稀疏线性问题解决。本文的主要贡献包括:(a)推导出在连续体中支配最优欧几里得嵌入的功能方程;(b)一种不依赖于特征向量的表示形式,仅需要邻域距离图;(c)基于纯粹局部图操作的估计程序。我们在合成流形和真实数据集上实验性地评估了所得到的非参数算法,证明了在保持局部度量结构和邻近关系的同时,能够近似全局等距嵌入。
PhyWorld: 用于视频生成的物理忠实世界模型
AI总结 本文提出PhyWorld,一种通过两阶段训练提升视频生成模型的物理忠实性,以改进世界模拟器的性能,从而更有效地支持物理AI系统。
GAE在不完全信息自博弈强化学习中表现不足
AI总结 本文研究了不完全信息博弈中自博弈强化学习中GAE估计器的方差问题,提出Q-boosting和VRPO算法以减少方差并提升性能。
人工智能技术在语言接入中的应用:对人工智能的态度以及语言接入管理者的人类价值
AI总结 本文探讨了人工智能在语言接入中的影响,通过分析十位美国语言接入管理者在医疗、法庭、公共服务和地方政府领域的半结构化访谈,揭示了语言接入管理者对人工智能的有条件乐观态度以及对人工智能实施中人类价值和人类监督的高度重视。
Comments 11 pages, 2 tables, Convergence Conference 2026
DeRegiME:用于分布偏移下概率预测的深度制度混合
AI总结 DeRegiME通过引入稀疏变分高斯过程,实现了概率预测中的制度混合,解决了神经预测器在处理分布偏移时的不足,提升了预测密度的准确性。
通过样本难度去相关性实现鲁棒的年龄依赖性混杂效应缓解
AI总结 本文提出了一种鲁棒框架,通过针对虚假的年龄相关趋势而非强制不变性来缓解年龄依赖性混杂效应,通过样本难度建模和去相关年龄与主导年龄难度趋势,减少年龄相关的真阳性与假阳性差异,同时保持临床有意义的非线性年龄信息。
Comments 10 Pages, 3 Figures