Implicit Causal Graph Construction in Text via Chain Discovery
通过链发现实现文本中的隐式因果图构建
发表机构 * KU Leuven(鲁汶大学) ; Ghent University(根特大学)
AI总结 研究利用大语言模型从文本因果对中推断中间事件以构建隐式因果图,比较端到端构建与因果链发现方法,并探索多模型集成策略,基于1560个科学验证因果对评估。
通过链发现实现文本中的隐式因果图构建
发表机构 * KU Leuven(鲁汶大学) ; Ghent University(根特大学)
AI总结 研究利用大语言模型从文本因果对中推断中间事件以构建隐式因果图,比较端到端构建与因果链发现方法,并探索多模型集成策略,基于1560个科学验证因果对评估。
ABLE:基于归因的大模型嵌入表示与映射
发表机构 * The Hong Kong University of Science and Technology (Guangzhou)(香港科技大学(广州)) ; Deep Interdisciplinary Intelligence Lab (DI2 Lab)(深度跨学科智能实验室(DI2 Lab))
AI总结 提出ABLE框架,利用梯度特征归因和分词器无关的词级对齐构建模型嵌入,实现异构LLM的高效比较,在关系预测、模型路由和基准分数预测上表现优异。
面向尼泊尔法律领域问答的检索增强生成框架
发表机构 * Dublin City University(都柏林城市大学)
AI总结 提出首个基于检索增强生成的尼泊尔法律问答模型,利用BM25和E5模型检索案例法,实现91%的top-1精度和74%的生成答案可信度。
通过微调语言模型中的语义偏移检测社区特定俚语和实体
发表机构 * Georgia Institute of Technology(佐治亚理工学院)
AI总结 提出无监督方法,通过测量词在微调前后的语义偏移幅度,从在线社区文本中自动识别俚语、独特实体和民俗用语。
Comments 6 pages, 6 figures, 2 tables
评估领域自适应大语言模型中的幻觉现象
发表机构 * College of Computing, Georgia Institute of Technology(佐治亚理工学院计算学院)
AI总结 本研究通过微调Llama-2模型,测试其记忆、回忆和推理能力,发现领域自适应大语言模型在生成新领域特定信息时存在幻觉问题,表明仅靠微调难以有效缓解幻觉。
Comments 13 pages, 2 figures, 3 tables
TinyJudge: 通过轻量级专家集成实现不可验证约束对齐
发表机构 * Harbin Institute of Technology SCIR Lab(哈尔滨工业大学SCIR实验室) ; Peking University(北京大学) ; Huawei Technologies Co., Ltd(华为技术有限公司)
AI总结 针对LLM遵循不可验证约束时奖励黑客和计算开销大的问题,提出TinyJudge框架,利用多个小型语言模型集成提供奖励,在五个基准上平均性能提升约10%,奖励精度提升12%,训练速度提升3倍。
Comments ACL 2026 Main Conference;15 pages, 9 figures
代码与文本之间的双向小粒度搜索
发表机构 * Lex Machina ; The University of Arizona(亚利桑那大学)
AI总结 提出双向小粒度搜索任务,通过自动生成数据训练模型,实现科学出版物文本与代码片段间的直接链接,支持跨模态检索。
GP-Adapter: 基于高斯过程的CLIP适配器用于少样本分布外检测
发表机构 * st Taisei Saito(第一作者) ; nd Koretaka Ogata(第二作者) ; rd Takafumi Hiroi(第三作者)
AI总结 提出GP-Adapter,一种无需训练的框架,通过高斯过程不确定性建模增强CLIP,用于少样本分类和分布外检测,无需微调骨干网络,仅依赖少量缓存和轻量超参数选择。
Comments 8 pages, 6 figures, Accepted at IJCNN 2026
使用语言模型嵌入建模自定步速阅读中的语义关联
发表机构 * Department of Computational Cognitive Science, Tilburg University(蒂尔堡大学计算认知科学系) ; Center for Humanities Computing, Aarhus University(奥胡斯大学人文计算中心)
AI总结 本研究使用语言模型嵌入的十种实现方式量化语义关联,通过贝叶斯模型分析其对N400和自定步速阅读时间的影响,发现句子嵌入能可靠捕捉超出词可预测性的语义关联。
平均场博弈中考虑共同噪声的群体感知模仿学习
发表机构 * Institut National des Sciences et Techniques de l'Information et des Systèmes (INSTI)(信息与系统科学与技术国家研究院)
AI总结 针对含共同噪声的平均场博弈,提出群体感知模仿学习框架,通过行为克隆和对抗散度两种代理,建立有限样本误差界,并利用广义虚拟博弈和深度学习计算专家策略,实验证明群体感知策略对应对随机性的重要性。
稀疏记忆微调:作为LoRA和全微调的低遗忘替代方案
发表机构 * University of Washington(华盛顿大学)
AI总结 提出稀疏记忆微调(SMF),通过添加键值记忆层并仅更新当前批次最活跃的记忆行,在MedMCQA任务上提升2.5个百分点,同时将遗忘探针(WikiText困惑度和TriviaQA准确率)控制在基线的1个百分点内,优于LoRA和全微调。
自我挖掘的难度用于安全微调
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 提出通过模型自身生成结果评估提示难度,对最难的提示进行安全微调,在Llama-3模型上将攻击成功率降至1-3%,但增加了拒绝率,通过混合良性提示可平衡性能。
可执行世界模型在编码智能体时代的ARC-AGI-3应用
发表机构 * SingularityNET
AI总结 提出一种编码智能体系统,通过维护可执行Python世界模型、验证观察、重构简化抽象和模型内规划,在ARC-AGI-3游戏中取得初步成果,GPT-5.5高推理下完全解决15个游戏。
Comments 13 pages. Accepted for publication at AGI-2026
APEX:面向AI生成音乐的大规模多任务美学感知流行度预测
发表机构 * AMAAI Lab, Singapore University of Technology and Design(新加坡科技设计大学AMAAI实验室)
AI总结 提出APEX框架,利用MERT音频嵌入联合预测AI生成音乐的流行度指标与五维美学质量,在Music Arena数据集上验证了美学特征对偏好预测的泛化能力。
基于对比分层消融的大语言模型神经元锚定规则提取
发表机构 * Università della Svizzera italiana(瑞士意大利大学)
AI总结 提出MechaRule方法,通过定位稀疏激动剂激活将规则提取锚定在LLM电路中,利用自适应组测试和置信引导剪枝,以极低代价高召回率识别关键神经元,并在算术和越狱任务中验证其有效性。
Comments Accepted for publication at KDD'2026
核仿射包机作为冻结语义空间的计算高效编码器
发表机构 * University of Rostock(罗斯托克大学) ; Software Competence Center Hagenberg GmbH(海根堡软件竞争力中心)
AI总结 提出核仿射包机(KAHM)作为轻量级查询编码器,在固定教师表示空间下,通过RKHS中的后验权重估计替代神经网络编码,实现计算高效且性能优异的语义检索。
Embody4D: 面向具身4D世界建模的通用数据引擎
发表机构 * Zhejiang University(浙江大学) ; Beijing Zhongguancun Academy(北京中关村学院) ; University of Science and Technology of China(中国科学技术大学) ; Institute of Automation, Chinese Academy of Sciences(中国科学院自动化研究所) ; Shanghai Jiao Tong University(上海交通大学) ; Beihang University(北京航空航天大学)
AI总结 提出Embody4D视频到视频世界模型,通过3D感知合成管道、潜在置信度专家调制和交互注意力机制,将单目机器人视频转换为多视角视频,解决具身智能中视角稀疏问题,提升下游规划与学习性能。
从加密智能手机网络流量中学习行为信号
发表机构 * New York University(纽约大学) ; NYU Langone Health(NYU Langone健康) ; NYU Grossman School of Medicine(NYU Grossman医学院) ; Oregon Health & Science University(俄勒冈健康与科学大学) ; Columbia University(哥伦比亚大学) ; Harvard Medical School(哈佛医学院)
AI总结 本文利用基于Transformer的模型从加密网络流量中学习行为表征,结合用户特定适配器,并通过稀疏表示和广义估计方程分析,发现压力、孤独感和睡眠障碍分别与个体间差异、个体内波动及两者组合相关,且学习到的表征优于传统手工特征。
Comments 19 pages, 6 figures
唇读差距:VSR模型是否像人类唇读者一样感知视觉语音?
发表机构 * Sigmedia Group(Sigmedia集团) ; School of Engineering(工程学院) ; Trinity College Dublin(都柏林大学)
AI总结 通过对比VSR系统与人类在MaFI数据集上的表现,发现模型虽整体准确率更高,但错误模式与人类不同,主要依赖训练数据中的语言线索而非视觉感知。
Comments Accepted at INTERSPEECH 2026
OpenGlass:用于设备上基于事件的手势识别的开源智能眼镜
发表机构 * Department of Information Technology and Electrical Engineering, ETH Zürich(信息科技与电气工程系,瑞士联邦理工学院)
AI总结 提出开源智能眼镜平台OpenGlass,采用模块化设计、事件驱动电源管理和GAP9 RISC-V SoC,实现低功耗设备上ML,在LynX数据集上达到83.94%的跨主体手势识别准确率。
DisPOSE: 投影多随机扩散用于自监督多视图3D人体姿态估计
发表机构 * Imperial College London(伦敦帝国学院) ; Technical University of Munich(慕尼黑技术大学)
AI总结 提出DisPOSE框架,将多视图人员分配问题建模为多随机张量空间上的生成扩散过程,通过可微Sinkhorn投影和超图卷积解码器实现自监督3D人体姿态估计,在标准数据集和手术室遮挡场景中表现优异。
编码智能体会欺骗我们吗?通过带随机测试的上限评估检测和防止作弊
发表机构 * The University of Tokyo(东京大学) ; RIKEN(理化学研究所)
AI总结 提出CapCode框架,通过设置上限评估检测模型在编码任务中的作弊行为,并设计CapReward奖励机制防止作弊,实验表明该方法能有效检测和减少作弊。
QuadVerse:一种对齐视觉-物理现实用于四足仿真的集成框架
发表机构 * Nanjing University(南京大学) ; BUPT(北京邮电大学) ; DEXMAL ; Tsinghua University(清华大学)
AI总结 提出QuadVerse框架,通过重建场景校准视觉、物理和致动器,利用3DGS和接触校准减少仿真到现实的差距,实现零样本视觉导航策略部署。
DyCon: 通过演化难度建模的动态推理控制
发表机构 * Harbin Institute of Technology, Shenzhen(哈尔滨工业大学(深圳)) ; Zhongguancun Academy(中关村学院) ; Huawei Noah’s Ark Lab(华为诺亚实验室) ; Shenzhen Loop Area Institute(深圳环城研究院) ; Tsinghua University(清华大学)
AI总结 提出DyCon框架,利用步骤级嵌入动态建模推理过程中的难度演化,无需训练即可控制推理深度,减少冗余步骤,提升效率且不损失准确性。
Comments Accepted at ICML 2026
Front-to-Attractors:修改双向搜索中的Front-to-Front启发式
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 提出Front-to-Attractors (F2A)启发式类,通过动态维护吸引子集替代完整前沿,在保持Front-to-Front信息性的同时大幅降低计算开销,实验显示相比F2F减少最多11.2倍成对评估,平均节点扩展比F2E少4.8倍。
ThinkBooster: 一种用于LLM推理无缝测试时扩展的统一框架
发表机构 * MBZUAI ; ETH Zürich(苏黎世联邦理工学院) ; Imperial College London(伦敦帝国理工学院) ; NUS(国立大学新加坡) ; Accenture(埃森哲) ; Innopolis University(因诺普里斯大学) ; Independent Researcher(独立研究者)
AI总结 提出ThinkBooster框架,通过模块化库、联合评估基准和可部署代理服务,实现LLM推理的测试时计算扩展,在数学和编码任务上验证了性能-计算权衡。
并行连续局部搜索研究
发表机构 * School of Computing, Australian National University(澳大利亚国立大学计算机学院)
AI总结 研究并行连续局部搜索(CLS)在对称伪布尔约束可满足性问题中的应用,发现冗余约束会抑制收敛,CLS在混合求解中能快速完成部分赋值,且局部搜索因鞍点密集目标而快速收敛到稳定解质量分布。
基于多尺度特征注意力网络的太赫兹双梳光谱聚合物分类
发表机构 * Instituto Universitario de Investigación e Innovación en Tecnología Centrada en el Ser Humano, HUMAN-tech, Universitat Politècnica de València(人类中心技术大学研究与创新研究所,HUMAN-tech,巴塞罗那理工大学) ; Department of Electronic Technology, Universidad Carlos III de Madrid(电子技术系,马德里卡洛斯三世大学) ; Artikode Intelligence S.L.
AI总结 提出多尺度特征注意力网络(MSFAN),结合特征门控和多尺度并行卷积,利用太赫兹双梳光谱对12种聚合物进行分类,准确率达85.2%。
Comments Accepted in EUSIPCO'26
修正语境,转变模拟立场:审计基于LLM的在线讨论立场模拟
发表机构 * Fudan University(复旦大学) ; University of Rochester(罗切斯特大学) ; Shanghai Innovation Institute(上海创新研究院)
AI总结 本研究通过反事实语境修正框架审计LLM立场模拟,对比纯文本与多模态策略,评估平均方向性立场转变和立场转换率,揭示语境敏感性的有效性与鲁棒性。
放射学中比较推理的视觉语言框架
发表机构 * University of Science and Technology of China(中国科学技术大学) ; Shanghai Artificial Intelligence Laboratory(上海人工智能实验室) ; School of Artificial Intelligence, Shanghai Jiao Tong University(上海交通大学人工智能学院) ; Department of Biomedical Informatics, Harvard Medical School(哈佛医学院生物医学信息学系) ; Department of Radiology, Renmin Hospital of Wuhan University(武汉大学仁民医院放射科) ; Shanghai Sixth People’s Hospital Affiliated to Shanghai Jiao Tong University(上海交通大学附属第六人民医院)
AI总结 提出一个实体感知的跨图像推理框架,通过构建大规模比较影像数据集MedReCo-DB和开发MedReCo及MedReCo-VLM模型,实现了参考病例检索和时间比较解读,显著提升了放射学比较推理性能。