A Neuro-Symbolic Approach for Reliable Proof Generation with LLMs: A Case Study in Euclidean Geometry
一种用于LLM可靠证明生成的神经符号方法:以欧几里得几何为例
AI总结 提出一种结合LLM生成能力与结构化组件的神经符号方法,通过类比问题检索和形式验证器反馈,显著提升欧几里得几何证明的准确性。
Comments long paper
一种用于LLM可靠证明生成的神经符号方法:以欧几里得几何为例
AI总结 提出一种结合LLM生成能力与结构化组件的神经符号方法,通过类比问题检索和形式验证器反馈,显著提升欧几里得几何证明的准确性。
Comments long paper
通过弱到强学习实现可泛化的视频质量评估
AI总结 提出弱到强学习框架,结合同质/异质监督信号和迭代训练,无需人工标注即可提升视频质量评估的泛化能力。
Comments Accepted by CVPR 2026
上下文感知的接地教师用于无源目标检测
AI总结 针对无源目标检测中类别不平衡导致的上下文偏差和噪声伪标签问题,提出一种基于关系上下文模块和语义增强的偏差感知框架Grounded Teacher,通过关系正则化和语义增强提升少数类检测性能。
Comments Accepted in International Journal of Computer Vision (IJCV); Project Webpage: https://tajamul21.github.io/Grounded_Teacher/
在文本属性图中整合结构信号与语义信号:BiGTex
AI总结 提出BiGTex架构,通过堆叠图-文本融合单元实现GNN与LLM的双向注意力,以参数高效微调(LoRA)在节点分类和链接预测任务上达到最优性能。
Comments 26 pages, 4 figures
利用大语言模型发现算法:进化搜索遇见强化学习
AI总结 提出通过强化学习微调持续优化大语言模型,结合进化搜索加速发现更优算法,在组合优化任务上验证有效性。
Comments 34 pages
用于修复不完整环PET图像的两阶段深度学习框架
AI总结 提出一种两阶段深度学习框架,无需飞行时间信息,通过投影域注意力U-Net预测缺失正弦图部分和级联U-Net与热启动扩散模型进行图像细化,从约50%缺失符合事件的不完整环数据中恢复高质量PET图像。
Comments 17 pages, 5 figures
学习双射曲面参数化以通过网格变形从稀疏点云推断符号距离函数
AI总结 提出一种动态变形网络结合双射曲面参数化和网格变形优化的方法,从稀疏点云端到端预测符号距离函数,显著优于现有方法。
Comments Accepted by Conference on Computer Vision and Pattern Recognition (CVPR) 2025. Project page:https://takeshie.github.io/Bijective-SDF
Rademacher复杂度和Dudley熵积分的泛化误差界的Lean形式化
AI总结 本文在Lean 4中形式化了基于Rademacher复杂度的泛化误差界,通过形式化对称化论证、有界差异分析和McDiarmid不等式,并扩展到可数假设类及可分离拓扑索引集,最后应用得到线性预测器的经验Rademacher界和Dudley熵积分界。
Comments accepted at ITP2026
说服应该是双盲的:基于因果心智理论的多领域对话数据集
AI总结 提出基于因果心智理论的多智能体框架ToMMA构建双盲说服对话数据集CToMPersu,以解决现有数据集信息泄露问题,提升对话真实性和说服力。
Comments 6 pages
语用推理提升LLM代码生成
AI总结 提出CodeRSA方法,通过局部语用竞赛对候选代码进行重排序,以解决自然语言到代码生成中的歧义问题,在多个基准测试中取得最佳平均准确率。
WorldGUI: 一个从任意起点进行桌面GUI自动化的交互式基准测试
AI总结 提出WorldGUI基准测试,覆盖10个桌面和Web应用,在多种系统构建的初始状态下评估GUI代理的规划鲁棒性,并引入WorldGUI-Agent框架通过三阶段批评提升动态环境下的可靠性。
Comments Technique Report
Kolmogorov-Arnold 傅里叶网络
AI总结 针对KAN网络参数爆炸和高维任务中高频特征捕获能力不足的问题,提出Kolmogorov-Arnold傅里叶网络(KAF),通过谱重参数化将局部B样条表示转换为全局自适应谱表示,引入可训练随机傅里叶特征和自适应混合GELU-傅里叶激活机制,在CV、NLP、音频和PDE求解任务上取得最优性能。
Comments Code:https://github.com/kolmogorovArnoldFourierNetwork/KAF
联邦草图LoRA:一种用于异构协作微调大语言模型的灵活框架
AI总结 针对资源受限客户端上大语言模型微调中的异构性问题,提出联邦草图LoRA(FSLoRA),通过草图机制让客户端选择性更新服务器维护的全局LoRA模块子矩阵,并利用草图比例灵活适应客户端约束,提供收敛性分析,实验表明优于基线并提升训练效率。
Comments We propose Federated Sketching LoRA (FSLoRA), a theoretically grounded methodology for collaborative LLM fine-tuning that retains LoRA's flexibility while adapting to the communication and computational capabilities of individual clients
ReactEmbed: 一种基于生化反应网络统一蛋白质-分子表示的可插拔模块
AI总结 提出ReactEmbed模块,利用生化反应网络对齐蛋白质和分子嵌入,实现跨域统一表示,无需重新训练。
GDformer:超越子序列隔离的多变量时间序列异常检测
AI总结 提出全局字典增强Transformer(GDformer),通过基于字典的交叉注意力机制学习整个序列中所有正常点的全局表示,并利用原型捕获正常点-全局相关权重分布,实现基于表示相似性的统一检测准则,在五个基准数据集上达到最先进性能。
基于扩散模型的姿态引导人物图像合成的融合嵌入
AI总结 提出FPDM框架,通过对比学习显式对齐融合源-姿态嵌入与目标图像嵌入,并作为条件信号生成,解决姿态引导人物图像合成中纹理保真度和一致性问题。
MambaBEV:基于Mamba2的BEV三维检测模型
AI总结 提出MambaBEV模型,利用Mamba2状态空间模型通过TemporalMamba时序融合模块和Mamba-based DETR头增强全局上下文建模,提升自动驾驶中大型物体的3D检测精度。
Comments ICPR2026
DeIDClinic:面向临床文本去标识化和重识别风险评估的风险感知假名化框架
AI总结 提出DeIDClinic多层框架,集成领域自适应变换器模型(BioBERT、ClinicalBERT)和文档级风险评估模块(k-匿名、l-多样性、t-接近度等),在i2b2 2014数据集上实现高F1分数,支持隐私保护数据共享。
Comments Accepted by and Presented at: LEGAL-CALD-Pseudo2026 @LREC2026
探究网络剪枝对性能与可解释性的影响
AI总结 本文通过系统应用非结构化、结构化剪枝及连接稀疏方法,研究不同剪枝技术对GoogLeNet在ImageNet验证集上的分类性能和可解释性的影响,发现充分重训练后性能可接近甚至超越原始网络,且可解释性评分与剪枝率无显著关联。
Comments 4 pages, 6 figures
SMAFormer: 协同多注意力Transformer用于医学图像分割
AI总结 提出SMAFormer,一种融合像素注意力、通道注意力和空间注意力的Transformer架构,通过协同多注意力块和特征融合调制器提升小肿瘤和器官的分割性能。
Comments Accepted by IEEE BIBM 2024
EgoExo++:结合按需外中心视觉与2.5D地面估计的水下ROV交互式遥操作
AI总结 针对水下ROV遥操作视野受限问题,提出EgoExo++方法,通过几何驱动的视觉SLAM合成外中心视图并实时估计2.5D地面,提升操作性能和用户体验。
Comments EgoExo++ (Accepted in IJRR), V7/V3, metadata updated, 16 pages
一群大脑的智慧:通用大脑编码器
AI总结 提出一种基于体素中心架构的通用大脑编码器,通过跨注意力机制联合多主体/数据集/机器的fMRI数据,提升个体编码性能并实现快速迁移学习。
DELTA:可变形多连杆多旋翼飞行器的设计、控制与运动策略——用于空地混合运动与操作
AI总结 本文提出一种新型多连杆多旋翼机器人DELTA,通过在每个连杆上安装推进器并利用关节驱动,实现了地面滚动、空中飞行及多种环境下的操作能力,并设计了基于非线性优化的实时控制方法和考虑接触约束的运动策略。
Comments 20 pages, 31 figures
全局 $\mathcal{L}^2$ 最小化:通过深度学习中的几何自适应梯度下降实现均匀指数速率
AI总结 本文利用微分几何中黎曼度量的任意性,提出两种改进的梯度下降流(过参数化和欠参数化设置),在秩条件成立时证明其以均匀指数收敛速率驱动 $\mathcal{L}^2$ 代价到全局最小值,并推广到秩条件不成立的情形。
Comments AMS Latex, 21 pages. Typos corrected, references and comments added
具有认证数据遗忘的可遗忘联邦线性学习
AI总结 提出一种基于预训练模型线性近似的联邦遗忘框架,通过联邦线性训练实现高效、安全且可认证的客户端数据遗忘。
Comments IEEE Transactions on Neural Networks and Learning Systems
对极端运动鲁棒的激光雷达扫描配准
AI总结 针对极端运动下点云畸变导致配准失败的问题,提出一种考虑轨迹运动不确定性和环境几何的去畸变方法,在200 m/s^2和800 rad/s^2的峰值加速度下,平移误差降低9.26%,旋转误差降低21.84%。
Comments 8 pages, 8 figures, published in 2021 18th Conference on Robots and Vision (CRV), Burnaby, Canada
我们究竟在解码什么?非侵入式脑到语言检索的源归因
AI总结 针对非侵入式神经语言解码中结果被非刺激诱发源(如解码器先验、嵌入度量、信号时长等)膨胀的问题,提出一个审计框架,通过结构捷径、窗口级刺激锁定证据和跨窗口上下文聚合三种源分离,并引入组上下文偏差(GCB)作为可控的源归因干预,实现性能的源归因而非仅报告。
Comments 35 pages, 7 figures, 25 tables
MindAlign: 弥合脑电图、视觉和语言实现零样本视觉解码
AI总结 提出一种三模态对比学习框架MindAlign,通过对齐脑电图、图像和文本表示,在Things-EEG2零样本基准上实现54.1% Top-1和83.4% Top-5准确率,显著超越先前方法。
Comments 20 pages, 10 figures, 15 tables
语法引导的稀疏注意力:高效且可解释的Transformer
AI总结 提出语法引导的稀疏注意力方法,通过词性标签动态生成注意力掩码,在保持精度的同时降低计算复杂度。
Comments 9 pages, 2 tables Code available at https://github.com/toughthinktank/grammatically_guided_attention#
ECHO: 终端代理免费学习世界模型
AI总结 提出ECHO混合目标,通过预测环境观测令牌将终端反馈转化为密集监督信号,显著提升CLI代理在TerminalBench-2.0上的性能。