Riemannian Gradient Descent for Low-Rank Architectures
低秩架构的黎曼梯度下降
AI总结 针对低秩矩阵参数,探索黎曼优化技术,并在小语言模型的多头注意力参数上应用,但未显著优于AdamW基线。
低秩架构的黎曼梯度下降
AI总结 针对低秩矩阵参数,探索黎曼优化技术,并在小语言模型的多头注意力参数上应用,但未显著优于AdamW基线。
否决前修复:面向上下文决策的修复增强约束学习
AI总结 提出修复增强约束学习(RACL)框架,将已知修复操作融入分类器语义,在否决前考虑可负担修复,以降低错误否决率并揭示决策规则的可学习性。
Comments 7 pages, 3 figures
统一上下文演化:面向LLM智能体
AI总结 提出统一上下文演化(UCE)框架,通过将智能体经验外部化为四种类型的可演化上下文单元(ECU),实现跨任务的知识积累与动态调度,在ALFWorld和WebShop上显著提升性能。
CEON: 循环经济本体网络
AI总结 为解决循环经济领域跨行业信息共享的语义互操作性问题,提出了循环经济本体网络(CEON),定义了跨行业概念并实现语义感知数据文档化,在建筑、电子和纺织行业场景中验证了其有效性。
模型多重性与再犯风险评估中的预测任意性
AI总结 针对再犯风险评估中的预测任意性问题,通过理论下界推导和实证分析,发现相似精度的模型间预测一致性通常高于最坏情况理论保证,并提出采用最低风险分配策略来缓解任意性。
Comments 17 pages, 12 figures
视觉丰富文档类型分类的多模态方法:一项比较分析
AI总结 针对视觉丰富文档类型分类中多模态建模策略难以系统比较的问题,本文在统一实验框架下对基于Transformer和LLM的四种代表性模型进行受控对比,发现专用多模态Transformer优于LLM方法,且图像信息贡献最大。
TimeBlocks: 基础与持续时间序列块库——扩展版本
AI总结 提出TimeBlocks方法,通过可互换的模块化模型块和路由策略,构建轻量级、多任务的时间序列模型,并引入StreamCore实现持续校准,在多个数据集上优于现有基线。
Comments 15 pages. An extended version of "TimeBlocks: Versatile and Continual Time-Series Blockbase" accepted at SIGKDD 2026
后训练推理数据入门:我们对其运作机制的了解
AI总结 本文综述了后训练推理数据的类型、效用、构建方法和扩展规律,为未来推理数据发布和后训练方案提供归因框架。
Comments 22 pages. Project Repository: https://github.com/RenBing-Sumeru/Awesome-LLM-Reasoning-Data
PortBERT:探索葡萄牙语语言模型的深度
AI总结 本文提出PortBERT,一种基于RoBERTa的葡萄牙语语言模型家族,通过字节级BPE分词和稳定预训练在超过450GB数据上训练,在ExtraGLUE基准上达到竞争性能,并重点分析了训练和推理效率。
一种基于NLP的课程-劳动力市场对齐框架:模式约束的LLM抽取、ESCO锚定的语义匹配和多维差距量化
AI总结 提出一个四阶段NLP框架,通过模式约束的LLM抽取、ESCO语义匹配、仲裁协议和验证机制,实现课程与劳动力市场的对齐,并量化多维供需差距。
Comments 53 pages, 9 figures, 4 tables
车辆再识别中的泛化极限
AI总结 针对车辆再识别任务中模型对未见车辆类型泛化能力差的问题,提出了一种新的评估方法,并通过视角分割分析揭示了现有方法在视角鲁棒性和细节关注上的局限性。
基于梯度计的电磁定位系统实现腔内医疗器械的闭式位姿估计
AI总结 提出一种基于梯度计的电磁定位系统(GELS),利用紧凑型磁力计阵列作为准梯度计估计局部磁场和梯度张量,通过欧拉齐次关系映射为位移,再经多源Procrustes配准实现闭式位姿估计,无需预校准场图或迭代优化。
面向多功能视频编码的边缘导向几何划分
AI总结 针对VVC标准,提出基于时空边缘信息构建最可能模式列表的几何划分模式预测策略,以降低索引开销并提升编码效率,平均BD-rate增益0.58%-1.00%。
Comments This paper has been published in IEEE ICME
HiTokSR: 一种用于高保真真实世界图像超分辨率的具有层次化码本的从粗到细分词器
AI总结 提出HiTokSR层次化标记预测框架,通过将潜在空间沿通道维度划分为频率感知组并独立量化,解耦全局结构与细节,结合视觉基础模型先验和索引级扰动策略,实现真实世界图像超分辨率的最优感知质量和重建保真度。
利用深度学习绘制1984年至2025年巴西小型水库的演变
AI总结 针对巴西小型水库被忽视的问题,采用深度学习计算机视觉模型从Landsat数据中分割小型水库,生成了1984-2025年全国年度水库地图,揭示了水库数量和面积的大幅增长。
Comments 33 pages, 5 figures, 2 tables
自适应数据选择改善低基线性能下的可穿戴预测
AI总结 本研究通过评估多种模态下自适应时间窗口选择策略,发现其能显著提升低基线性能参与者的AUROC(最高提升0.7),而高基线性能者收益有限或为负,且增益与基线性能呈强负相关。
ForestHG-Trace: 大规模森林场景下的可追踪长程生态推理
AI总结 提出ForestHG-Trace框架,通过生态超图表示和LLM引导的确定性工具链,实现森林场景中可追踪的多步生态推理,并构建ForestTraceQA基准,显著提升长程生态问答的准确性和执行忠实度。
Comments It has theoretical flaws and experimental errors
目标重掩码:在离散扩散语言模型中将令牌编辑替换为令牌到掩码的精炼
AI总结 针对离散掩码扩散语言模型中令牌编辑机制的局限性,提出无训练的令牌到掩码重掩码方法,通过将疑似错误令牌重置为掩码状态,利用扩散过程在更干净上下文中重新预测,显著提升数学等任务的性能。
Comments This paper has been significantly revised, expanded, and superseded by a more comprehensive version available at arXiv:2604.18738. The authors have chosen to withdraw this version to avoid overlap and direct readers to the updated work
评估深度研究代理在专家咨询工作中的表现:一个包含验证器、评分标准和认知陷阱的基准
AI总结 本文提出一个基准,通过42个专家编写的任务,使用确定性验证器和五维度评分标准评估三个前沿深度研究代理(Claude、OpenAI o3、Gemini)在管理咨询类结构化分析交付物上的表现,并嵌入认知陷阱,发现所有代理的联合接受率均较低(最高21.4%),且各有独特失败模式。
Comments Updating the paper with more data. Will resubmit
基于广义执行器网络的肌肉驱动机器人仿真到现实迁移
AI总结 提出广义执行器网络(GenAN),通过从关节位置轨迹学习执行器模型,实现肌肉驱动机器人从仿真到现实的策略迁移,首次成功在四自由度肌肉驱动机器人臂上完成动态任务。
高度可变形本体感觉膜用于实时三维形状重建
AI总结 提出一种基于光波导传感的柔性可拉伸本体感觉硅胶膜,通过数据驱动模型解码变形相关光强信号,实现实时三维形状重建,在140mm方形膜上达到90Hz更新率和1.307mm平均重建误差。
Comments 13 pages, 9 figures
面向农业运行设计域:一个框架
AI总结 针对农业自主系统在复杂多变环境中运行的特殊挑战,提出包含Ag-ODD描述概念、7层模型和迭代验证过程的农业运行设计域框架,以实现环境描述的结构化、透明化和可验证性。
Comments 18 pages, 7 figures, 2 tables
OncoReason: 在大语言模型中构建临床推理以实现稳健且可解释的生存预测
AI总结 提出统一多任务学习框架,通过监督微调、思维链提示和强化学习三种对齐策略,使自回归大语言模型在MSK-CHORD数据集上联合进行二元生存分类、连续生存时间回归和自然语言理由生成,实现可解释的生存预测。
Comments This manuscript is withdrawn to allow careful review and correction of bibliographic issues identified after submission, including references that could not be adequately verified. These matters should be resolved before further circulation
仅捕获一个:用于模型特定授权的不可迁移样本
AI总结 提出不可迁移样本(NTEs),通过将数据编码为仅能被指定模型解码的“密文”,在无需训练的情况下利用模型特定低敏感子空间实现授权模型保真度与未授权模型性能退化。
FM-IRL:强化学习中用于奖励建模与策略正则化的流匹配
AI总结 提出利用流匹配(FM)模型作为教师,通过奖励建模和策略正则化,指导简单MLP结构的学生策略进行在线强化学习,从而解决FM策略在线交互不稳定和效率低的问题。
Comments We have submitted a new version of this paper to arxiv (with new framing and title), arXiv:2605.27095. To avoid the misunderstanding of the readers, we request to withdraw the old-version of this paper
同时多目标对齐:可验证与不可验证奖励
AI总结 提出MAHALO框架,通过标准化PRM训练、多动作头DPO和PRM引导解码,实现大语言模型在可验证与不可验证奖励上的多目标对齐,减少目标冲突并支持推理时控制。
Comments ICML 2026
GeistBERT: 为德语 NLP 注入活力
AI总结 通过在大规模德语语料库上使用 RoBERTa 架构和 Whole Word Masking 进行增量预训练,GeistBERT 在多项德语 NLP 任务上取得了领先性能,并在 GermEval 2018 细粒度文本分类中达到新 SOTA。
多标签特征选择的隐式正则化
AI总结 针对多标签学习中的特征选择问题,提出一种基于隐式正则化和标签嵌入的估计器,通过Hadamard积参数化避免显式正则化项的额外偏差,实验表明该方法可减少偏差并可能导致良性过拟合。
Comments 14 pages, 11 figures, Submitted for publication and currently under review
马来西亚英语新闻解码:用于命名实体和关系抽取的语言资源
AI总结 针对马来西亚英语与标准英语的差异导致NLP任务困难的问题,构建了包含200篇新闻的MEN数据集,手动标注实体和关系,并通过微调spaCy NER工具验证了定制数据集能显著提升NER性能。
Comments Accepted at LREC-COLING 2024
审计金融大语言模型中的资产特定偏好:来自比特币表征与投资组合配置的证据
AI总结 本研究通过三级审计协议,发现大型语言模型对比特币存在框架依赖的偏好,并识别出模型内部一个可因果干预的比特币选择性特征,该特征能显著影响下游投资组合配置。
Comments 28 pages, 5 figures, 18 tables