The Bi-Channel Networking Paradigm for Database Systems in the Cloud
云数据库系统的双通道网络范式
AI总结 针对现代高速云网络中内核TCP栈成为数据库性能瓶颈的问题,提出双通道网络范式,将通信分离为高性能数据路径和可靠控制路径,结合用户空间UDP与内核TCP,在分布式shuffle和复制键值存储中实现高吞吐与低开销。
Comments Accepted to EDBT 2027 (Lille, France)
云数据库系统的双通道网络范式
AI总结 针对现代高速云网络中内核TCP栈成为数据库性能瓶颈的问题,提出双通道网络范式,将通信分离为高性能数据路径和可靠控制路径,结合用户空间UDP与内核TCP,在分布式shuffle和复制键值存储中实现高吞吐与低开销。
Comments Accepted to EDBT 2027 (Lille, France)
超越最低配额:避免多赢者投票中的过度代表
AI总结 本文提出避免过度代表的公理JUQ,引入复合Thiele规则并刻画满足该公理的Adams-AV规则,同时提出平衡避免不足与过度代表的公理JNQ。
Comments This is an extended version of the publication with the same name in the proceedings of EC 2026
语义锚定证据融合用于域鲁棒的全切片生存分析
发表机构 * National University of Singapore(新加坡国立大学) ; Imperial College London(帝国理工学院) ; Hunan University(湖南大学)
AI总结 提出SAEFS框架,通过视觉问答提取语义锚点,结合双流证据提取和狄利克雷主观逻辑建模不确定性,实现跨域零样本生存分析,平均C-index提升10.2%。
ROSE:多模态模型中感知到行动差距的基准测试
发表机构 * Sun Yat-sen University(中山大学) ; Shaanxi Normal University(陕西师范大学)
AI总结 提出ROSE基准,通过固定视觉场景并变化区域约束与符号输出,测试多模态大模型在不同上下文中将相同视觉证据转化为所需行动的能力,发现模型性能下降高达44.5个百分点,揭示感知到行动的瓶颈。
Comments 29 pages, 11 figures
用于边缘Tsetlin Machine推理的低能耗精简RISC-V指令子集处理器
AI总结 针对Tsetlin Machine推理,提出一种领域专用RISC-V微处理器架构,通过指令精简和数据路径简化,在保持可编程性的同时实现高达98%的执行时间减少和29.7倍能耗降低。
Comments 6 pages, 6 Figures, Accepted in IEEE ISVLSI Conference 2026
解决潜在扩散模型中RGB到SWIR图像翻译的细节瓶颈
发表机构 * imec ; imec-IPI-Ghent University(imec-IPI-根特大学) ; Yale University(耶鲁大学)
AI总结 针对潜在扩散模型在RGB到SWIR图像翻译中丢失空间细节的问题,提出源条件自编码器和可学习引导编码器两种轻量级改进,在驾驶场景下将检测mAP提升至2倍,小目标提升3.4倍,并达到最优FID。
Stellar:面向自然语言查询的可扩展多模态文档检索
AI总结 提出Stellar框架,通过磁盘存储令牌级文档嵌入并动态加载候选嵌入,结合词汇表示过滤和高效磁盘支持的后交互,在保持检索效果的同时将内存开销和查询延迟降低1-2个数量级。
SketchKeyAnime:基于参考锚点的稀疏关键草图动画合成
发表机构 * Beijing University of Posts and Telecommunications(北京邮电大学)
AI总结 提出SketchKeyAnime视频扩散框架,通过双分支条件机制和可学习门控的草图交叉注意力,从单张参考RGB图像和稀疏关键草图生成结构可控、外观一致且时间连贯的动画,在Sakuga-42M数据集上显著优于基线方法。
图像生成机器学习的环境影响:温和、艺术与激进的解决方案
AI总结 针对图像生成ML的高能耗问题,从计算机工程、媒体研究和艺术角度探索非精确计算、小模型、低精度硬件等解决方案,并提出真实成本核算。
Comments Paper in Proceedings of LIMITS 2026: 12th Workshop on Computing within Limits, 2026-06-23-25, Online
基于图深度学习的制图综合:来自建筑足迹简化和聚合的见解
发表机构 * The Hong Kong University of Science and Technology (Guangzhou)(香港科技大学(广州)) ; Zhejiang University(浙江大学) ; Mainz University of Applied Sciences(美因茨应用科学大学)
AI总结 本研究首次探索将图深度学习应用于建筑足迹简化(节点移动预测)和聚合(链接预测),评估了GCN、GAT和GraphSAGE等架构,发现GraphSAGE在链接预测上表现较好,但节点移动预测仍具挑战,且聚合比简化更复杂。
Comments 15 pages, 20 figures, 10 tables
多模态大语言模型的置信度校准:基于医学视觉问答的实证研究
发表机构 * College of Computer Science and Technology, Zhejiang University(浙江大学计算机科学与技术学院) ; School of Computer Science and Technology, Xidian University(西安电子科技大学计算机科学与技术学院) ; Zhihui Medical Technology (Shanghai) Co., Ltd.(智汇医疗科技(上海)有限公司)
AI总结 针对多模态大语言模型在医学任务中置信度与准确性不匹配的问题,提出结合多策略融合询问与专家大语言模型评估的方法,在三个医学VQA数据集上将期望校准误差平均降低40%,提升了模型可靠性。
Comments Accepted by MICCAI 2025
三维管状结构骨架的半自动校正:基于分量最小生成树与过滤Delaunay三角剖分
AI总结 提出一种半自动方法,通过用户选择源点和目标点,结合分量最小生成树和过滤Delaunay三角剖分,重建合理的中心线连接,校正骨架拓扑伪影。
Comments Accepted at ACM ICMR 2026
Journal ref In Proceedings of the International Conference on Multimedia Retrieval (ICMR '26), June 16--19, 2026, Amsterdam, Netherlands. ACM, New York, NY, USA, 10 pages
通过自动具身对话增强推进DialNav
发表机构 * Korea University(高丽大学) ; Trillion Labs
AI总结 提出自动生成管道构建大规模RAINbow数据集(238K episodes),结合双策略训练和定位模型,在DialNav任务上实现成功率显著提升(Val Seen +89%,Val Unseen +100%)。
Comments 29 pages, 9 figures
GEMS: 几何约束使LLM中多语义叠加成为可能
AI总结 提出GEMS方法,通过范数保持加权叠加、目标注意力路径注入和实时正交化两个几何约束,解决无训练多方向激活干预中的分布偏差和方向干扰问题,在GSM8K上保持98%准确率。
Comments 30 pages, 5 figures, 20 tables. Code and logs are available at: https://github.com/LuLu663939/gems-multi-semantic-steering
Timage: 一种用于微调视觉语言模型的文本嵌入图像生成范式
发表机构 * Fudan University(复旦大学) ; Shenzhen University of Advanced Technology(深圳先进技术大学) ; Tencent Jarvis Lab(腾讯贾维斯实验室) ; Southern University of Science and Technology(南方科技大学)
AI总结 提出Timage范式,通过约束薛定谔桥将查询文本作为排版覆盖层嵌入图像,以显式空间锚点引导模型关注,在不侵蚀骨干能力前提下提升细粒度空间推理性能。
Comments ECCV
组合性在窄深度-连接性区域中涌现:架构约束与解流形
发表机构 * National University of Singapore(新加坡国立大学) ; University of Twente(特温特大学)
AI总结 研究发现组合性仅在特定稀疏网络和特定深度区间涌现,提出基于相似性的剪枝和深度预测方法,并用理论框架解释原因。
DiffMath:面向手写数学表达式生成的符号与图感知潜在扩散Transformer
发表机构 * South China University of Technology(华南理工大学) ; Huawei Technologies Co., Ltd.(华为技术有限公司)
AI总结 提出DiffMath框架,利用LaTeX层次结构作为先验,通过关系抽象语法树、结构保持潜在表示和条件去噪,无需位置监督即可生成结构一致的手写数学表达式。
三角一致性作为光流学习的通用约束
发表机构 * Louisiana State University(路易斯安那州立大学) ; University of California, Los Angeles(加州大学洛杉矶分校) ; Yale University(耶鲁大学)
AI总结 提出三角一致性约束,通过组合两个光流诱导第三个光流并强制三者一致,适用于不同网络架构、监督类型和数据集,在监督、无监督和迁移学习中均提升性能。
Comments Accepted by ECCV 2026
AutoTam: 通过 Tamarin 模型生成指定安全协议实现
AI总结 提出一种语言优先方法,通过领域特定语言实现协议并自动生成 Tamarin 模型,验证迹属性并保证其传递到实现,同时集成符号执行分析内存安全,在签名 Diffie-Hellman 和 WireGuard 协议上验证了安全性和互操作性。
Comments 19 pages, 5 figures
Prismriver:Lean 4 中音乐理论与算法作曲的形式化
AI总结 使用 Lean 4 形式化音乐理论,实现可验证的算法作曲与伴奏生成,并支持音乐结构的单子分析。
PhysDrift: 弥合人形机器人共语动作生成中的具身差距
发表机构 * South China University of Technology(华南理工大学) ; DexForce Technology(DexForce科技公司) ; Foshan University(佛山大学)
AI总结 针对人形机器人共语动作生成中人体运动流形与机器人具身约束不匹配的问题,提出IK-EER框架和PhysDrift模型,直接预测可执行关节轨迹,提升运动对齐、物理合理性和实时交互能力。
加速工业应用中的语义分割标注过程
发表机构 * Department of Computer Science and Artificial Intelligence, Andalusian Research Institute in Data Science and Computational Intelligence, DaSCI, University of Granada(格拉纳达大学计算机科学与人工智能系,安达卢西亚数据科学与计算智能研究所,DaSCI) ; Department of Computer Science and Automatic Control, National Distance Education University (UNED)(国立远程教育大学计算机科学与自动控制系)
AI总结 本文利用无监督算法将材料科学中语义分割的标注时间从170小时降至37小时(减少78%),并发布了最大的公开钢微观结构分割数据集。
空间感知缩减框架:迈向高效且忠实的视觉状态空间模型
发表机构 * Sichuan University(四川大学) ; Tsinghua University(清华大学)
AI总结 提出STORM框架,通过保持空间结构完整性解决视觉Mamba模型在token缩减时的性能崩溃问题,无需训练即可实现高精度剪枝。
Comments Accepted by ICML 2026
责备比表扬更容易:衡量足球中的无球防守表现
AI总结 提出基于防守压力区(DPA)的球员参与度评分,将预期威胁的事件级变化归因于个体,以衡量足球无球防守表现,并在跨性别和跨赛事数据集上验证其有效性。
MobileForge:基于分层反馈引导策略优化的移动GUI智能体免标注适配
AI总结 提出MobileForge系统,通过MobileGym环境实现任务生成与评估,结合分层反馈引导策略优化(HiFPO)将轨迹结果、步骤反馈和修正提示转化为步骤级GRPO更新,实现移动GUI智能体免标注适配,在AndroidWorld上达到67.2% Pass@3。
Comments Project page: https://mobile-forge.github.io/
多旋翼无人机状态估计中的电机角速度预积分
AI总结 针对无人机振动导致IMU精度下降的问题,提出基于电机转速加速度预积分的方法,替代IMU进行状态传播,并构建因子用于图优化,结合LiDAR形成MAS-LO算法,相比LIO-SAM位置精度提升28%,速度精度提升65%。
SWAP: 用于敏捷机器人跑酷的对称等变世界模型
发表机构 * Center for X-Mechanics, Zhejiang University(浙江大学交叉力学中心) ; ZJU-Hangzhou Global Scientific and Technology Innovation Center(浙江大学杭州国际科创中心) ; Mirrorme Technology Co., Ltd.(魔镜科技有限公司)
AI总结 提出SWAP框架,将对称等变性嵌入世界模型和演员-评论家网络,实现四足机器人跑酷记录突破(跨越2.13米间隙、攀爬1.63米平台),并展现出对未见镜像地形的几何泛化与零样本迁移能力。
CARE: 面向视频多模态大语言模型的自适应推理长度的能力感知奖励塑形
发表机构 * School of Information Science and Engineering, Lanzhou University(兰州大学信息科学与工程学院) ; School of Medical Technology, Beijing Institute of Technology(北京理工大学医学技术学院) ; School of Computing, National University of Singapore(新加坡国立大学计算机学院)
AI总结 提出CARE框架,通过能力感知奖励塑形自适应优化推理长度,利用指数移动平均估计能力并分阶段调整奖励偏好,结合批次归一化和后验放大器提升效率与准确性。
MemGUI-Agent: 一种具有主动上下文管理的端到端长时移动GUI智能体
AI总结 提出MemGUI-Agent,通过主动上下文管理机制(ConAct)将上下文管理作为一等动作,解决长时任务中提示膨胀和关键信息稀释问题,在8B模型上达到最佳性能。
Comments 33 pages, 6 figures. Project page: https://memgui-agent.github.io/
主体之道:自生目标人工智能、嵌入主体与自我的消解
AI总结 本文探讨自生目标AI中主体生成自身目标的问题,通过内在动机、资源驱动先验、因果干预学习、稳态和嵌入性等概念,揭示嵌入性虽必要但不充分,并指出核心难题在于主体如何生成并相对化自我,最后提出量子表述、哲学解读和基于LLM的具体实现。