Exploratory Analysis of Wi-Fi 6 Dynamic Resource Unit Sharing in Small-Scale Network Scenarios
小规模网络场景中Wi-Fi 6动态资源单元共享的探索性分析
AI总结 针对静态RU调度在动态流量下的局限性,提出一种动态RU分配算法,映射TSN流量类别至Wi-Fi 6 QoS机制,仿真表明相比静态方案降低了延迟、抖动和丢包率。
小规模网络场景中Wi-Fi 6动态资源单元共享的探索性分析
AI总结 针对静态RU调度在动态流量下的局限性,提出一种动态RU分配算法,映射TSN流量类别至Wi-Fi 6 QoS机制,仿真表明相比静态方案降低了延迟、抖动和丢包率。
低资源语言孟加拉语中书面答案的语义评分:使用微调轻量级语言模型
发表机构 * Computer Science and Engineering, University of Dhaka(达卡大学计算机科学与工程系)
AI总结 针对低资源语言孟加拉语,提出一种基于微调轻量级语言模型的双语评估系统,通过语义正确性而非词汇重叠进行自动评分,在合成和人工评估中均取得最优性能。
冻结多模态嵌入用于异步视频面试中的个性与认知能力评估
AI总结 针对异步视频面试中标注数据有限的高维多模态学习问题,提出使用冻结多模态编码器(CLIP、Whisper、RoBERTa等)结合低容量下游模型,在个性预测任务上实现MSE降低19.1%,并发现认知能力预测中存在数据集捷径。
通过假设树精炼迈向通用自主研究
发表机构 * Gaoling School of Artificial Intelligence, Renmin University of China(中国人民大学高瓴人工智能学院) ; Microsoft Research(微软研究院)
AI总结 提出Arbor框架,通过假设树精炼(HTR)实现长期自主研究循环,在六项真实任务中平均相对保留增益超过Codex和Claude Code的2.5倍。
通过LLM引导的视频拼接进行手语翻译的语料增强
发表机构 * Peter Pazmany Catholic University, Faculty of Information Technology and Bionics(彼得·帕兹马尼天主教大学信息科技与仿生学院) ; DeepSign Technologies Ltd.(DeepSign科技有限公司)
AI总结 提出一种无需额外标注或生成模型的手语翻译语料增强方法,利用CTC强制对齐提取手语片段,通过LLM生成句子并拼接视频,在GFSLT-VLP基线上提升BLEU-4达2.92,并发现合成数据对视觉-语言预训练有害但可提升下游任务。
Lung-SRAD: 基于谱感知正则化音频DASS与双轴补丁混合对比学习的呼吸音分类
发表机构 * RSC LAB, MODULABS(RSC实验室,MODULABS) ; Department of Electronic Engineering, Wonkwang University(圆光大学电子工程系) ; AI Convergence Research Institute, Wonkwang University(圆光大学人工智能融合研究所)
AI总结 针对呼吸音分类中AST模型对局部异常模式不敏感的问题,提出基于状态空间模型的谱感知层正则化和双轴补丁混合对比学习,在ICBHI基准上达到64.48%分数,比AST基线提升5%。
提问的艺术:一致性增强空间推理中的事实性
AI总结 提出自监督强化学习框架,通过几何与语义一致性验证器(如图像翻转、文本对象顺序交换)对齐预训练模型的内在空间推理能力,无需标注数据即可达到接近监督方法的精度。
基于GPU的大语言模型服务系统中的软件老化特征分析
AI总结 提出一种实证方法研究GPU大语言模型服务系统中的软件老化,通过216小时实验发现所有部署均存在显著内存老化,泄漏率与运行时和配置强相关,并提供了可复现框架。
呼吸音分类的质量自适应角度边界学习
发表机构 * RSC LAB, MODULABS, Republic of Korea(RSC实验室,MODULABS,韩国) ; Department of Electronic Engineering, Wonkwang University, Republic of Korea(韩国圆光大学电子工程系) ; AI Convergence Research Institute, Wonkwang University, Republic of Korea(韩国圆光大学人工智能融合研究所)
AI总结 提出质量自适应角度边界学习框架QLung,通过频谱熵和均方根能量推导无参考音频质量边界,自适应缩放角度边界,改善特征泛化,在ICBHI和SPRSound数据集上分别提升2.46%和达到最优分布外性能。
NARRAS:车载物联网中基于CSI的定位的边缘触发分布式推理
AI总结 针对分布式天线阵列CSI定位中资源受限问题,提出NARRAS边缘触发分布式推理策略,各阵列本地决策是否上报观测,通过可微活动惩罚和通道图正则化实现预算控制,在低活动率下提升定位精度。
从内容到知识:基于神经知识表示的闪电般快速长视频理解
AI总结 提出将长视频编码为神经知识表示(NKR),通过智能体知识蒸馏(AKD)自动合成描述和问答对,将视频知识嵌入VLM骨干网络的少量权重中,实现轻量级、可复用的视频理解,推理时无需重新加载视频,大幅降低延迟。
从持续性到生存:拓扑特征的假设检验、效应大小与向量化
AI总结 提出STRAND方法,将持久性图视为生存数据,利用持久性生存函数统一实现假设检验、效应大小计算和向量化,在合成数据和真实基准上验证了有效性。
一种本体引导的多锚点图检索框架用于交通事故法律责任判定
发表机构 * Southwest Petroleum University(西南石油大学) ; Sichuan Police College(四川警察学院)
AI总结 提出OMAGR框架,通过本体引导将查询分解为锚点并执行并行图检索,解决多维度检索瓶颈,在TrafficLaw-QA数据集上提升上下文精度和忠实度。
Embodied-BenchClaw:用于具身空间智能基准构建的自主多智能体系统
发表机构 * QiYuan Lab(启元实验室) ; School of Information and Software Engineering, University of Electronic Science and Technology of China(电子科技大学信息与软件工程学院) ; Beijing University of Posts and Telecommunications(北京邮电大学) ; School of Computer Science and Engineering, Northeastern University(东北大学计算机科学与工程学院) ; School of Computer Science and Engineering, Beihang University(北京航空航天大学计算机科学与工程学院)
AI总结 提出Embodied-BenchClaw,一个通过五阶段流水线和三个智能体协调的自主系统,自动构建可验证、可执行、可维护且诊断有用的具身空间智能基准,减少人工工作量。
尾部感知自适应-k:面向检索增强生成的查询自适应上下文选择
AI总结 针对固定Top-K检索在查询依赖和重尾相似度分布下的失效问题,提出TAA-k框架,通过局部化极值理论验证策略实现高效、稳定的查询自适应截断,在三个数据集上达到接近最优的检索质量且效率大幅提升。
语言何时重要?多语言指令揭示视觉-语言-动作模型中的逐步语言敏感性
发表机构 * Harbin Institute of Technology(哈尔滨工业大学)
AI总结 本研究通过将LIBERO基准翻译成十种语言,首次系统评估了VLA模型的多语言鲁棒性,发现非英语指令下成功率下降30-50%,并基于步骤级语言敏感性提出推理时对齐干预,显著提升性能。
Snapping Matters: 上下文感知的起始点细化用于自动音乐转录
AI总结 针对弱对齐的乐谱-音频数据,提出基于二分图匹配的上下文感知起始点细化方法,显著提升自动音乐转录的起始点对齐和转录精度。
DuoBench: 一个可复现的双手操作基准,涵盖仿真与现实世界
发表机构 * University of Technology Nuremberg(纽伦堡工业大学) ; Karlsruhe Institute of Technology(卡尔斯鲁厄理工学院) ; Franka Robotics ; Technical University of Munich(慕尼黑工业大学)
AI总结 提出DuoBench,一个基于FR3 Duo平台的双手操作基准框架,包含11个任务和阶段式评估方案,用于诊断当前策略在双手协调、仿真到现实迁移等方面的失败模式。
GraspLLM: 面向文本属性图与LLM的零样本泛化
发表机构 * Peking University(北京大学) ; National University of Singapore(新加坡国立大学) ; University of California, Berkeley(加州大学伯克利分校)
AI总结 提出GraspLLM框架,通过融合图结构理解与LLM语义能力,利用基序感知对比学习和最优上下文子图对齐,实现跨数据集和跨任务的零样本泛化。
Notes2Skills: 从实验室笔记本到具有确定性意识的科学智能体技能
发表机构 * Southern University of Science and Technology(南方科技大学) ; The Hong Kong University of Science and Technology (Guangzhou)(香港科技大学(广州)) ; University College Dublin(都柏林大学学院)
AI总结 提出Notes2Skills框架,将实验室笔记转化为保留作者确定性的可验证科学智能体技能,解决不确定判断与确认结论混淆问题。
PAPEL:一种面向学前游戏英语学习的家长协作系统
AI总结 针对家长在游戏式英语学习中面临的挑战,提出PAPEL系统,通过场景感知建议和四个核心模块(内容生成、语言适配、平衡评估、扩展回应),提升亲子互动质量。
Wild3R: 从无约束稀疏照片集合进行前馈式3D高斯泼溅
发表机构 * The University of Tokyo(东京大学)
AI总结 提出Wild3R,一种针对无约束稀疏照片集合的前馈式3D高斯泼溅方法,通过引入包含多样光照和瞬态物体的WildCity数据集,学习跨视角外观一致性并移除瞬态内容,性能优于现有前馈方法,与基于逐场景优化的方法相当。
超越表征对齐:基于大脑引导的语言模型实现稳健推理
发表机构 * State Key Lab of General AI, School of Intelligence Science and Technology, Peking University(北京大学通用人工智能国家重点实验室、智能科学与技术学院) ; Department of Psychological and Cognitive Sciences, Tsinghua University(清华大学心理与认知科学系) ; Microsoft Research Asia(微软亚洲研究院)
AI总结 研究通过fMRI信号增强大型语言模型推理能力,提出脑引导框架,在10个模型上实现最高13%的准确率提升。
评论家架构的重要性:双评论家与统一评论家在人形机器人移动操作中的对比
AI总结 针对人形机器人多目标强化学习,对比统一评论家与双评论家架构,实验表明双评论家策略在到达速度、吞吐量和成功率上显著优于统一评论家,且架构选择比奖励工程影响更大。
面向自动驾驶危险检测的视觉-语言模型任务对齐稳定性分析
AI总结 研究视觉-语言模型在自动驾驶危险检测中,嵌入漂移与任务对齐危险分数变化的关系,发现不同腐败类型导致不同的失效模式,建议基准测试包含任务对齐稳定性指标。
实时语言模型阻塞:现场音乐伴奏生成的案例研究
发表机构 * MBZUAI(穆罕默德·本·扎耶德人工智能大学)
AI总结 提出StreamMUSE系统,在客户端-服务器架构中实现帧同步流式推理,通过现场音乐伴奏任务验证了不同延迟环境下实时同步的有效性。
使用开放人脸图像质量度量对身份证进行图像质量评估
发表机构 * da/sec - Biometrics and Internet Security Research Group, Hochschule Darmstadt(达姆施塔特应用科学大学生物识别与互联网安全研究组)
AI总结 本文通过将OFIQ标准中的捕获相关质量度量应用于身份证图像,提出一种预处理流程,并分析这些度量与三种呈现攻击检测算法性能的相关性,表明基于某些OFIQ度量的质量评估可显著提升PAD性能。
SG2Loc: 基于3D场景图的顺序视觉定位
发表机构 * ETH Zurich(苏黎世联邦理工学院) ; Google(谷歌) ; TU Munich(慕尼黑工业大学) ; Microsoft(微软)
AI总结 提出一种轻量级顺序视觉定位方法,利用紧凑的3D场景图表示环境,通过粒子滤波和语义匹配实现高效定位,显著降低存储需求。
扭曲 Warp:针对 CUDA 集体决策的非控制数据攻击
AI总结 本文提出集体语义破坏(CSC)攻击,利用 CUDA 集体操作中的参与元数据(如掩码、谓词等)绕过安全决策,并引入集体完整性契约(CIC)防御机制。
LLM赋能的NWDAF:迈向AI原生的6G网络智能
AI总结 开发了一个与Free5GC兼容的开源NWDAF,集成大语言模型接口,通过意图识别实现自然语言交互,简化网络分析管理,为AI原生6G网络奠定基础。