Efficient Stochastic Optimisation via Sequential Monte Carlo
通过序贯蒙特卡洛实现高效随机优化
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 针对梯度难以计算的优化问题,提出用序贯蒙特卡洛(SMC)采样器替代昂贵的内采样循环,实现高效随机优化,并在能量模型奖励调优中验证有效性。
通过序贯蒙特卡洛实现高效随机优化
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 针对梯度难以计算的优化问题,提出用序贯蒙特卡洛(SMC)采样器替代昂贵的内采样循环,实现高效随机优化,并在能量模型奖励调优中验证有效性。
批量校准的置信模糊集:样本外污染下的快速、可处理决策
发表机构 * University of Bristol(布里斯托大学) ; University of Cambridge(剑桥大学) ; University of California, Berkeley(加州大学伯克利分校) ; University of Oxford(牛津大学)
AI总结 提出批量校准置信模糊集,通过分离批量内污染和尾部贡献,得到闭式有限风险目标,转化为线性或二阶锥规划,实现高效鲁棒优化。
从几何到动力学:基于几何约束从稀疏观测学习过阻尼朗之万动力学
发表机构 * Dimitra Maoutsa(迪米特拉·马乌茨)
AI总结 提出一种随机控制框架,利用系统不变密度的几何结构进行路径增强,从稀疏时间采样数据中恢复过阻尼朗之万动力学,无需参数模型假设。
PhononBench:面向晶体生成中动态稳定性的基于声子的大规模基准
发表机构 * School of Physics, Renmin University of China(中国人民大学物理学院)
AI总结 提出PhononBench,首个大规模AI生成晶体动态稳定性基准,利用MatterSim势高效计算声子,评估7个模型生成的133,838个结构,发现平均动态稳定性率仅32.15%。
SGD预条件子的设计准则:局部条件数、噪声基底与盆地稳定性
发表机构 * Department of Mathematics, Emory University(埃默里大学数学系) ; Department of Mathematics, University of Minnesota Twin Cities(明尼苏达大学双城分校数学系) ; Department of Computer Science, University of Minnesota Twin Cities(明尼苏达大学双城分校计算机科学系) ; Department of Mathematics, University of Kentucky(肯塔基大学数学系)
AI总结 针对SGD在训练后期因各向异性曲率和梯度噪声导致的收敛缓慢问题,提出基于对称正定矩阵M的预条件SGD分析框架,推导收敛速率和噪声基底受M相关量控制的界,并给出非凸目标下的盆地稳定性保证,为科学机器学习提供设计准则。
生成式AI模型在学生软件编程学习活动中的使用研究
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 通过对比生成式AI与传统在线资源对编程学习的影响,发现AI能提升任务表现但未必带来知识增益,初学者过度依赖而中级生选择性使用,呼吁将AI作为学习工具而非解题工具。
生成式人工智能中的竞争与多样性
发表机构 * MIT Sloan School of Management & Department of Electrical Engineering and Computer Science(麻省理工学院斯隆管理学院及电气工程与计算机科学系)
AI总结 通过博弈论模型和Scattergories游戏实验,研究竞争如何促使生成式AI模型多样化,缓解同质化,并提升社会福利。
C-QUERI:国会机构中的问题、交流与回答数据集
发表机构 * School of Computing, Binghamton University(宾夕法尼亚大学布林莫尔分校计算机学院) ; Department of Political Science, Binghamton University(宾夕法尼亚大学布林莫尔分校政治学系)
AI总结 提出从听证会记录中提取问答对的流程,构建108-117届国会委员会听证数据集,分析显示提问者党派可从问题本身预测,为政治话语研究提供框架。
即插即用图像恢复:随机去噪正则化
发表机构 * arXiv.org ; GitHub
AI总结 提出SNORE框架,仅在适当噪声水平图像上应用去噪器,结合随机正则化与梯度下降求解逆问题,在去模糊和修复任务上达到SOTA。
Prism: 通过GPU内存气球实现经济高效的多LLM服务
发表机构 * UCLA(加州大学洛杉矶分校) ; UC Berkeley(伯克利加州大学) ; Harvard University(哈佛大学) ; CMU(卡内基梅隆大学) ; University of Edinburgh(爱丁堡大学) ; Intel(英特尔) ; Stanford University(斯坦福大学) ; LMSYS(灵州市系统实验室) ; ByteDance(字节跳动) ; Alibaba Cloud(阿里云) ; Tsinghua University(清华大学) ; Novita AI ; Rice University(里士满大学)
AI总结 针对多LLM服务中资源效率低下的问题,提出基于内存气球的内存中心化LLM协同服务框架Prism,统一空间与时间共享,已在10K+ GPU生产环境部署。
基于有源同步透射反射智能超表面的多用户蜂窝共生无线电网络中的QoS改进
发表机构 * Department of Electrical and Computer Engineering, Isfahan University of Technology(伊斯法罕理工大学电气与计算机工程系) ; Department of Electronics and Communication Engineering, Kuwait College of Science and Technology(科威特科学与技术学院电子与通信工程系) ; The Pasargad Institute for Advanced Innovative Solutions (PIAIS)(帕萨尔加德先进创新解决方案研究所) ; Electrical and Electronic Engineering Department, London South Bank University(伦敦南岸大学电子与电气工程系)
AI总结 本文利用有源同步透射反射智能超表面(ASRIS)增强6G蜂窝网络服务质量,通过深度强化学习优化波束成形、相位调整和调度参数,最大化共生反向散射设备与用户间的吞吐量。
机械良知:机器智能可信赖性的数学框架
AI总结 提出机械良知(MC)概念,通过轨迹级规范过滤最小化修正基线策略,降低累积偏离,并处理认知不确定性,实现单智能体与分布式智能系统的可信赖性。
多智能体系统中信念修正公设的研究(扩展版)
AI总结 研究认知规划中的信念修正问题,将经典AGM信念修正公设推广到多智能体环境,提出广义全交多智能体信念修正算子,并讨论迭代修正公设的推广及事件模型修正算子。
真实噪声合成减少偏差并改善有监督机器学习的组织微结构估计
AI总结 针对扩散MRI中模拟与实测信号噪声不匹配导致的协变量偏移问题,提出真实噪声合成框架,通过引入Rician期望和有效后处理噪声方差,显著降低参数估计偏差并提高精度。
BOUTEF:北非假新闻的多语种语料库——语言作为武器
AI总结 本文构建了包含阿尔及利亚和突尼斯多语种(MSA、方言、Arabizi、法语、英语等)的假新闻语料库BOUTEF,通过定量与定性分析揭示了假新闻依赖情感化叙事、耸人听闻框架和混合语言实践来增强传播力,而辟谣内容则更注重事实和验证。
如果LLM具有类人属性,那么《帝国时代II》也具有
AI总结 通过训练简单神经网络于《帝国时代II》,论证LLM的拟人属性在经验上非唯一,提出应假设LLM非独特性而非拟人属性来设计实验。
智能作为受管自主:代理型AI系统的失败、升级与治理
AI总结 本文提出SMARt模型,通过形式化能力检测认知漂移、暂停推理、尝试恢复并在可靠性下降时放弃控制,以解决自主AI系统中的幻觉和持续不合理行为问题。
贝叶斯共形预测的最优时空解耦
AI总结 提出状态自适应贝叶斯共形预测(SA-BCP),通过门控凸组合平衡长期时间惯性与局部空间证据,实现分布漂移下的快速适应与稳定覆盖,并给出MSE最优阈值闭式解及在线选择过程的遗憾界。
使用信号时序逻辑的字典序最小违规运动规划
AI总结 提出一种将字典序多目标优化转化为单目标标量优化的方法,通过非均匀量化和位移扩展MPPI求解器,并引入结合时空违规的谓词鲁棒性度量,实现可解释且可扩展的字典序STL最小违规运动规划。
认知宪政主义:或如何避免一致性偏见
AI总结 本文提出AI应建立明确的认知宪法,通过规范源归因等元规范避免一致性偏见,并论证自由主义路径优于柏拉图式路径。
DecompSR:用于组合多跳空间推理分解分析的数据集
AI总结 提出DecompSR数据集(超500万数据点),通过程序化生成独立控制组合性的多个方面(如推理深度、语言变异性),用于细粒度评估大语言模型的空间推理能力。
OccAny: 广义无约束城市3D占据预测
AI总结 提出首个广义无约束城市3D占据模型OccAny,通过分割强制和新视图渲染技术,在无标定场景下实现度量占据预测与分割特征完成,跨域泛化优于视觉几何基线。
NOVA: 面向RAG系统中鲁棒大语言模型的噪声感知言语置信度校准
AI总结 提出NOVA框架,通过规则引导的监督微调,解决检索增强生成中噪声上下文导致的过度自信问题,在域内和域外分别提升ECE 10.9%和8.0%。
CreativeBench: 通过自我进化挑战基准测试和增强机器创造力
AI总结 提出CreativeBench基准,基于认知框架通过代码生成评估机器创造力,包含组合与探索两个子集,利用逆向工程和自我博弈自动生成挑战,并通过质量与新颖性乘积的指标区分创造与幻觉。
混合使得马尔可夫上下文在线性赌博机中变得廉价
AI总结 针对马尔可夫上下文线性赌博机问题,提出一种基于均匀几何遍历性的约简方法,通过构建平稳替代动作集和延迟更新方案,实现了与标准线性赌博机相当的最坏情况遗憾界。
结构化剪枝与非结构化剪枝:指数级差距
AI总结 研究随机初始化网络中剪枝的局限性,证明神经元剪枝需要指数级更大的网络规模才能达到与非结构化剪枝相同的近似精度。
GEMSS: 一种用于在分类和回归问题中发现多个稀疏解的变分贝叶斯方法
AI总结 提出GEMSS算法,利用结构化spike-and-slab先验、高斯混合近似后验和Jaccard惩罚,通过变分推断同时发现多个多样化的稀疏特征组合,在128个实验和3个真实数据集上优于对比方法。
SCALE: 基于自不确定性条件自适应观察与执行的视觉-语言-动作模型
AI总结 提出SCALE推理策略,利用自不确定性联合调节视觉感知和动作,无需额外训练或验证器,仅单次前向传播,提升VLA模型在模拟和真实环境中的鲁棒性。
自进化视觉语言模型用于图像质量评估:基于投票与排序
AI总结 提出EvoQuality框架,通过自一致性生成伪标签,利用群体相对策略优化迭代提升VLM的图像质量感知能力,无监督下在多个IQA基准上超越监督方法。
从孤立到纠缠:可解释性方法何时识别和解缠已知概念?
AI总结 本文提出多概念评估框架,研究稀疏自编码器和探针等方法是否真正解缠概念,发现特征通常只对单一概念敏感,但概念分布在多个特征上,且干预特征常影响多个概念,表明相关性指标不足以证明干预选择性。