How reliable are LLMs when it comes to playing dice?
LLM 在掷骰子时有多可靠?
发表机构 * Università degli Studi di Firenze
AI总结 通过离散概率问题基准测试,发现 LLM 在标准问题上准确率 0.96,但在反直觉问题上仅 0.59,且存在 token 偏差和误导提示的脆弱性。
LLM 在掷骰子时有多可靠?
发表机构 * Università degli Studi di Firenze
AI总结 通过离散概率问题基准测试,发现 LLM 在标准问题上准确率 0.96,但在反直觉问题上仅 0.59,且存在 token 偏差和误导提示的脆弱性。
离散概率中的反直觉问题
AI总结 本文收集了一系列离散概率中的反直觉问题及详细解答,旨在挑战启发式推理,评估大语言模型在概率推理中的认知偏差。
剩余域极小分次自由分解中极大平移的研究
AI总结 研究标准分次代数上剩余域极小自由分解中极大平移的极值行为,定义并计算了rate和slant两个不变量,证明了Golod环等环类的渐近可加性。
稳定抛物Higgs丛的复代数簇轨道均匀化
AI总结 研究带有简单正规交叉除子的光滑复射影簇上的抛物Higgs丛,通过抛物Bogomolov-Gieseker不等式等号情形,得到分支复双曲结构,并给出标准情形下的无分歧轨道球均匀化。
非交叉对偶性与正热带线性空间的几何
AI总结 本文通过建立非交叉对偶性,将正热带格拉斯曼面的扇结构映射到非交叉扇,并利用非交叉表格的整数点刻画正热带线性空间的度量几何,揭示了其有界复形与超单形中屋顶函数的关系。
高维热带格拉斯曼流形的支架:基础
AI总结 本文提出支架概念,将热带格拉斯曼流形Trop G(2,n)的种系树推广到任意k,并证明支架通过k点距离函数模拟所有热带格拉斯曼流形中的点。主要结果是构造了正常CAT(0)平面图作为热带三平面格拉斯曼流形的正支架,并证明了其唯一表示性及嵌入性质。
拉格朗日反演公式的非外部证明
AI总结 本文给出形式幂级数拉格朗日反演公式的两个简单证明,仅使用形式幂级数分析的基本工具,不依赖外部概念。
交错群在特征2中与线性特征成比例的旋量特征
AI总结 分类了交错群的旋量与非旋量不可约特征在2模约化下成比例的情况,等价于在奇阶元上成比例的情况。
满足Cartan-Weyl范式的李颜色代数的量子群
AI总结 本文构造了满足Cartan-Weyl范式的单李颜色代数及其仿射李颜色代数的量子化包络代数,建立了拟三角Hopf颜色代数结构,推广了Drinfeld-Jimbo量子群。
与Pin群相关的Coxeter拟阵的变体
AI总结 本文引入两类由Coxeter拟阵导出的拟阵:双覆盖拟阵和旋转$D_n$拟阵,并确定其内自同构群。
欧拉常数的多对数类似物
AI总结 引入一族常数 C_m,作为欧拉常数的多对数类似物,研究其性质并建立与伽马函数相关的迭代对数积分表示,进一步引入多对数zeta势和多对数伽马函数,并应用于将C_m与涉及黎曼zeta函数的狄利克雷级数的特殊值联系起来。
基于似然信息简化阶模型的近似后验误差界
AI总结 针对贝叶斯逆问题,通过Petrov-Galerkin投影到似然信息子空间构建简化阶模型,并给出近似后验协方差和均值的误差界。
非对角 Ramsey 数的几乎紧指数
AI总结 通过构造新的无 K_s 图族,改进了非对角 Ramsey 数的下界,几乎匹配已知上界,并证明了当 s, k/s → ∞ 时 r(s,k) = (k/s)^{(1+o(1))s}。
条件均值障碍:从确定性回归到条件分布学习
AI总结 本文提出条件均值障碍概念,通过残差-特征正交性和决定系数两个诊断指标识别该障碍,并证明添加潜在随机性会迫使平方损失预测器回到条件均值,从而需要分布评分损失来跨越障碍。
稳定UCT Kirchberg代数的主群胚模型
AI总结 本文证明每个稳定UCT Kirchberg代数都有一个主étale群胚模型,从而包含一个C$^*$-对角元;对于单UCT Kirchberg代数$A$且$[1_A]_0$在$K_0(A)$中具有无限阶的情况,该方法同样适用,特别地得到了Cuntz代数$\mathcal{O}_\infty$的主étale群胚模型。
Kuramoto-Sivashinsky 系统可观测性的自由度和优化动力学效应
AI总结 通过将可观测性与耗散动力系统的嵌入理论联系起来,建立了变分状态估计应用于Kuramoto-Sivashinsky方程的可观测性准则,并分析了优化动力学限制,提出了结合非凸牛顿更新和伪投影步骤的鲁棒重构策略。
Poincaré多项式的实根性:一个AI辅助的证明
AI总结 通过引入双变量变形揭示隐藏的交错结构,证明了稳定有理曲线模空间Poincaré多项式的实根性,并进一步推广到Fulton-MacPherson空间。
局部有限的可解导子李代数
AI总结 研究仿射簇上由有限个局部有限李子代数生成的可解导子李代数的局部有限性,给出判定准则,并在仿射平面情形下给出肯定回答。
$\mathbb R^3_1$ 中具有实渐近线的类时曲面的基本不变量
AI总结 研究 $\mathbb R^3_1$ 中具有实渐近线的类时曲面,通过 Bonnet 型基本定理证明该类曲面由四个满足自然 PDE 的不变量唯一确定(至多相差一个运动),并进一步在规范参数下由两个不变量(如 Gauss 曲率和平均曲率)及等价于 Gauss 方程的 PDE 唯一确定。
显式信号自适应顺序最优执行报价
AI总结 本文针对限价订单簿中的顺序限价单执行问题,提出统一显式解理论,通过将填充强度与报价挂钩,推导出四种准则下的显式值函数和最优报价,并证明信号依赖漂移显著影响最优执行。
半拓扑重心代数
AI总结 本文研究了半拓扑和拓扑重心代数,探讨了它们与锥体的关系,并提出了关于局部凸性的概念,最终给出了关于连续(或子概率、概率)估值的重心存在定理。
一种新型的随机粒子-场算法用于反应-扩散-对流癌症侵袭模型
AI总结 本文提出了一种新的数值框架,用于求解三维癌症生长的特定生物反应-扩散-对流系统,采用可变质量的粒子来模拟细胞密度,并通过粒子-网格算法实现粒子与空间网格的高效交互,同时利用谱方法快速求解空间扩散,证明了粒子质量的变化率在有限时间内有界,并且算法在空间网格上无条件保持正性,数值实验验证了理论收敛速率。
具有势函数的粘性CIR过程:不变测度与精确采样
AI总结 本文研究了一维粘性CIR过程,该过程在[0,∞)上扩散,并在原点处具有粘性边界条件,出现在基于Hadamard-Langevin动力学的稀疏贝叶斯推断框架中。对于参数范围δ∈(1,2),其中原点可到达但不可吸收,证明了过程的良定性和不变测度的唯一性,该测度是零点质量与内部加权伽马型密度的混合。通过构造一个显式格林函数,用以构造零势情况下的精确采样器。对于非平凡势函数G,通过Girsanov测度变换建立倾斜不变测度的存在性和唯一性,并开发了两种采样算法:一种是修正的Metropolis-Hastings采样器,可精确采样目标不变测度;另一种是未调整的Langevin算法(ULA),每步成本较低但引入O(h)的偏差。数值实验验证了预测行为:Metropolis-Hastings采样器在所有步长下都能达到目标不变测度,而ULA表现出预期的O(h)偏差。
由向量场诱导的德拉姆-霍奇理论在流形上
AI总结 本文提出一种由向量场诱导的德拉姆-霍奇框架,定义了霍奇L²内积、余微分和霍奇拉普拉斯算子,并扩展到有边流形。
通过几何可定义性实现策略PAC可学习性
AI总结 研究个体通过成本修改特征影响分类器决策的策略学习问题,证明在简单情况下策略行为可使易学问题变为不可学,并引入几何可定义性假设以控制样本复杂度。
关于Küronya和Pintye关于正则性和积分闭包猜想的反例
AI总结 研究提出一个等生成的单项式理想,其积分闭包的正则性大于原理想,挑战了Küronya-Pintye猜想的多项式环形式。
Elastica++:一种高性能的多物理场框架,用于大规模相互作用的柯西-罗德结构
AI总结 本文提出Elastica++,一种高性能多物理场框架,用于模拟大规模相互作用的柯西-罗德结构,通过高效内核和共享内存并行计算,实现大规模模拟,并支持多物理场工作流。
关于达布-哈勒芬系统:雅可比与李
AI总结 本文讨论达布-哈勒芬系统的两种构造方法,对比雅可比和李的构造方式,分析其积分性与单值表示的差异。
用于精确惩罚二进制整数规划的尖峰函数
AI总结 本文提出尖峰函数用于将二进制约束转化为等式约束,通过惩罚模型分析并设计高效算法,证明其在局部Lipschitz连续性条件下收敛到P- stationary点。
一个低价带图复形计算 $M_{g,m}$ 奇异同调的组合表示
AI总结 本文证明对于任何 $2g+m\geq 3$,$m\geq 1$,$M_{g,m}$ 的所有上同调类均可由最多四价的带箭头图组合表示,且四价条件是必要的。