AI 大模型
语言大模型 / LLM
大语言模型、预训练、指令微调、后训练和语言模型应用。
From Texts to Scores: Tracing the Emergence of Essay Quality Representations in Large Language Models
从文本到分数:追踪大型语言模型中作文质量表征的出现
专题命中 其他LLM :分析LLM内部表征用于自动作文评分。
AI总结 通过线性探测等方法分析8个LLM在三个数据集上的隐藏表征,发现作文质量信息以线性可解码形式存在,并识别出与分数相关的神经元,揭示了LLM评分的内在机制。
Comments This is a preprint of a manuscript currently under peer review
What sentiment analysis can't see: Measuring whether customers were helped, and what went wrong, across 70,000 support conversations
情感分析看不到的:衡量客户是否得到帮助以及出了什么问题——基于70,000次客服对话
专题命中 其他LLM :使用GPT-5.4估计客户满意度并标记问题。
AI总结 本研究使用GPT-5.4从70,450次客服对话中估计客户满意度并标记具体问题,发现满意度估计比情感分析更准确,且能揭示情感分析无法捕捉的客户状态和问题原因。
Comments 25 pages, 6 figures
Quantifying Aleatoric Uncertainty of In-Context Learning for Robust Measure of LLM Prediction Confidence
量化上下文学习中的偶然不确定性以稳健衡量LLM预测置信度
专题命中 其他LLM :量化上下文学习中的不确定性,提升置信度
AI总结 针对上下文学习(ICL)中预测对提示设计敏感的问题,提出基于贝叶斯观点和机制可解释性的自函数向量,直接估计偶然不确定性,并设计严格评估协议,在合成和真实数据集上验证了方法的可靠性及在幻觉检测等应用中的实用性。
Comments Accepted to ACL 2026
Where to Place the Query? Unveiling and Mitigating Positional Bias in In-Context Learning for Diffusion LLMs via Decoding Dynamics
查询应置于何处?通过解码动力学揭示并缓解扩散大语言模型中上下文学习的位置偏差
专题命中 其他LLM :研究扩散LLM中上下文学习的位置偏差
AI总结 本文系统分析了扩散大语言模型中查询位置对生成质量的影响,发现其与示例语义质量同等重要,并提出基于平均置信度的无训练自适应路由策略Auto-ICL以优化查询放置。
Comments 9 figures, 4 tables
S2D2: Fast Decoding for Diffusion LLMs via Training-Free Self-Speculation
S2D2:通过免训练自我推测实现扩散LLM的快速解码
专题命中 其他LLM :扩散LLM解码加速,属于语言模型方法
AI总结 提出S2D2,一种免训练的自我推测解码框架,通过将块扩散模型在块大小为1时变为自回归模型,实现草稿与验证角色复用,在不增加训练或测试计算下提升解码速度与准确性。
Comments Code is available at https://github.com/phymhan/S2D2
Improving Alignment Between Human and Machine Codes: An Empirical Assessment of Prompt Engineering for Construct Identification in Psychology
改善人机编码对齐:心理学构念识别中提示工程的实证评估
专题命中 其他LLM :优化LLM在心理学文本中识别构念的提示工程。
AI总结 本研究提出一个实证框架,通过提示工程优化大语言模型在心理学文本中识别构念的性能。实验评估五种提示策略,发现构念定义和任务框架最关键,结合代码簿引导和自动提示工程的少样本方法最接近专家判断。
Comments 22 pages, 2 figures
Calibration Without Comprehension: Diagnosing the Limits of Fine-Tuning LLMs for Vulnerability Detection in Systems Software
无理解的校准:诊断微调大语言模型在系统软件漏洞检测中的局限性
专题命中 其他LLM :诊断微调LLM在漏洞检测中的局限性
AI总结 提出CWE-Trace框架,通过834个Linux内核样本和两个诊断指标(DFI和HDD)评估LLM漏洞检测能力,发现数据污染无实质帮助,微调仅改变输出阈值而非决策策略,模型缺乏真正的安全推理能力。