AI 大模型
语言大模型 / LLM
大语言模型、预训练、指令微调、后训练和语言模型应用。
1. 后训练 4 篇
2. 指令微调 4 篇
Target-Side Paraphrase Augmentation for Sign Language Translation with Large Language Models
面向手语翻译的大语言模型目标端释义增强
专题命中 指令微调 :使用GPT-4o生成释义增强手语翻译。
AI总结 针对手语翻译中平行语料稀缺和目标词汇长尾分布的问题,提出利用GPT-4o生成参考句子的受控释义变体进行目标端增强,并在三种手语数据集上验证了方法的有效性。
Comments Accepted at GenSign @ CVPR 2026. Non-Proceedings Track (https://genai4sl.github.io/)
3. 预训练 2 篇
4. 其他LLM 13 篇
S2D2: Fast Decoding for Diffusion LLMs via Training-Free Self-Speculation
S2D2:通过免训练自我推测实现扩散LLM的快速解码
专题命中 其他LLM :扩散LLM解码加速,属于语言模型方法
AI总结 提出S2D2,一种免训练的自我推测解码框架,通过将块扩散模型在块大小为1时变为自回归模型,实现草稿与验证角色复用,在不增加训练或测试计算下提升解码速度与准确性。
Comments Code is available at https://github.com/phymhan/S2D2
Improving Alignment Between Human and Machine Codes: An Empirical Assessment of Prompt Engineering for Construct Identification in Psychology
改善人机编码对齐:心理学构念识别中提示工程的实证评估
专题命中 其他LLM :优化LLM在心理学文本中识别构念的提示工程。
AI总结 本研究提出一个实证框架,通过提示工程优化大语言模型在心理学文本中识别构念的性能。实验评估五种提示策略,发现构念定义和任务框架最关键,结合代码簿引导和自动提示工程的少样本方法最接近专家判断。
Comments 22 pages, 2 figures
Teaching Students to Question the Machine: An AI Literacy Intervention Improves Students' Regulation of LLM Use in a Science Task
教导学生质疑机器:一项AI素养干预措施提升学生在科学任务中调节LLM使用的能力
专题命中 其他LLM :AI素养干预提升学生LLM使用能力
AI总结 本研究通过两小时的AI素养工作坊,训练中学生(8-9年级)在科学问题解决中更有效地使用大语言模型,减少盲目依赖并提高答案质量。
Comments Workshop paper accepted at ALIT4ALL 2026: 2nd International Workshop on AI Literacy Education For All, co-located with AIED 2026
The Voice Behind the Words: Quantifying Intersectional Bias in SpeechLLMs
言语背后的声音:量化语音大语言模型中的交叉偏见
专题命中 其他LLM :语音大语言模型中的交叉偏见量化
AI总结 本研究通过2880次受控交互,评估三种语音大语言模型在六种英语口音和两种性别呈现中的口音与性别交叉偏见,发现东欧口音(尤其女性)获得更低有用性评分,且人类评估者比LLM评判更敏感。
Comments 5 pages, 3 figures, 1 table, Accepted to Interspeech 2026
Simulation of Language Evolution under Regulated Social Media Platforms: A Synergistic Approach of Large Language Models and Genetic Algorithms
受监管社交媒体平台下的语言演化模拟:大语言模型与遗传算法的协同方法
专题命中 其他LLM :用LLM模拟语言演化,结合遗传算法
AI总结 提出基于大语言模型的多智能体框架,结合遗传算法模拟用户语言策略在监管下的迭代演化,实验表明对话轮次增加可提升信息传递准确性和对话持续性。
Comments The manuscript has been accepted to IEEE Transactions on Computational Social Systems
5. 领域大模型 7 篇
Analyzing Error Propagation in Korean Spoken QA with ASR-LLM Cascades
分析韩语语音问答中ASR-LLM级联中的误差传播
专题命中 领域大模型 :研究ASR-LLM级联在韩语语音问答中的误差传播
AI总结 本文研究了韩语语音问答中ASR-LLM级联中误差传播的问题,通过分析下游语义失败,揭示了传统ASR指标无法完全捕捉的误差影响,发现不同性能的LLM在级联降级上的一致性,识别出单字符ASR错误作为语义失败通道,并通过辅助比较表明大音频语言模型在噪声韩语SQA中优于匹配语言模型的ASR-LLM流水线。
Comments Preprint. Submitted to APSIPA ASC 2026
TransLaw: A Large-Scale Dataset and Multi-Agent Benchmark Simulating Professional Translation of Hong Kong Case Law
TransLaw:模拟香港判例法专业翻译的大规模数据集与多智能体基准
专题命中 领域大模型 :多智能体框架用于法律翻译
AI总结 针对香港判例法英译中资源匮乏、法律术语和格式要求严格的问题,构建了首个大规模句对齐平行语料库HKCFA Judgment 97-22,并提出多智能体框架TransLaw,通过分解翻译任务、集成法律词汇库和检索增强生成,显著提升翻译质量,但仍未达到人类专家的风格自然度。
Comments Accepted at ICML 2026 - AI for Law
More Parameters Than Populations: A Systematic Literature Review of Large Language Models within Survey Research
参数多于总体:调查研究中的大语言模型系统文献综述
专题命中 领域大模型 :系统综述LLM在调查研究中的应用,涵盖三个阶段。
AI总结 通过系统文献综述,评估大语言模型在调查研究三个阶段(数据收集前、中、后)的应用,讨论其潜力与陷阱,并展望调查研究对LLM发展的贡献。
Comments This working paper is outdated as of June 2026 - please refer to the full version with substantive changes here: https://doi.org/10.31235/osf.io/eubj4_v1 This work was presented at NLPOR 2025 (non-archival): https://openreview.net/forum?id=0Hxhwa56Yg
TSAssistant: A Human-in-the-Loop Agentic Framework for Automated Target Safety Assessment
TSAssistant: 一种人在回路中的自动化靶点安全性评估智能体框架
专题命中 领域大模型 :利用LLM进行生物医学文献检索与综合
AI总结 提出TSAssistant多智能体框架,通过分层指令架构和交互式优化循环,将靶点安全性评估报告生成分解为专业子任务,实现高可重复性和证据溯源。
Comments Updated with quantitative and expert evaluations
Wisdom of Committee: Diverse Distillation from Large Foundation Models and Domain Experts
委员会智慧:来自大型基础模型和领域专家的多样化蒸馏
专题命中 领域大模型 :蒸馏基础模型到紧凑领域模型,涉及推荐和视觉
AI总结 针对基础模型向紧凑领域模型蒸馏时能力、架构和模态差异大的问题,提出DiverseDistill框架,通过可学习的问答机制和对齐异构教师输出,在推荐和视觉任务上恢复73-114%的性能差距。
Comments Accepted at the 1st Workshop on Resource-Efficient Learning and Knowledge Discovery (RelKD), KDD 2026
Journal ref Proceedings of the RelKD Workshop at KDD 2026