Multi-View Decompilation for LLM-Based Malware Classification
基于LLM的恶意软件分类的多视角反编译
发表机构 * Independent Researcher(独立研究员) ; SPARK
专题命中 其他LLM :利用LLM分类反编译代码,涉及LLM应用
AI总结 提出多反编译器视角提升LLM恶意软件分类性能,通过Ghidra和RetDec的互补伪C代码提高召回率和F1分数。
AI 大模型
大语言模型、预训练、指令微调、后训练和语言模型应用。
基于LLM的恶意软件分类的多视角反编译
发表机构 * Independent Researcher(独立研究员) ; SPARK
专题命中 其他LLM :利用LLM分类反编译代码,涉及LLM应用
AI总结 提出多反编译器视角提升LLM恶意软件分类性能,通过Ghidra和RetDec的互补伪C代码提高召回率和F1分数。
面向令牌操作的大模型推理优化技术
发表机构 * China’s National Data Administration(中国国家数据管理局)
专题命中 其他LLM :综述大模型推理优化技术
AI总结 本文提出多模型融合、模型优化、计算-模型融合、计算-网络-模型融合四层技术架构,系统综述各层关键技术及产业现状,旨在降低令牌成本、提升服务效率、保障供应稳定性,推动大模型服务从可调用到可运营的转变。
Comments 62 pages, 36 figures
PsyScore: 一种心理测量感知的特质自适应作文评分与最近发展区支架反馈框架
发表机构 * Department of Educational Psychology, East China Normal University(华东师范大学教育心理学系) ; Shanghai Institute of Artificial Intelligence for Education, East China Normal University(华东师范大学上海智能教育研究院) ; School of Computer Science and Technology, East China Normal University(华东师范大学计算机科学与技术学院)
专题命中 其他LLM :使用LLM生成自适应反馈
AI总结 提出PsyScore框架,通过共享潜在能力表示整合诊断评估与教学支架,包括特质自适应神经IRT评分器、ZPD支架反馈生成器和多视角反馈评估策略,在ASAP++数据集上实现竞争性评分性能并提供更符合教学法的反馈。
组合性在窄深度-连接性区域中涌现:架构约束与解流形
发表机构 * National University of Singapore(新加坡国立大学) ; University of Twente(特温特大学)
专题命中 其他LLM :研究组合性在稀疏网络中的涌现机制
AI总结 研究发现组合性仅在特定稀疏网络和特定深度区间涌现,提出基于相似性的剪枝和深度预测方法,并用理论框架解释原因。
近乎智能的革命:扩大审议规模并利用AI赋能人类的选项
发表机构 * Centre on Participatory and Deliberative Democracy(参与性和协商性民主研究中心)
专题命中 其他LLM :LLM用于民主审议规模扩大。
AI总结 探讨大型语言模型如何通过系统功能语言学视角扩大民主审议规模,增强包容性并赋权边缘群体,同时警惕过度承诺与低估风险。
Comments Published in /Handbook of Democracy in the Era of Artificial Intelligence/ edited by Evangelos Pournaras, Srijoni Majumdar, Carina Ines Hausladen, and Dirk Helbing. 2026
大型语言模型并不总是需要可读语言
发表机构 * Shanghai Jiao Tong University(上海交通大学) ; The University of Sydney(悉尼大学) ; Hefei University of Technology(合肥工业大学) ; Xi’an Jiaotong University(西安交通大学) ; Nanjing University(南京大学)
专题命中 其他LLM :探索非标准文本表示,降低上下文开销。
AI总结 研究提出BabelTele表示法,将语义编码为紧凑、非标准文本,牺牲人类可读性但保持LLM可恢复性,实验表明可压缩至27.9%长度并保持99.5%语义保真度,降低上下文开销。
Comments 23 pages, 10 figures. Preprint
对抗性同伴下的异构LLM辩论:诚实增益、替代成本与韧性
专题命中 其他LLM :研究异构LLM辩论中诚实与对抗性同伴的影响。
AI总结 研究异构LLM辩论中诚实与对抗性同伴对修正行为的影响,发现诚实同伴降低有害修正率,对抗性同伴则逆转,且异构性在已有对手时也能作为防御。
聚类即一切:利用语言模型中的语义聚类预训练Tsetlin Machine以实现可解释性
发表机构 * Independent Researcher(独立研究员) ; University of California, Irvine(加州大学尔湾分校) ; University of the Chinese Academy of Sciences(中国科学院大学)
专题命中 其他LLM :利用语言模型语义聚类预训练Tsetlin Machine,提升可解释性。
AI总结 提出一种语义预训练框架,通过K-means或Top2Vec将文本聚类,用聚类-样本对预训练Tsetlin Machine,使其学习可解释的语义关键词,在五个数据集上性能优于传统方法且与BERT竞争。
基于推理:确定性封装生成模型的原则
发表机构 * Odenton, MD, USA(美国马里兰州奥登顿)
专题命中 其他LLM :讨论AI混合架构中生成模型的确定性封装原则。
AI总结 提出四种AI混合架构原语,实现概率模型的确定性封装,并指出两个行业反模式,为AI与传统系统集成提供基础框架。
Comments 12 pages, 3 figures
通过演化程序瓶颈解释神经组合优化
发表机构 * Carnegie Mellon University(卡内基梅隆大学) ; Nanyang Technological University(南洋理工大学) ; Microsoft Research(微软研究院) ; Massachusetts Institute of Technology(麻省理工学院)
专题命中 其他LLM :利用LLM演化程序解释神经组合优化模型。
AI总结 提出演化程序瓶颈(EPB)框架,通过将黑盒神经组合优化模型蒸馏为可读程序组合,利用LLM和混合梯度下降实现可解释性,揭示模型行为与经典启发式变体的关系。
Comments Under Review
缩小语义缓存中的校准差距
发表机构 * New York University(纽约大学) ; Redis(Redis公司)
专题命中 其他LLM :语义缓存用于降低LLM推理成本。
AI总结 针对语义缓存系统中离线指标与部署性能的差距,提出P-CHR AUC和CRR指标,发现校准差距由训练目标主导,模型选择本质是校准问题。
Comments 23 pages, 2 figures. Source code: https://github.com/aditeyabaral/calibration-gap-semantic-caching ; Models and Datasets: https://huggingface.co/redis
超越静态排行榜:LLM智能体评估的预测有效性
发表机构 * IBM
专题命中 其他LLM :研究LLM智能体评估的泛化问题。
AI总结 本文通过14项并行研究,论证聚合分数排行榜无法泛化到分布外场景,提出基于预测有效性的排名配置方法,并设计可证伪的分布外评估标准。
Comments 17 pages, 2 tables, 5 figures
基于BART的分层策略用于越南语抽象式多文档摘要
发表机构 * Aimesoft JSC(Aimesoft股份公司)
专题命中 其他LLM :基于BART的越南语多文档摘要,属于语言模型应用
AI总结 提出一种新颖简单的基于黄金摘要缩短文档的分层策略,结合BART模型实现越南语多文档抽象式摘要,在VLSP 2022测试集上达到ROUGE2-F1 0.2468,并利用外部数据增强训练。
Comments originally written in 2022
分析大语言模型-求解器循环中的叙述差距
发表机构 * Eindhoven University of Technology(埃因霍温理工大学)
专题命中 其他LLM :分析LLM-求解器循环中的叙述差距和安全漏洞
AI总结 研究LLM与SAT/SMT求解器混合推理中,将求解器输出转化为用户答案的叙述步骤存在的安全漏洞,通过形式化建模和实验评估发现证书门控可保证求解结果正确,但对抗攻击可反转结论。
LLM代理中寻求澄清的不确定性分解
发表机构 * AI Talent Hub, ITMO University(AI Talent Hub, ITMO大学)
专题命中 其他LLM :基于提示的不确定性分解方法用于LLM代理
AI总结 提出一种基于提示的不确定性分解方法,将行动置信度与请求不确定性分离,使代理能在任务规范模糊时主动寻求澄清,在五个LLM骨干上平均澄清F1提升36%-73%。
Comments 26 pages, 8 figures. Source code: https://github.com/PE51K/udcs-in-llm-agents
位移不是方向:评估量化LLM部署的保真度指标
发表机构 * ByteShape ; University of Toronto(多伦多大学) ; Vector Institute for Artificial Intelligence(向量人工智能研究所)
专题命中 其他LLM :评估量化LLM部署的保真度指标,属于LLM应用
AI总结 本文研究KL散度等保真度指标在量化语言模型部署中与下游基准分数的相关性,发现整体强相关但在近基线区域失效,归因于KL散度主要衡量分歧量而非方向。
上下文学习能否支持内在好奇心?
发表机构 * Google – Paradigms of Intelligence Team(Google – 智能范式团队) ; Google DeepMind
专题命中 其他LLM :利用序列模型上下文学习作为世界模型,探索好奇心。
AI总结 研究利用序列模型的上下文学习能力作为即时无更新世界模型,以消除传统内在好奇心方法中梯度下降的计算瓶颈,理论证明在非时间设置下可渐近收敛到真实学习进度。
推理的热力学特征:用于大型语言模型幻觉检测的自由能和谱形因子诊断
发表机构 * Talan Research & Innovation Center(Talan研究与创新中心)
专题命中 其他LLM :热力学特征用于LLM幻觉检测。
AI总结 提出自由能签名(Fes)作为谱描述符,将注意力拉普拉斯视为哈密顿量并提取热力学势和随机矩阵理论谱形因子,用于检测LLM幻觉,无需训练即可实现高AUROC。
强化学习基础模型本应已经存在
发表机构 * École normale supérieure de Paris, PSL University, Paris, France(巴黎高等师范学院,PSL大学,法国巴黎) ; Soda team, Inria Saclay, Palaiseau, France(Soda团队,法国国家信息与自动化研究所萨克雷中心,法国帕莱索)
专题命中 其他LLM :提出强化学习基础模型概念
AI总结 提出通过合成MDP构建强化学习基础模型,利用固定大小的充分统计量使注意力架构适用,在线和离线实验均优于传统算法。
基于上下文学习的音频情感分类的LLM合成真实标签生成
发表机构 * School of Business, Technical University of Applied Sciences Augsburg(应用技术大学阿沙芬堡商学院) ; Data Science und Autonome Systeme Technologietransferzentrum (TTZ)(数据科学与自主系统技术转移中心(TTZ))
专题命中 其他LLM :LLM生成音频情感标签
AI总结 提出利用大语言模型(LLM)和上下文学习(ICL)从多用户VR环境的流式语音数据中自动生成情感相关合成真实标签,解决团队协作状态标注难题。
Comments https://icaiit.org/paper.php?paper=14th_ICAIIT_2/3_9
学习记住什么:通过约束优化实现长时域语言代理的观测安全记忆保留
发表机构 * Huawei Noah's Ark Lab(华为诺亚方舟实验室) ; Department of Computer Science, City University of Hong Kong(香港城市大学计算机科学系)
专题命中 其他LLM :针对语言代理的上下文窗口限制提出方法
AI总结 针对长时域语言代理的有限上下文窗口,提出OSL-MR框架,将记忆保留建模为约束随机优化问题,通过在线可观测特征与离线监督的严格分离学习查询条件化的证据价值,实验表明在严格预算下优于现有方法。
通过事件驱动的多智能体模拟器建模美国对华态度
专题命中 其他LLM :基于LLM的多智能体模拟,驱动舆论演化
AI总结 提出事件驱动多智能体模拟器(ES-MAS),利用CURE数据集和双流数据集成引擎(DSDIE)及新闻驱动动态交互模块(NDDI),模拟美国对华舆论的动态演化,实验表明优于现有模型。
太长;没解决
发表机构 * Instituto Balseiro(巴塞罗那研究所) ; Poindexter Labs(波因迪克斯实验室)
专题命中 其他LLM :提示长度与数学推理性能关系研究
AI总结 研究提示长度和解答长度与大型语言模型在数学问题上的性能关系,发现两者与模型失败率正相关。
教导学生质疑机器:一项AI素养干预措施提升学生在科学任务中调节LLM使用的能力
专题命中 其他LLM :AI素养干预提升学生LLM使用能力
AI总结 本研究通过两小时的AI素养工作坊,训练中学生(8-9年级)在科学问题解决中更有效地使用大语言模型,减少盲目依赖并提高答案质量。
Comments Workshop paper accepted at ALIT4ALL 2026: 2nd International Workshop on AI Literacy Education For All, co-located with AIED 2026
言语背后的声音:量化语音大语言模型中的交叉偏见
发表机构 * 1 Department of Speech, Music ; Hearing, KTH Royal Institute of Technology, Sweden 2 Centre for Speech Technology Research, University of Edinburgh, UK 3 Texas A\&M University, USA
专题命中 其他LLM :语音大语言模型中的交叉偏见量化
AI总结 本研究通过2880次受控交互,评估三种语音大语言模型在六种英语口音和两种性别呈现中的口音与性别交叉偏见,发现东欧口音(尤其女性)获得更低有用性评分,且人类评估者比LLM评判更敏感。
Comments 5 pages, 3 figures, 1 table, Accepted to Interspeech 2026
超越评分准确性:探索助教与LLMs的一致性
专题命中 其他LLM :开源LLM用于UML类图评分评估
AI总结 本文提出一个评估管道,通过定量研究92个UML类图,比较助教与六个开源LLMs在单个评分标准上的表现,发现开源LLMs在评分准确性上接近助教,为混合主动评分系统提供了可能。
Comments 7 pages, 3 figures
受监管社交媒体平台下的语言演化模拟:大语言模型与遗传算法的协同方法
专题命中 其他LLM :用LLM模拟语言演化,结合遗传算法
AI总结 提出基于大语言模型的多智能体框架,结合遗传算法模拟用户语言策略在监管下的迭代演化,实验表明对话轮次增加可提升信息传递准确性和对话持续性。
Comments The manuscript has been accepted to IEEE Transactions on Computational Social Systems
执行状态胶囊:面向低延迟、小批量、设备端物理AI服务的图绑定执行状态检查点与恢复
发表机构 * GitHub
专题命中 其他LLM :面向LLM服务的执行状态检查点与恢复机制
AI总结 针对低延迟、小批量、设备端物理AI服务场景,提出执行状态胶囊机制,通过图绑定检查点与恢复完整可恢复状态,在RTX 5090上实现亚毫秒级恢复,TTFT加速比达3.9倍至27倍。
Comments 27 pages, 9 figures
具有特征选择和交互的神经加性模型与神经基础模型
发表机构 * Yokohama National University(横滨国立大学)
专题命中 其他LLM :提出在神经加性模型中引入特征选择机制,属于可解释机器学习方法,与LLM无直接关系。
AI总结 提出在神经加性模型和神经基础模型中引入特征选择机制,通过特征选择层减少计算开销,并支持高维数据中的特征交互学习,性能优于或持平于现有GAM方法。
Comments Accepted at PAKDD 2024. Code is available at https://github.com/shiralab/NAM-FS
CREDENCE: 面向分解与增强可信度的声明缩减——语义度量与收敛性分析
发表机构 * Vietnamese-German University(越南德国大学) ; Ho Chi Minh University of Technology(胡志明市理工大学)
专题命中 其他LLM :声明分解和修复框架,用于事实核查,与LLM应用相关。
AI总结 提出CREDENCE框架,通过语义F1度量解决Jaccard度量对释义声明的低估问题,并形式化分析修复管道的收敛性,实验表明语义F1比Jaccard F1提升15-32个百分点,规则修复将原子性违反率降低47-100%。
Comments 40 pages, 6 figures, 19 tables. Submitted to Language Resources and Evaluation