arXivDaily每日学术速递，同步arXiv全量数据，AI总结、翻译，覆盖人工智能、机器人、计算机、金融、统计学、数学、物理学、生物学、经济学、电气&系统等方向。

2605.07492 2026-05-11 cs.CV

How Far Is Document Parsing from Solved? PureDocBench: A Source-TraceableBenchmark across Clean, Degraded, and Real-World Settings

Zhiheng Li, Zongyang Ma, Jiaxian Chen, Jianing Zhang, Zhaolong Su, Yutong Zhang, Zhiyin Yu, Ruiqi Liu, Xiaolei Lv, Bo Li, Jun Gao, Ziqi Zhang, Chunfeng Yuan, Bing Li, Weiming Hu

AI总结尽管已有超过20个开源文档解析模型，但现有基准OmniDocBench存在标注质量不高和数据污染的问题，其排名可靠性受到质疑。为此，研究者提出了PureDocBench，一个可追溯来源的基准，涵盖10个领域、66个子类和1,475页文档，分别生成清晰、数字退化和真实退化三个版本，共计4,425张图像。实验表明，当前最佳模型的性能仅为74/100，模型间性能差距显著，且通用视觉语言模型在退化场景下表现更稳健，凸显了现有文档解析任务仍面临诸多挑战。

Comments 42 pages, 20 figures, 16 tables

2605.07491 2026-05-11 cs.CV

Implicit Multi-Camera System Calibration Using Gaussian Processes

Ivan De Boi, Bart Ribbens, Veronika Golanova, Ursula Kapov, Simon Verspeek

AI总结本文提出了一种基于高斯过程（GP）回归的隐式多相机系统标定新框架。与传统依赖刚性数学模型的显式标定方法以及数据需求大且缺乏不确定性量化的神经网络方法不同，该方法直接学习所有相机图像坐标到三维世界坐标的复杂非线性映射，无需显式估计内在和外在参数。通过引入主动学习策略，进一步提升数据效率和实用性，使标定过程更加鲁棒、高效且可靠，特别适用于难以获取大量标定数据的实际场景。

2605.07489 2026-05-11 cs.SD cs.MM eess.SP

A Decomposed Retrieval-Edit-Rerank Framework for Chord Generation

Qiqi He, Dichucheng Li, Xiaoheng Sun, Anqi Huang

AI总结该论文提出了一种用于和弦生成的分解式检索-编辑-重排序（RER）框架，旨在解决在保持音乐理论可行性的同时提升风格多样性这一挑战。该方法将生成过程分解为三个明确阶段：检索候选和弦、编辑以确保理论可行性、重排序以优化偏好。通过这种结构化流程，系统实现了更高的可控性和可解释性，并在客观指标和主观评估中优于现有端到端方法。

Comments Accepted by the 2026 ACM International Conference on Multimedia Retrieval (ICMR 2026)

2605.07488 2026-05-11 cs.AI cs.LG

Efficient Data Selection for Multimodal Models via Incremental Optimization Utility

Jinhao Jing, Qiannian Zhao, Chao Huang, Zhan Su

AI总结本文针对大型多模态模型（LMMs）在合成数据质量与数量之间的权衡问题，提出了一种高效的数据选择方法One-Step-Train（OST）。该方法通过增量优化效用排名问题重新定义数据选择过程，利用轻量代理模型模拟单步更新来估计每个样本的边际效用，从而避免了传统方法的高计算成本和可解释性不足的问题。实验表明，OST在多模态数学推理任务中实现了帕累托最优效率，大幅降低了训练成本并提升了模型性能。

2605.07485 2026-05-11 cs.LG cs.AI

Excluding the Target Domain Improves Extrapolation: Deconfounded Hierarchical Physics Constraints

Tsuyoshi Okita

AI总结本文研究了如何提升物理约束深度生成模型在分布外条件下的外推能力。作者提出了一种去混淆分层门控机制（DHG），通过识别温度混淆对各层次物理约束的影响，分离出真正的物理不一致性，从而更有效地应用分层物理约束。实验表明，在预训练阶段排除目标域数据反而提升了外推性能，作者在锂离子电池温度预测任务中实现了比基线方法高46%的性能提升。

Comments 16 pages, 2 figures

2605.07478 2026-05-11 cs.CV

AudioFace: Language-Assisted Speech-Driven Facial Animation with Multimodal Language Models

Kai Zheng, Zejian Kang, Rui Mao, Hongyuan Zou, Yuanchen Fei, Xuanyang Xu, Xiangru Huang

AI总结本文提出了一种名为AudioFace的语言辅助语音驱动面部动画框架，旨在解决语音信号与面部运动之间精确对应的问题，特别是与发音相关的口部动作。该方法通过引入多模态大语言模型的先验知识，结合语音转录和音素级别的语言线索，将口部相关面部参数的生成建模为由语言和发音信息引导的结构化生成过程。实验表明，AudioFace在多个评估指标上均表现出色，验证了语言辅助和多模态先验引导方法在语音驱动面部动画中的有效性。

2605.07477 2026-05-11 cs.CV

ReasonEdit: Towards Interpretable Image Editing Evaluation via Reinforcement Learning

Honghua Chen, Zitong Xu, Huiyu Duan, Xinyun Zhang, Xiongkuo Min, Guangtao Zhai

AI总结近年来，文本引导的图像编辑模型虽然取得了显著进展，但生成结果仍常存在伪影、非预期修改和审美不足等问题。为解决现有评估方法缺乏可解释性的问题，本文提出了ReasonEdit-22K数据集，包含22,000张编辑图像和113,000个链式推理样本，并配有130万个人类评估结果。基于该数据集，研究者构建了RE-Reward奖励模型和ReasonEdit评估模型，通过强化学习方法实现了对图像编辑可解释性的高效评估，实验表明该方法在对齐人类偏好和跨基准泛化能力方面表现优异。

2605.07476 2026-05-11 cs.LG

NPMixer: Hierarchical Neighboring Patch Mixing for Time Series Forecasting

Jung Min Choi, Vijaya Krishna Yalavarthi, Lars Schmidt-Thieme

AI总结多变量时间序列预测面临局部时间动态和多变量全局依赖关系的复杂性挑战。本文提出了一种分层结构的NPMixer模型，通过可学习的平稳小波变换对信号进行数据依赖的时频分解，并引入邻域混合块以捕捉局部时间模式和跨尺度依赖关系。实验表明，NPMixer在七个基准数据集上表现优异，在28个实验设置中的20个（71.4%）上优于现有先进方法。

2605.07474 2026-05-11 cs.CV cs.AI

ForgeVLA: Federated Vision-Language-Action Learning without Language Annotations

Yuhao Zhou, Yunpeng Zhu, Yang Zhou, Jindi Lyu, Jian Lan, Zhangyuan Wang, Dan Si, Thomas Seidl, Qing Ye, Jiancheng Lyu

AI总结本文提出了一种名为ForgeVLA的联邦视觉-语言-动作学习框架，旨在在无需语言标注和中央数据聚合的情况下，利用分布式视觉-动作对训练通用机器人智能模型。每个客户端通过内嵌的指令分类器将视觉-动作对映射到预定义指令集，从而恢复缺失的语言模态，形成完整的三元组。为了解决联邦VLA中常被忽视的视觉-语言特征坍缩问题，ForgeVLA结合了客户端对比规划损失和服务器端自适应聚合策略，有效提升了模型的表示能力。实验表明，ForgeVLA在多个基准上显著优于现有方法。

Comments 26 pages

2605.07471 2026-05-11 cs.LG hep-ex

Transfer Learning Across Fast- and Full-Simulation Domains in High-Energy Physics

Matthias Schott, Lucie Flek

AI总结本文研究了在高能物理实验中，如何在快速模拟与全模拟数据之间进行迁移学习。作者在真实的LHC环境中，系统性地探讨了迁移学习方法，并应用于信号-背景分类、夸克-胶子喷注识别和缺失横向能量重建等任务，使用了密集神经网络、图神经网络和基于Transformer的架构。结果表明，基于快速模拟预训练的模型在全模拟数据上表现优于从头训练的模型，且所需的目标域训练数据量可减少约一半，展示了快速模拟在学习鲁棒可复用表示方面的潜力。

Comments 16 pages, 8 figures

2605.07470 2026-05-11 cs.LG hep-ex

Uncovering Hidden Systematics in Neural Network Models for High Energy Physics

Lucie Flek, Philipp Alexander Jungs, Akbar Karimi, Timo Saala, Alexander Schmid, Matthias Schott, Philipp Soldin, Christopher Wiebusch, Ulrich Willemsen

AI总结本文研究了高能物理分析中神经网络模型对输入变量细微变化的隐藏系统性敏感性问题。作者受对抗攻击研究的启发，发现即使输入变量的分布保持不变，神经网络的输出仍可能因实验不确定性的微小扰动而发生显著变化。为此，他们提出了一种量化框架，用于探测和测量神经网络在真实实验条件下的系统性不确定性，为高能物理分析中模型不确定性的评估和控制提供了实用方法。

Comments 18 pages, 9 figures

2605.07467 2026-05-11 cs.LG cs.AI cs.ET

Physical Simulators as Do-Operators: Causal Discovery under Latent Confounders for AI-for-Science

Tsuyoshi Okita

AI总结该研究针对AI-for-Science领域中普遍存在的潜在混杂因素问题，提出了一种新的因果发现方法CFM-SD，利用第一性原理的物理模拟器作为干预操作符，有效处理真实干预数据和潜在混杂因素。理论上，该方法仅需$O(d)$次单变量干预即可识别$d$变量因果结构，实验表明其在合成数据和真实科学数据上的表现显著优于现有方法，展现出在分子毒性预测和电池电解液优化等实际任务中的应用价值。

Comments 17 pages, 1 figure

2605.07466 2026-05-11 cs.CV

A Unified Framework for the Detection and Classification of Fatty Pancreas in Ultrasound Images

Ioan-Tudor-Alexandru Anghel, Ciprian-Mihai Ceausescu, Elena Dana Nedelcu, Elena Raluca Stirban, Camelia Croitoru, Despina Ungureanu, Ana Maria Palan, Gabriela Pop

AI总结本文提出了一种统一的端到端框架，用于从腹部超声图像中自动检测和分类脂肪性胰腺。该方法基于TransUNet架构，结合ResNet编码器和Transformer瓶颈模块进行胰腺和脾静脉的分割，随后通过解剖引导的图像块提取和纹理对比实现分类，模拟了临床判断过程。实验在包含214例超声图像的临床数据集上验证，结果显示该方法在无监督条件下仍能有效捕捉临床信号，分类准确率和F1值均优于基线方法，为脂肪性胰腺的自动化诊断提供了新的解决方案。

2605.07465 2026-05-11 cs.CL

SEIF: Self-Evolving Reinforcement Learning for Instruction Following

Qingyu Ren, Qianyu He, Jiajie Zhu, Xingzhou Chen, Jingwen Chang, Zeye Sun, Han Xia, Fei Yu, Jiaqing Liang, Yanghua Xiao

AI总结本文提出了一种名为SEIF的自进化强化学习框架，旨在提升大语言模型的指令遵循能力。该方法通过构建一个包含生成指令、过滤指令、遵循指令和评判奖励的闭环系统，使指令难度与模型能力相互促进、共同进化。实验表明，SEIF在多种模型规模和架构上均能有效提升指令遵循性能，具有良好的通用性，并揭示了在开放任务中实现自进化训练的有效策略。

2605.07463 2026-05-11 cs.LG

Approximation Error Upper and Lower Bounds for Hölder Class with Transformers

Xin He, Yuling Jiao, Xiliang Lu, Jerry Zhijian Yang

AI总结本文研究了Transformer模型在逼近Hölder类函数时的表达能力，给出了精确的上界和下界误差分析。通过引入Softmax操作符、ReLU激活函数和残差连接，推导出标准Transformer架构的逼近上界，并证明在给定精度下，仅需$\mathcal{O}(\varepsilon^{-{d_{0}}/α})$个块即可逼近任意有界Hölder函数。同时，利用VC维上界首次严格证明了Transformer实现$\varepsilon$精度所需的块数下界为$Ω(\varepsilon^{-{d_{0}}/({4α})})$，并进一步将结果推广到一般回归任务，展示了Transformer在实际应用中的有效性。

Comments 31 pages, 2 figures. Accepted by ICML2026

2605.07462 2026-05-11 cs.CL cs.AI

The Moltbook Files: A Harmless Slopocalypse or Humanity's Last Experiment

William Brach, Federico Torrielli, Stine Lyngsø Beltoft, Annemette Brok Pirchert, Peter Schneider-Kamp, Lukas Galke Poech

AI总结《The Moltbook Files: A Harmless Slopocalypse or Humanity's Last Experiment》研究了一个类似Reddit的平台Moltbook上OpenClaw智能体的大规模发帖、评论和投票行为，分析其社区结构、语言特征、情感倾向及交互模式，并通过去隐私化处理后构建了一个包含23万篇帖子和220万条评论的数据集。研究还探讨了该数据对语言模型的影响，发现基于Moltbook微调的模型在真实性指标上有所下降，但与同规模的Reddit数据集效果相近，表明Moltbook可能更多是“无害的混乱”而非严重风险。研究强调了在评估新兴对齐问题时，控制基线的重要性。

2605.07461 2026-05-11 cs.CL

Think-with-Rubrics: From External Evaluator to Internal Reasoning Guidance

Jiachen Yu, Zhihao Xu, Junjie Wang, Yujiu Yang

AI总结该研究提出了一种名为“Think-with-Rubrics”的新范式，旨在将评分标准（rubrics）从传统的外部评估工具转变为指导大语言模型生成过程的内部推理依据。通过在训练过程中让模型依次生成评分标准并根据其生成回答，同时利用评分验证器进行联合监督，该方法有效提升了模型的生成质量与一致性。实验表明，该方法在多个基准任务上优于基于黄金评分标准的奖励机制，平均提升了3.87个点。

2605.07460 2026-05-11 cs.LG hep-ex

Learning Minimal-Deviation Corrections for Multi-Dimensional Mismodelling in HEP Simulations

Matthias Schott, Lucie Flek

AI总结在高能物理实验中，精确的蒙特卡洛模拟面临多维建模误差的挑战，而实验数据通常仅提供一维分布信息。本文提出了一种基于神经网络的方法，在仅利用一维目标分布的情况下，学习对模拟事件进行最小偏差修正，从而在保持原始模拟全局相关性的同时，修正多维建模误差。该方法在控制实验中表现出对目标分布的良好拟合能力，为高维复杂分析提供了一种高效且可扩展的修正方案。

Comments 12 pages, 6 figures

2605.07458 2026-05-11 cs.LG

Estimation of Motor Unit Parameters from Surface Electromyograms using an Informed Autoencoder

Kaja Balzereit, Malte Mechtenberg, Axel Schneider

AI总结该研究旨在从非侵入式表面肌电信号中同时估计多个个体特异的运动单元参数，如支配区中心和电位传导速度，以提升神经机械模型的预测精度。为解决这一非线性逆问题，作者提出了一种结合物理规律的有监督自编码器，能够在重构表面肌电信号的同时学习参数特征。实验表明，该方法在合成数据上实现了较高的参数估计精度，展示了其在减少人工建模工作量方面的潜力。

2605.07457 2026-05-11 cs.CV

EditRefiner: A Human-Aligned Agentic Framework for Image Editing Refinement

Zitong Xu, Huiyu Duan, Yifei Nie, Mingda Du, Sijing Wu, Xiongkuo Min, Tianyi Zheng, Jian Zhang, Shusong Xu, Jinwei Chen, Bo Li, Guangtao Zhai

AI总结本文提出了一种名为EditRefiner的人机对齐智能框架，用于解决文本引导图像编辑中的细粒度问题，如物体不自然、光照不匹配等。该方法基于一个包含15,000张图像和大量标注信息的EditFHF-15K数据集，构建了一个分层的感知-推理-行动-评估循环系统，实现了对编辑结果的精准诊断与局部修正。实验表明，EditRefiner在定位失真、诊断准确性和人类感知一致性方面均优于现有方法，为自纠正、感知可靠的图像编辑提供了新范式。

详情

英文摘要

Recent text-guided image editing (TIE) models have made remarkable progress, yet edited images still frequently suffer from fine-grained issues such as unnatural objects, lighting mismatch, and unexpected changes. Existing refinement approaches either rely on costly iterative regeneration or employ vision-language models (VLMs) with weak spatial grounding, often resulting in semantic drift and unreliable local corrections. To address these limitations, we first construct EditFHF-15K, a dataset of fine-grained human feedback for edited images, comprising (1) 15K images from 12 TIE models spanning 43 editing tasks, (2) 60K annotated artifact regions and 80K editing failure regions, each accompanied by textual reasoning, and (3) 45K mean opinion scores (MOSs) assessing perceptual quality, instruction following, and visual consistency. Based on EditFHF-15K, we propose EditRefiner, a hierarchical, interpretable, and human-aligned agentic framework that reformulates post-editing correction as a human-like perception-reasoning-action-evaluation loop. Specifically, we introduce: (1) a perception agent that detects contextual saliency maps of artifacts and editing failures, (2) a reasoning agent that interprets these perceptual cues to perform human-aligned diagnostic inference, (3) an action agent that uses the reasoning output to plan and execute localized re-editing, and (4) an evaluation agent that assesses the re-edited image and guides the action agent on whether further refinements are required. Extensive experiments demonstrate that EditRefiner consistently outperforms state-of-the-art methods in distortion localization, diagnose accuracy and human perception alignment, establishing a new paradigm for self-corrective and perceptually reliable image editing. The code is available at https://github.com/IntMeGroup/EditRefiner.

URL PDF HTML ☆

赞 0 踩 0

2605.07456 2026-05-11 cs.LG

Inference-Time Attribute Distribution Alignment for Unconditional Diffusion

Hao Luan, See-Kiong Ng, Chun Kai Ling

AI总结本文研究了无条件扩散模型在推理阶段生成可控样本以满足特定属性分布的问题。为解决现有方法在群体属性分布对齐方面的不足，作者将问题建模为对反向扩散过程的最优控制问题，并通过添加时间依赖的扰动作为控制变量进行优化。实验表明，该方法无需重新训练模型即可在图像生成任务中更有效地实现多样且灵活的属性分布对齐。

Comments Preprint. 35 pages, 13 figures

2605.07455 2026-05-11 cs.CV

EditTransfer++: Toward Faithful and Efficient Visual-Prompt-Guided Image Editing

Lan Chen, Qi Mao, Yiren Song, Yuchao Gu, Siwei Ma

AI总结 EditTransfer++ 是一种面向视觉提示引导图像编辑的方法，旨在通过示例对直接学习图像变换，实现比纯文本驱动方法更精确和可控的编辑效果。该方法通过解耦文本条件训练、引入对比优化机制以及条件压缩策略，有效提升了视觉提示的忠实度和推理效率，尤其在高分辨率图像编辑任务中表现出色。实验表明，EditTransfer++ 在多个基准测试中取得了最先进的性能，显著优于现有方法。

2605.07454 2026-05-11 cs.CL

GRaSp: Automatic Example Optimization for In-Context Learning in Low-Data Tasks

Simen Bihaug-Frøyland, Henrik Brådland

AI总结 GRaSp 是一种用于低数据任务中上下文学习的自动示例优化框架，旨在提升大语言模型在领域特定任务中的表现。该方法采用三阶段策略，通过生成合成示例池、聚类结构化处理以及遗传算法优化，有效提升了命名实体识别任务的效果。研究还引入了一种自适应变异机制，增强了进化过程中的多样性控制，并在金融实体识别任务中验证了其优越性，显著优于零样本和随机少样本基线方法。

Comments 12 pages, 5 figures

2605.07453 2026-05-11 cs.CL

Data Contamination in Neural Hieroglyphic Translation: A Reproducibility Study

Ammar Toutou, Abdelrahman Harb, Christine Basta

AI总结本文研究了神经机器翻译在处理濒危语言——埃及圣书体文字到德语翻译任务中的数据污染问题。作者复现了先前使用M2M-100模型取得的61.5 BLEU分数，但发现实际仅能达到37.0 BLEU，差距源于测试集中2%的目标句子在训练数据中重复出现。研究进一步表明，数据污染显著高估了模型性能，并提出通过目标级去重的方法来缓解问题，最终发布了去污染后的测试集并提供了更准确的性能基准。

Comments Accepted to NLP4DH 2026 Conference

2605.07452 2026-05-11 cs.AI

Bounded Fitting for Expressive Description Logics

Maurice Funk, Jean Christoph Jung, Tom Voellmer

AI总结本文研究了在扩展的描述逻辑中使用有界拟合方法学习概念的问题，该逻辑包含逆角色、限定数量限制和特征比较等复杂构造。作者分析了在这些扩展条件下有界拟合方法能否保持其理论优势，并基于SAT求解器实现了该方法。实验结果表明，该方法在实际应用中表现良好，是一种有效的表达性概念学习方案。

Comments 16 pages, full version of paper accepted at IJCAI-ECAI 2026

2605.07451 2026-05-11 cs.LG

VNN-LIB 2.0: Rigorous Foundations for Neural Network Verification

Ann Roy, Allen Antony, Andrea Gimelli, Matthew L. Daggitt

AI总结本文介绍了 VNN-LIB 2.0，旨在为神经网络验证提供更严谨的理论基础。针对原版 VNN-LIB 在语法、语义和类型系统方面的不足，作者提出了“网络理论”的概念，抽象地定义了神经网络模型格式所需的最小语义接口，从而实现了与 ONNX 等模型表示的兼容性与独立性。基于这一理论，论文构建了更表达力强的查询语言形式语法、类型系统和形式语义，并通过 Agda 定理证明器进行机械化验证，为可信的神经网络验证提供了坚实基础。

2605.07447 2026-05-11 cs.CV cs.AI cs.CL cs.LG

Sparse Autoencoders as Plug-and-Play Firewalls for Adversarial Attack Detection in VLMs

Hao Wang, Yiqun Sun, Pengfei Wei, Lawrence B. Hsieh, Daisuke Kawahara

AI总结该研究提出了一种基于稀疏自编码器（SAE）的轻量级对抗攻击检测框架SAEgis，用于提升视觉语言模型（VLM）的安全性。通过将SAE模块嵌入预训练的VLM中，并利用标准重构目标进行训练，所学的稀疏潜在特征能够自然捕捉与攻击相关的信号，从而有效识别输入图像是否受到对抗性扰动。实验表明，SAEgis在领域内、跨领域和跨攻击场景下均表现出色，尤其在跨领域泛化能力方面显著优于现有方法，且无需额外对抗训练，具有较高的实用价值。

2605.07446 2026-05-11 cs.CL cs.LG

SSP-based construction of evaluation-annotated data for fine-grained aspect-based sentiment analysis

Suwon Choi, Shinwoo Kim, Changhoe Hwang, Gwanghoon Yoo, Eric Laporte, Jeesun Nam

AI总结本文介绍了一种基于符号传播（SSP）的半自动标注方法，用于构建细粒度方面级情感分析的评价标注语料库EVAD，专门用于电商评论中的情感和非情感语言模式分析。研究通过构建有限状态转换器（FST）等语言资源，扩展了传统ABSA方法，引入了方面值的概念并根据其类型（单一、二元或多值）进行分类，从而更准确地提取目标特征。实验表明，基于该语料库训练的KoBERT和KcBERT模型在方面-值对识别任务中取得了较高的F1分数（分别为0.88和0.90）。

2605.07442 2026-05-11 cs.LG

GameGen-Verifier: Parallel Keypoint-Based Verification for LLM-Generated Games via Runtime State Injection

Chaobo Jia, Ruipeng Wan, Ting Sun, Weihao Tan, Borui Wan, Yuxuan Tong, Guangming Sheng, Hong Xu

AI总结本文提出了一种名为GameGen-Verifier的自动化验证框架，用于验证基于大语言模型生成的游戏是否符合自然语言规范。该方法通过将游戏规范分解为可验证的关键点，并将其转化为独立的验证单元，在运行时注入目标状态并执行有限交互以判断是否符合规范。实验表明，该方法在准确性上显著优于现有方法，同时大幅减少了验证所需的时间。

2605.07432 2026-05-11 cs.CL cs.LG

Generating training datasets for legal chatbots in Korean

Changhoe Hwang, Jee-Sun Nam, Eric Laporte

AI总结本研究旨在解决法律聊天机器人训练数据多样性与标注成本高的问题，提出了一种基于本地语法图（LGG）的语言资源生成方法，能够同时生成大量对话文本及其高质量标签。该方法通过结合领域特定的分类体系，有效提升了数据的标注效率与质量。研究实现了韩国法律聊天机器人LIGA，其在处理用户法律咨询时能够准确匹配相关案例，实验表明所训练的模型在F1分数上达到了91%。

详情

Journal ref: International conference on Law and Society, Feb 2023, Hanoi, Vietnam. pp.1-4

英文摘要

Chatbots are robots that can communicate with humans using text or voice signals. Legal chatbots improve access to justice, since legal representation and legal advice by lawyers come with a high cost that excludes disadvantaged and vulnerable people. However, capturing the diversity of actual user input in datasets for deep-learning dialog systems (chatbots) is a technical challenge. Diversity requires large volumes of data, which must also be labelled in order to classify the user's intent, while the cost of labelling datasets increases with volume. Instead of labelling large volumes of authentic data from users, our approach consists in jointly generating large volumes of utterances and high-quality labels. The generator of labelled datasets is based on language resources that take the form of local grammar graphs (LGG), which capture and generalize the vocabulary and local syntax observed by linguists in text. The LGGs associate labels to the utterances according to a domain-specific classification system. We tested this approach by implementing LIGA, a legal chatbot in Korean. The chatbot answers users' conversational queries on legal situations by providing information on similar legal cases, made publicly available by the Korean government. We generated labelled utterances from the LGGs with the aid of the open-source Unitex platform. This process produced 700 million utterances. We trained a DIET classifier on a dataset made of these utterances, and the trained model reached 91% f1-score performance. We implemented a chatbot called LIGA, which uses the results of the model to select a link to a web page that documents similar legal cases.

URL PDF HTML ☆

赞 0 踩 0