From Token to Token Pair: Efficient Prompt Compression for Large Language Models in Clinical Prediction
AI总结 该研究针对医疗电子健康记录(EHR)在临床预测任务中产生的长序列问题,提出了一种名为MedTPE的高效无损压缩方法。该方法通过合并高频共现的医学词对生成复合词,实现对原始序列的压缩,同时保持计算复杂度和模型性能。实验表明,MedTPE在多个临床预测任务中有效减少了输入长度和推理延迟,且在不同模型和语言环境下均表现出良好的鲁棒性和泛化能力。
Comments 21 pages, 6 figures, 13 tables