Towards the Next Frontier of LLMs, Training on Private Data: A Cross-Domain Benchmark for Federated Fine-Tuning
AI总结 本文探讨了在无法共享隐私数据的情况下,如何通过联邦学习的方式对大语言模型进行微调,以利用分布在不同机构中的非独立同分布(non-IID)私有数据。研究提出了一种基于Sherpa.ai平台的联邦微调框架,允许各节点协作优化共享模型而无需交换原始数据,并在医疗和金融领域进行了跨领域的实验评估。实验表明,联邦微调在性能上接近集中式训练,优于单一机构独立训练,并且参数高效微调方法如QLoRA和IA3在保持较高准确率的同时提升了计算效率,为隐私数据下的大模型适配提供了可行方案。