Fast Tensorization of Neural Networks via Slice-wise Feature Distillation
通过切片特征蒸馏实现神经网络的快速张量化
发表机构 * Donostia International Physics Center(多斯蒂亚国际物理中心) ; Multiverse Computing(多维计算) ; Ikerbasque Foundation for Science(伊克尔巴斯基科学基金会)
AI总结 本文提出了一种基于切片特征蒸馏的可扩展张量化框架,用于神经网络压缩。该方法通过将网络分解为独立的切片(如单个层或块),并独立张量化每个切片以恢复原始预训练模型的中间表示,从而提高精度恢复、减少数据需求并实现高效的并行优化。