视觉与机器人
多模态信息融合
面向图像、视频、多传感器和跨模态感知的信息融合,包括 Image Fusion、红外可见光、遥感、医学影像、LiDAR/雷达/相机和音视频融合。
1. 多传感器融合 6 篇
2. 音视频/视觉语言融合 5 篇
3. 融合架构与评测 3 篇
DiT-JSCC: Rethinking Deep JSCC with Diffusion Transformers and Semantic Representations
DiT-JSCC:基于扩散变换器与语义表示的深度JSCC再思考
专题命中 融合架构与评测 :联合学习语义编码与扩散解码的融合框架。
AI总结 提出DiT-JSCC框架,联合学习语义优先表示编码器和扩散变换器生成解码器,通过粗细粒度条件解码和基于Kolmogorov复杂度的自适应带宽分配,在极端信道条件下提升语义一致性与传输效率。
Comments 14pages, 14figures, 2tables