什么是Backbone网络?
在深度学习,尤其是计算机视觉领域,“Backbone网络”(主干网络)是指用于提取输入图像特征的核心神经网络结构。 它通常是整个模型中最主要的组成部分,负责从原始数据中逐层提取抽象特征,供后续任务(如目标检测、语义分割、图像分类等)使用。
常见的Backbone网络有哪些?
常见的Backbone包括 ResNet、VGG、MobileNet、EfficientNet、Swin Transformer 等。这些网络经过大量数据预训练, 具备强大的通用特征提取能力,因此常被用作下游任务的“基础模型”。
Backbone在网络架构中的作用
在目标检测模型(如 Faster R-CNN、YOLO)或语义分割模型(如 U-Net、DeepLab)中,Backbone通常位于最前端, 负责将输入图像转换为高维特征图。后续的模块(如检测头、分割头)则基于这些特征进行具体任务的预测。
为什么叫“Backbone”?
“Backbone”原意为“脊柱”或“骨干”,在深度学习中借喻其作为整个模型支撑结构的角色——没有它,后续任务模块将缺乏有效的输入特征。