Transformers 4.37 中文文档（十四）（1）-阿里云开发者社区

原文：huggingface.co/docs/transformers

骨干

原文链接：huggingface.co/docs/transformers/v4.37.2/en/main_classes/backbones

骨干是用于计算机视觉任务的特征提取模型。可以通过两种方式之一将模型用作骨干：

使用预训练模型初始化AutoBackbone类，
初始化支持的骨干配置并将其传递给模型架构。

使用 AutoBackbone

您可以使用AutoBackbone类初始化一个模型作为骨干，并获取任何阶段的特征图。您可以定义out_indices来指示您想要从哪些层获取特征图。如果您知道层的名称，也可以使用out_features。您可以互换使用它们。如果同时使用out_indices和out_features，请确保它们是一致的。不传递任何特征图参数将使骨干产生最后一层的特征图。为了可视化各个阶段的外观，让我们以 Swin 模型为例。每个阶段负责特征提取，输出特征图。

第一阶段的特征图如下所示。

让我们通过一个示例来看看。请注意，out_indices=(0,)会导致产生模型的 stem。Stem 指的是第一个特征提取阶段之前的阶段。在上图中，它指的是 patch 分区。我们希望从 stem、第一阶段和第二阶段获取特征图。

>>> from transformers import AutoImageProcessor, AutoBackbone
>>> import torch
>>> from PIL import Image
>>> import requests
>>> processor = AutoImageProcessor.from_pretrained("microsoft/swin-tiny-patch4-window7-224")
>>> model = AutoBackbone.from_pretrained("microsoft/swin-tiny-patch4-window7-224", out_indices=(0,1,2))
>>> url = "http://images.cocodataset.org/val2017/000000039769.jpg"
>>> image = Image.open(requests.get(url, stream=True).raw)
>>> inputs = processor(image, return_tensors="pt")
>>> outputs = model(**inputs)
>>> feature_maps = outputs.feature_maps

feature_maps对象现在有三个特征图，每个都可以像下面这样访问。假设我们想要获取 stem 的特征图。

>>> list(feature_maps[0].shape)
[1, 96, 56, 56]

我们可以像下面这样获取第一阶段和第二阶段的特征图。

>>> list(feature_maps[1].shape)
[1, 96, 56, 56]
>>> list(feature_maps[2].shape)
[1, 192, 28, 28]

初始化骨干配置

在计算机视觉中，模型由骨干、neck 和头部组成。骨干提取特征，neck 转换骨干的输出，头部用于主要任务（例如目标检测）。您可以通过将模型配置传递给backbone_config来使用模型骨干初始化 neck 和头部。例如，您可以看到如何使用 ResNet 骨干初始化带有实例分割头部的 MaskFormer 模型。

from transformers import MaskFormerConfig, MaskFormerForInstanceSegmentation, ResNetConfig
backbone_config = ResNetConfig.from_pretrained("microsoft/resnet-50")
config = MaskFormerConfig(backbone_config=backbone_config)
model = MaskFormerForInstanceSegmentation(config)

您还可以使用随机权重初始化骨干，以初始化模型的 neck。

backbone_config = ResNetConfig()
config = MaskFormerConfig(backbone_config=backbone_config)
model = MaskFormerForInstanceSegmentation(config)

通过TimmBackbone和TimmBackboneConfig，transformers 还支持timm模型。

from transformers import TimmBackboneConfig, TimmBackbone
backbone_config = TimmBackboneConfig("resnet50")
model = TimmBackbone(config=backbone_config)

回调函数

原始文本：huggingface.co/docs/transformers/v4.37.2/en/main_classes/callback

回调函数是可以自定义 PyTorch Trainer 训练循环行为的对象（此功能尚未在 TensorFlow 中实现），可以检查训练循环状态（用于进度报告、在 TensorBoard 或其他 ML 平台上记录…）并做出决策（如提前停止）。

回调函数是“只读”代码片段，除了它们返回的 TrainerControl 对象外，它们不能更改训练循环中的任何内容。对于需要更改训练循环的自定义内容，您应该子类化 Trainer 并覆盖您需要的方法（请参阅 trainer 以获取示例）。

默认情况下，TrainingArguments.report_to设置为"all"，因此 Trainer 将使用以下回调函数。

DefaultFlowCallback 处理日志记录、保存和评估的默认行为。
使用 PrinterCallback 或 ProgressCallback 显示进度并打印日志（如果通过 TrainingArguments 停用 tqdm，则使用第一个，否则使用第二个）。
如果 tensorboard 可访问（通过 PyTorch >= 1.4 或 tensorboardX），则使用 TensorBoardCallback。
如果安装了wandb，则使用 WandbCallback。
如果安装了comet_ml，则使用 CometCallback。
如果安装了mlflow，则使用 MLflowCallback。
如果安装了neptune，则使用 NeptuneCallback。
如果安装了azureml-sdk，则使用 AzureMLCallback。
如果安装了codecarbon，则使用 CodeCarbonCallback。
如果安装了clearml，则使用 ClearMLCallback。
如果安装了dagshub，则使用 DagsHubCallback。
如果安装了flyte，则使用 FlyteCallback。
如果安装了dvclive，则使用 DVCLiveCallback。

如果安装了某个软件包，但您不希望使用相应的集成，可以将TrainingArguments.report_to更改为您想要使用的集成列表（例如["azure_ml", "wandb"]）。

实现回调的主要类是 TrainerCallback。它获取用于实例化 Trainer 的 TrainingArguments，可以通过 TrainerState 访问该 Trainer 的内部状态，并可以通过 TrainerControl 对训练循环采取一些操作。

可用的回调

以下是库中可用的 TrainerCallback 列表：

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

Transformers 4.37 中文文档（十四）（1）

骨干

使用 AutoBackbone

初始化骨干配置

回调函数

可用的回调

class transformers.integrations.CometCallback

setup

class transformers.DefaultFlowCallback

class transformers.PrinterCallback

class transformers.ProgressCallback

class transformers.EarlyStoppingCallback

class transformers.integrations.TensorBoardCallback

class transformers.integrations.WandbCallback

setup

class transformers.integrations.MLflowCallback

setup

class transformers.integrations.AzureMLCallback

class transformers.integrations.CodeCarbonCallback

class transformers.integrations.NeptuneCallback

class transformers.integrations.ClearMLCallback

class transformers.integrations.DagsHubCallback

setup

class transformers.integrations.FlyteCallback

class transformers.integrations.DVCLiveCallback

setup

TrainerCallback

class transformers.TrainerCallback

on_epoch_begin

on_epoch_end

on_evaluate

on_init_end

on_log

on_predict

on_prediction_step

on_save

on_step_begin

on_step_end

on_substep_end

on_train_begin

热门文章

最新文章

相关课程

相关电子书

`class transformers.integrations.CometCallback`

`setup`

`class transformers.DefaultFlowCallback`

`class transformers.PrinterCallback`

`class transformers.ProgressCallback`

`class transformers.EarlyStoppingCallback`

`class transformers.integrations.TensorBoardCallback`

`class transformers.integrations.WandbCallback`

`setup`

`class transformers.integrations.MLflowCallback`

`setup`

`class transformers.integrations.AzureMLCallback`

`class transformers.integrations.CodeCarbonCallback`

`class transformers.integrations.NeptuneCallback`

`class transformers.integrations.ClearMLCallback`

`class transformers.integrations.DagsHubCallback`

`setup`

`class transformers.integrations.FlyteCallback`

`class transformers.integrations.DVCLiveCallback`

`setup`

`class transformers.TrainerCallback`

`on_epoch_begin`

`on_epoch_end`

`on_evaluate`

`on_init_end`

`on_log`

`on_predict`

`on_prediction_step`

`on_save`

`on_step_begin`

`on_step_end`

`on_substep_end`

`on_train_begin`