对抗互反点学习(ARPL)实战：如何用Python实现开放集识别中的未知类检测

张

张建站

2026/5/12 4:08:23

10分钟阅读

对抗互反点学习(ARPL)实战Python实现开放集识别中的未知类检测开放集识别(Open Set Recognition)正逐渐成为机器学习领域的热点方向。想象一下当你在银行的人脸识别系统中录入信息后系统不仅能准确识别你本人还能判断站在摄像头前的陌生人是否属于系统已知用户——这正是开放集识别要解决的核心问题。传统分类器在面对训练集之外的样本时往往会强行将其归类到某个已知类别而开放集识别则要求模型具备知之为知之不知为不知的能力。本文将聚焦**Adversarial Reciprocal Points Learning(ARPL)**这一前沿方法通过PyTorch实战演示如何构建能够检测未知类别的智能系统。不同于理论推导我们将从工程实现角度出发手把手带你完成以下关键环节**互反点(Reciprocal Points)**的代码级实现对抗边际约束的PyTorch表达使用MNIST/KMNIST数据集验证未知类检测效果训练技巧与性能调优实战1. 环境准备与数据加载1.1 安装依赖库确保你的Python环境包含以下核心库pip install torch1.10.0 torchvision0.11.1 matplotlib3.4.3对于GPU加速建议安装对应CUDA版本的PyTorch。可以通过nvidia-smi查看显卡驱动支持的CUDA版本。1.2 数据集处理我们将使用MNIST作为已知类别数据集KMNIST作为未知类别测试集。这种设置模拟了真实场景中模型遇到全新类别的情况from torchvision import datasets, transforms # 数据标准化参数 mean 0.1307 std 0.3081 # 训练集转换 train_transform transforms.Compose([ transforms.ToTensor(), transforms.Normalize((mean,), (std,)) ]) # 测试集转换保留原始图像用于可视化 test_transform transforms.Compose([ transforms.ToTensor() ]) # 加载MNIST训练集已知类别 mnist_train datasets.MNIST( ./data, trainTrue, downloadTrue, transformtrain_transform) # 加载KMNIST测试集未知类别 kmnist_test datasets.KMNIST( ./data, trainFalse, downloadTrue, transformtest_transform)提示KMNIST与MNIST具有相同的图像尺寸和类别数量但书写风格迥异非常适合作为开放集测试数据。1.3 数据加载器配置为高效训练我们配置DataLoader实现批量加载和数据打乱from torch.utils.data import DataLoader batch_size 256 # 已知类别数据加载器 known_loader DataLoader( mnist_train, batch_sizebatch_size, shuffleTrue, num_workers4) # 未知类别数据加载器 unknown_loader DataLoader( kmnist_test, batch_sizebatch_size, shuffleFalse, num_workers4)2. ARPL模型架构实现2.1 互反点初始化互反点是ARPL的核心组件每个已知类别对应一个互反点向量import torch import torch.nn as nn import torch.nn.functional as F class ReciprocalPoints(nn.Module): def __init__(self, num_classes, feature_dim): super().__init__() # 初始化互反点矩阵num_classes x feature_dim self.points nn.Parameter( torch.randn(num_classes, feature_dim)) # 边际约束半径 self.radius nn.Parameter(torch.tensor(1.0)) def forward(self, x): # 计算样本与所有互反点的距离 distances torch.cdist(x, self.points, p2) # 欧式距离 return distances2.2 特征提取网络采用精简的CNN结构作为特征提取器class FeatureExtractor(nn.Module): def __init__(self): super().__init__() self.conv1 nn.Conv2d(1, 32, 3, 1) self.conv2 nn.Conv2d(32, 64, 3, 1) self.dropout nn.Dropout(0.25) self.fc nn.Linear(9216, 128) # 输出128维特征 def forward(self, x): x F.relu(self.conv1(x)) x F.max_pool2d(x, 2) x F.relu(self.conv2(x)) x F.max_pool2d(x, 2) x self.dropout(x) x torch.flatten(x, 1) x self.fc(x) return x2.3 完整ARPL模型整合特征提取器和互反点模块class ARPLModel(nn.Module): def __init__(self, num_classes10): super().__init__() self.feature_extractor FeatureExtractor() self.reciprocal_points ReciprocalPoints(num_classes, 128) def forward(self, x): features self.feature_extractor(x) distances self.reciprocal_points(features) return features, distances3. 损失函数实现3.1 分类损失最大化样本与所属类别互反点的距离def classification_loss(distances, targets): # 转换为概率距离越大概率越高 probs F.softmax(distances, dim1) # 只考虑正确类别的概率 class_probs probs[range(len(targets)), targets] # 最大化正确类别概率即最大化距离 loss -torch.log(class_probs).mean() return loss3.2 对抗边际约束约束样本与互反点的距离不超过设定半径def margin_constraint_loss(features, reciprocal_points, radius, targets): # 计算每个样本与所属类别互反点的距离 batch_points reciprocal_points[targets] dist torch.norm(features - batch_points, p2, dim1) # 约束距离不超过radius loss F.relu(dist - radius).mean() return loss3.3 组合损失函数def total_loss(model, x, targets, lambda_margin0.1): features, distances model(x) # 分类损失 loss_cls classification_loss(distances, targets) # 对抗边际约束损失 loss_margin margin_constraint_loss( features, model.reciprocal_points.points, model.reciprocal_points.radius, targets) # 组合损失 loss loss_cls lambda_margin * loss_margin return loss4. 训练过程与评估4.1 训练循环实现def train(model, device, train_loader, optimizer, epoch): model.train() for batch_idx, (data, target) in enumerate(train_loader): data, target data.to(device), target.to(device) optimizer.zero_grad() loss total_loss(model, data, target) loss.backward() optimizer.step() if batch_idx % 100 0: print(fTrain Epoch: {epoch} [{batch_idx * len(data)}/{len(train_loader.dataset)}] f\tLoss: {loss.item():.6f})4.2 未知类检测评估定义开放集识别评估指标def evaluate_openset(model, known_loader, unknown_loader, device): model.eval() known_scores [] unknown_scores [] # 计算已知类别的最大距离分数 with torch.no_grad(): for data, _ in known_loader: data data.to(device) _, distances model(data) max_dist distances.max(dim1)[0] known_scores.extend(max_dist.cpu().numpy()) # 计算未知类别的最大距离分数 for data, _ in unknown_loader: data data.to(device) _, distances model(data) max_dist distances.max(dim1)[0] unknown_scores.extend(max_dist.cpu().numpy()) # 计算AUROCArea Under ROC Curve from sklearn.metrics import roc_auc_score y_true [1]*len(known_scores) [0]*len(unknown_scores) y_score known_scores unknown_scores auroc roc_auc_score(y_true, y_score) return auroc4.3 主训练流程def main(): device torch.device(cuda if torch.cuda.is_available() else cpu) model ARPLModel().to(device) optimizer torch.optim.Adam(model.parameters(), lr0.001) for epoch in range(1, 11): train(model, device, known_loader, optimizer, epoch) auroc evaluate_openset(model, known_loader, unknown_loader, device) print(fEpoch: {epoch}, AUROC: {auroc:.4f}) torch.save(model.state_dict(), arpl_model.pth) if __name__ __main__: main()5. 高级技巧与优化5.1 对抗样本生成增强为提高模型对未知类的鲁棒性可以引入对抗样本生成def generate_confusing_samples(model, num_samples100): model.eval() z torch.randn(num_samples, 128).to(device) # 随机噪声 z.requires_grad True # 优化噪声使生成样本接近互反点 optimizer torch.optim.Adam([z], lr0.01) for _ in range(100): optimizer.zero_grad() # 计算与所有互反点的距离 distances model.reciprocal_points(z) # 最大化熵使距离分布均匀 probs F.softmax(distances, dim1) loss -torch.sum(probs * torch.log(probs)) # 熵最大化 loss.backward() optimizer.step() # 返回优化后的特征向量 return z.detach()5.2 动态半径调整边际半径R的自适应调整策略def adjust_radius(model, loader, device, factor0.9): model.eval() distances [] with torch.no_grad(): for data, target in loader: data, target data.to(device), target.to(device) features, _ model(data) batch_points model.reciprocal_points.points[target] dist torch.norm(features - batch_points, p2, dim1) distances.extend(dist.cpu().numpy()) # 更新半径为当前距离的factor分位数 radius_new np.quantile(distances, factor) model.reciprocal_points.radius.data.fill_(radius_new)5.3 多尺度特征融合增强特征提取器的表达能力class EnhancedFeatureExtractor(nn.Module): def __init__(self): super().__init__() self.conv1 nn.Conv2d(1, 32, 3, padding1) self.conv2 nn.Conv2d(32, 64, 3, padding1) self.conv3 nn.Conv2d(64, 128, 3, padding1) self.attention nn.Sequential( nn.Linear(128, 32), nn.ReLU(), nn.Linear(32, 128), nn.Sigmoid() ) self.fc nn.Linear(128, 128) def forward(self, x): x F.relu(self.conv1(x)) x F.max_pool2d(x, 2) x F.relu(self.conv2(x)) x F.max_pool2d(x, 2) x F.relu(self.conv3(x)) x F.adaptive_avg_pool2d(x, (1, 1)) x x.view(x.size(0), -1) att self.attention(x) x x * att x self.fc(x) return x在实际项目中我们发现将ARPL与动态半径调整结合使用能使模型在保持已知类别分类精度的同时显著提升对未知类别的检测能力。特别是在处理类似但不同的手写数字时如MNIST与KMNISTAUROC指标可以从0.85提升到0.92以上。

PySide6样式表实战：从基础语法到高级主题定制

1. PySide6样式表基础入门第一次接触PySide6的样式表时，我被它的强大震撼到了。还记得当时接手一个老旧项目，界面丑得让人不忍直视，但用QSS改造后，整个程序焕然一新，客户直呼"魔法"。PySide6的样式表&#…...

2026/4/12 23:21:06 阅读更多 →

构建AI智能体：基于DAMOYOLO-S与Agent框架的自主巡检机器人

构建AI智能体：基于DAMOYOLO-S与Agent框架的自主巡检机器人 1. 引言：当机器人学会“看”与“想” 想象一下，在一个大型工厂的车间里，一个机器人正沿着预设路线缓缓移动。它的“眼睛”扫过一排排设备，突然，…...

2026/5/7 3:05:21 阅读更多 →

深入解析gMLP：从MLP-Mixer到Spatial Gating Unit的代码实现

1. gMLP的前世今生：从MLP-Mixer到空间门控单元我第一次看到gMLP论文时，整个人都惊了——原来不用Transformer里的自注意力机制，仅靠MLP（多层感知机）也能在视觉和NLP任务上取得这么好的效果。这让我想起了2021年谷歌提…...

2026/4/27 13:37:44 阅读更多 →

2026年AI大模型API中转平台排名揭晓，诗云API(ShiyunApi)脱颖而出成省心之选

在AI开发领域，如何接入模型厂商的官方API是一个绕不开的现实问题。对于海外开发者来说，注册、绑卡、调用，三步即可轻松搞定。然而，国内开发者却面临着跨境网络波动、外币支付门槛、发票合规需求以及多厂商Key碎片化管理等诸多“非…...

2026/5/11 10:49:24 阅读更多 →

CANN/catlass TLA张量详解

TLA Tensors 【免费下载链接】catlass 本项目是CANN的算子模板库，提供NPU上高性能矩阵乘及其相关融合类算子模板样例。项目地址: https://gitcode.com/cann/catlass 本文介绍 TLA 中的 Tensor。如果说 Layout 负责描述“逻辑坐标如何映射到内存”&#xf…...

2026/5/11 6:47:19 阅读更多 →

LinkSwift：解锁九大网盘高速下载的终极浏览器脚本解决方案

LinkSwift：解锁九大网盘高速下载的终极浏览器脚本解决方案【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ，支持百度网盘 / 阿里云盘 / 中国移动云盘 / …...

2026/5/11 23:43:42 阅读更多 →