使用U-Net进行乳腺癌图像分割

张

张建站

2026/4/13 12:32:37

10分钟阅读

使用U-Net进行乳腺癌图像分割1. 数据准备首先我们需要准备数据。在这个例子中我们的数据集包含两类图像原始图像和相应的mask图像。原始图像是乳腺癌组织的图片mask图像是与原始图像对应的分割标签。我们需要将这些图像预处理以便能够输入到我们的神经网络模型中。1.1 数据预处理我们使用了Albumentations库进行数据增强对图像进行旋转、翻转、亮度对比度调整等操作。同时我们将数据集划分为训练集、验证集和测试集。注意Albumentations库需要通过pip进行安装具体安装为pip install Albumentations代码如下importalbumentationsasAfromalbumentations.pytorchimportToTensorV2fromtorch.utils.dataimportDataLoader train_transformA.Compose([A.HorizontalFlip(p0.5),A.RandomBrightnessContrast(p0.2),A.Rotate(limit30,p0.3),A.RandomResizedCrop(height256,width256,scale(0.8,1.0),p0.2),A.Normalize(),ToTensorV2()])val_transformA.Compose([A.Normalize(),ToTensorV2()])test_transformA.Compose([A.Normalize(),ToTensorV2()])1.2 自定义数据集我们创建了一个自定义数据集类该类负责从磁盘读取图像应用预处理操作并返回图像和对应的mask。代码如下fromtorchvisionimporttransformsclassBreastCancerSegmentationDataset(Dataset): 乳腺癌分割数据集 def__init__(self,img_dir,mask_dir,transformNone,one_hot_encodeTrue,target_size(256,256)):self.img_dirimg_dir self.mask_dirmask_dir self.transformtransform self.one_hot_encodeone_hot_encode self.target_sizetarget_size self.img_filenamesos.listdir(img_dir)def__len__(self):returnlen(self.img_filenames)def__getitem__(self,index):# 根据文件存放方式设置os便于建立原始图像与mask图像的联系img_nameself.img_filenames[index]img_pathos.path.join(self.img_dir,img_name)mask_pathos.path.join(self.mask_dir,img_name[:-4]_maskimg_name[-4:])# Skip .ipynb_checkpoints filesifimg_path.endswith(.ipynb_checkpoints)ormask_path.endswith(.ipynb_checkpoints):returnself.__getitem__((index1)%len(self))imagecv2.imread(img_path,cv2.IMREAD_COLOR)maskcv2.imread(mask_path,cv2.IMREAD_GRAYSCALE)# 适应度处理检查是否将图像添加入osifimageisNone:raiseFileNotFoundError(fImage not found at{img_path})ifmaskisNone:raiseFileNotFoundError(fMask not found at{mask_path})# 将 image 和 mask 的图像进行强制转化转化成同样大小imagecv2.resize(image,self.target_size,interpolationcv2.INTER_LINEAR)maskcv2.resize(mask,self.target_size,interpolationcv2.INTER_NEAREST)# 将mask进行独热处理ifself.one_hot_encode:maskone_hot_encode(mask,num_classes3)# 定义transform构架为数据增强做准备ifself.transform:augmentedself.transform(imageimage,maskmask)imageaugmented[image]maskaugmented[mask]# 将mask的属性值转化为float类型masknp.asarray(mask)# 转换为NumPy数组maskmask.astype(np.float32)# 变换dtypemasktorch.from_numpy(mask)# 转换为Tensorreturnimage,mask2. 构建U-Net模型我们选择使用预训练的FCN-ResNet50作为我们的基本模型。我们创建了一个名为UNetTrainer的类用于处理训练、评估和测试过程。代码如下classUNetTrainer:实际上我们使用的是一个全卷积网络FCN的ResNet50实现而不是U-Netdef__init__(self,num_classes3,lr1e-4):# 我们使用的fcn_resnet50是U-Net模型的变体,其中编码器部分初始化了ResNet50的权重。这可以加速模型训练和提高最终性能。但解码器部分仍需要我们从零训练self.modelfcn_resnet50(pretrainedFalse,num_classesnum_classes)# 损失函数使用交叉熵损失函数self.criterionnn.CrossEntropyLoss()# 使用adam优化器self.optimizertorch.optim.Adam(self.model.parameters(),lrlr)# 设置GPU为训练设备self.devicetorch.device(cudaiftorch.cuda.is_available()elsecpu)self.model.to(self.device)3. 模型训练和评估我们使用交叉熵损失作为损失函数并使用Adam优化器进行模型训练。在训练过程中我们使用训练集进行训练并在每个epoch结束时使用验证集对模型进行评估。我们使用IoUIntersection over Union和F1分数作为性能指标。注意train、evaluate与test都是UNetTrainer的成员函数。代码如下deftrain(self,num_epochs,train_loader,val_loader):forepochinrange(num_epochs):print(fEpoch{epoch1}/{num_epochs})print(-*10)start_timetime.time()self.evaluate(epoch,train_loader,train)self.evaluate(epoch,val_loader,val)end_timetime.time()elapsed_timeend_time-start_timeprint(fEpoch time:{elapsed_time:.4f}s)print(Training complete)defevaluate(self,epoch,dataloader,phase):ifphasetrain:self.model.train()else:self.model.eval()running_loss0.0running_iou0.0running_f1_score0.0forimages,masksindataloader:imagesimages.to(self.device)masksmasks.to(self.device)maskstorch.mean(masks,dim3,keepdimFalse).long()self.optimizer.zero_grad()withtorch.set_grad_enabled(phasetrain):outputsself.model(images)[out]predstorch.argmax(outputs,dim1)lossself.criterion(outputs,masks)ifphasetrain:loss.backward()self.optimizer.step()running_lossloss.item()*images.size(0)running_iouself.calculate_iou(preds,masks.data)running_f1_scoref1_score(masks.cpu().numpy().ravel(),preds.cpu().numpy().ravel(),averagemacro)epoch_lossrunning_loss/len(dataloader.dataset)epoch_iourunning_iou/len(dataloader)epoch_f1_scorerunning_f1_score/len(dataloader)print(f{phase}Loss:{epoch_loss:.4f}IoU:{epoch_iou:.4f}F1:{epoch_f1_score:.4f})4. 模型测试在训练完成后我们将训练集和验证集合并并在这个组合数据集上重新训练模型。然后我们使用测试集对最终模型进行评估。代码如下deftest(self,train_loader,val_loader,test_loader):# Combine train and val datasetscombined_datasettorch.utils.data.ConcatDataset([train_loader.dataset,val_loader.dataset])combined_loadertorch.utils.data.DataLoader(combined_dataset,batch_sizetrain_loader.batch_size,shuffleTrue)# Retrain the model on the combined datasetprint(Retraining the model on the combined dataset)self.train(20,combined_loader,test_loader)# Evaluate the model on the test datasetprint(Evaluating the model on the test dataset)self.evaluate(0,test_loader,test)5. 改进模型性能的建议为了进一步提高模型性能和训练效率我提供了一些建议早停法Early Stopping在训练过程中如果验证集的损失长时间没有明显改善可以提前停止训练。这可以防止模型过拟合并节省训练时间。学习率调整策略使用学习率调整策略如学习率衰减或者周期性学习率可以帮助模型更快地收敛并在一定程度上提高最终性能。数据增强策略尝试使用更多的数据增强方法如随机裁剪、弹性变形等以提高模型的泛化能力。正则化方法添加正则化项如L1、L2正则化或Dropout可以帮助防止模型过拟合并提高模型的泛化能力。模型结构调整尝试使用其他更先进的网络结构如Attention U-Net或DeepLabv3等来改进模型性能。交叉验证使用k折交叉验证来评估模型性能。这可以提供一个更稳定的性能评估指标并有助于避免过拟合。模型集成将多个模型的预测结果进行组合可以进一步提高模型性能。这可以通过简单的平均法、投票法或更复杂的集成策略来实现。将这些方法应用于模型训练过程中可以帮助我们进一步提高乳腺癌图像分割任务的性能。

如何快速掌握Vue Router 3路由配置：从入门到精通的完整指南

如何快速掌握Vue Router 3路由配置：从入门到精通的完整指南【免费下载链接】vue-router 🚦 The official router for Vue 2 项目地址: https://gitcode.com/gh_mirrors/vu/vue-router Vue Router 3是Vue 2官方路由管理器，它让构建单页…...

2026/4/13 12:29:16 阅读更多 →

别再只传MP3了！探索WebSocket传输原始PCM音频流的优势与实战

WebSocketPCM：解锁超低延迟音频传输的工程实践在实时语音交互领域，工程师们常常陷入格式选择的困境——是采用广泛兼容的MP3/AAC压缩格式，还是拥抱更底层的PCM原始数据流？当WebSocket遇上PCM，这种组合正在重塑实时音频…...

2026/4/13 12:28:13 阅读更多 →

Autoware.Universe规划仿真避坑指南：RViz2里小车模型方向不对、尺寸不符的快速排查与修复

Autoware.Universe规划仿真避坑指南：RViz2小车模型异常全解析当你在Autoware.Universe中完成基础搭建，准备进行规划仿真时，最令人头疼的问题莫过于在RViz2中看到的小车模型方向错误或尺寸不符。这不仅影响可视化效果，更会导致后…...

2026/4/13 12:27:54 阅读更多 →

为了过等保，我们给200+服务器做了OpenSSH 10.0自动化升级，这是完整复盘

企业级OpenSSH 10.0自动化升级实战：从合规需求到批量落地当安全合规成为企业IT建设的刚性需求，基础组件的漏洞修复便从技术问题升级为战略任务。去年某次内部审计中，我们发现全公司237台服务器中，68%的OpenSSH版本存在高危漏洞&a…...

2026/4/13 6:35:30 阅读更多 →

用AI给显示器装上‘眼睛’：复旦博士的EyeReal方案，如何用三层LCD和RTX 4090实现桌面级裸眼3D？

EyeReal技术解析：三层LCDRTX 4090如何重构裸眼3D显示范式当24英寸显示器上跃然而出的立体影像不再需要特制眼镜时，我们或许正站在显示技术革命的临界点。复旦大学马炜杰博士团队发表在《Nature》的EyeReal方案，用三层普通LCD面板和消费级显卡…...

2026/4/13 2:58:30 阅读更多 →

5步轻松打造个人离线小说图书馆：番茄小说下载器完全指南

5步轻松打造个人离线小说图书馆：番茄小说下载器完全指南【免费下载链接】Tomato-Novel-Downloader 番茄小说下载器不精简版项目地址: https://gitcode.com/gh_mirrors/to/Tomato-Novel-Downloader 番茄小说下载器是一款功能强大的开源工具，专为…...

2026/4/13 5:56:55 阅读更多 →