1. 为什么需要在AI Studio中配置永久PyTorch环境百度AI Studio默认提供的深度学习框架是PaddlePaddle这对于习惯使用PyTorch的开发者来说确实不太友好。每次新建项目都要重新配置环境不仅浪费时间还可能导致项目之间的环境不一致。我在实际使用中就遇到过这样的困扰好不容易配置好的PyTorch环境第二天重启项目又得从头再来。更麻烦的是AI Studio的临时环境会在项目关闭后自动清除这意味着你安装的所有第三方库和配置都会消失。对于需要长期迭代的项目来说这简直就是噩梦。我有个图像分类项目每次重启都得重新安装torch、torchvision等依赖浪费了大量时间在重复劳动上。好在AI Studio的work目录是永久保存的这给我们提供了突破口。通过在work目录下安装Miniconda再创建独立的Python环境就能实现PyTorch环境的永久保存。这个方法我已经用了大半年从图像分类到目标检测项目都很稳定再也不用担心环境丢失的问题了。2. 前期准备工作2.1 创建AI Studio项目首先登录百度AI Studio官网点击新建项目。这里有个关键点要注意项目类型一定要选择Notebook框架版本选择PaddlePaddle 2.0。虽然我们最终要使用PyTorch但AI Studio目前只支持基于PaddlePaddle的项目创建。项目名称和描述可以按需填写我一般会加上PyTorch字样方便识别。数据集部分要特别注意如果你有自己的数据集建议先压缩成zip包然后在创建项目时选择创建数据集上传。我刚开始就犯了个错误把数据集放在代码压缩包里一起上传结果发现路径处理特别麻烦。创建完成后你会看到一个标准的Notebook界面。先别急着写代码我们要做的第一件事是检查work目录。点击左侧文件浏览器确认work文件夹存在。这个文件夹就是我们的安全区所有放在这里的文件都不会被系统清除。2.2 准备必要的文件在本地电脑上我们需要准备两个关键文件Miniconda安装包推荐下载Miniconda3-4.7.12.1-Linux-x86_64.sh版本这个版本我在多个项目中测试过兼容性最好项目代码压缩包建议把代码和预训练权重分开打包因为权重大小可能超过上传限制回到AI Studio在work目录下新建一个conda3文件夹名字可以自定。然后把下载好的Miniconda安装包上传到这个文件夹。这里有个小技巧直接拖拽文件到文件浏览器窗口比点击上传按钮要快得多。3. 安装和配置Miniconda3.1 安装Miniconda打开Notebook中的终端Terminal输入以下命令cd work/conda3 bash Miniconda3-4.7.12.1-Linux-x86_64.sh安装过程中会有几个关键提示按Enter查看许可协议输入yes同意条款安装路径要指定到work目录下比如/home/aistudio/work/conda3我第一次安装时就栽在这里默认路径是用户目录结果环境重启后就没了。安装完成后需要激活conda环境source ~/work/conda3/bin/activate如果看到命令提示符前面出现(base)说明conda已经成功激活。这时候可以运行conda --version验证下安装是否成功。3.2 创建Python环境接下来我们要创建一个独立的Python环境专门用于PyTorch项目conda create --name pytorch_env python3.7这里的环境名pytorch_env可以自定义但Python版本建议用3.7因为3.8可能会遇到一些兼容性问题。创建完成后激活这个环境conda activate pytorch_env这时候你会发现提示符变成了(pytorch_env)表示已经进入我们创建的环境。这个环境会永久保存在work目录下即使重启项目也不会丢失。4. 安装PyTorch及相关库4.1 安装PyTorch在激活的pytorch_env环境中运行以下命令安装PyTorchpip install torch1.5.0cu92 torchvision0.6.0cu92 -f https://download.pytorch.org/whl/torch_stable.html这个版本组合是我测试过最稳定的特别适合AI Studio的CPU环境。安装过程可能会比较慢耐心等待即可。如果中途被中断AI Studio有时会强制停止长时间运行的操作只需重新激活环境继续安装。安装完成后可以启动Python解释器验证import torch print(torch.__version__)如果能看到版本号输出说明PyTorch已经安装成功。不过要注意AI Studio的Notebook环境可能会阻止PyTorch运行这时候就需要在终端中执行Python脚本。4.2 安装其他必要库根据项目需求你可能还需要安装一些常用库pip install numpy pandas matplotlib opencv-python我建议把这些常用库一次性装好避免后续频繁安装。如果项目需要特定版本的库可以用指定版本号。比如我在做图像分割项目时就遇到过OpenCV版本兼容问题最后锁定在4.2.0版本才解决。5. 项目部署与路径管理5.1 上传和解压项目代码在work目录下新建项目文件夹比如my_project。然后将本地的代码压缩包上传到这个目录。解压代码可以使用Python的zipfile模块import zipfile with zipfile.ZipFile(my_code.zip, r) as f: f.extractall(work/my_project)数据集部分要特别注意AI Studio会自动将数据集挂载到/data目录下所以不要在代码包里包含大数据集。我建议在代码中使用相对路径访问数据比如dataset_path ../data/data12345/images5.2 修改代码中的路径由于AI Studio的特殊目录结构我们需要调整代码中的文件路径。主要修改以下几个地方数据集路径指向/data目录下的数据集模型保存路径应该放在work目录下日志文件路径同样放在work目录我通常会创建一个config.py文件统一管理路径import os class Config: data_root /home/aistudio/data/data12345 work_dir /home/aistudio/work/my_project staticmethod def make_dir(path): if not os.path.exists(path): os.makedirs(path)6. 环境使用与维护6.1 日常使用流程每次启动项目后需要执行以下步骤激活环境打开终端激活conda基础环境source ~/work/conda3/bin/activate激活项目环境conda activate pytorch_env运行代码python work/my_project/main.py为了方便我把这些命令写成了一个shell脚本start.sh放在work目录下#!/bin/bash source ~/work/conda3/bin/activate conda activate pytorch_env python work/my_project/main.py然后只需要运行bash start.sh就能一键启动项目。6.2 环境备份与恢复虽然work目录是永久保存的但为了保险起见我建议定期备份conda环境conda env export work/pytorch_env_backup.yml如果环境损坏可以通过以下命令恢复conda env create -f work/pytorch_env_backup.yml7. 常见问题解决7.1 安装过程中断由于AI Studio对长时间运行的操作有限制安装大包时可能会被中断。解决方法很简单重新激活环境继续安装。conda和pip都会自动继续未完成的安装不会重复下载已经完成的部分。7.2 内存不足问题PyTorch在CPU环境下运行可能会占用大量内存。如果遇到内存不足的错误可以尝试以下方法减小batch size使用更小的模型在代码中添加垃圾回收import gc gc.collect()7.3 环境冲突如果发现环境行为异常可以尝试重建环境conda remove --name pytorch_env --all conda create --name pytorch_env python3.7重建后记得重新安装所有依赖库。我建议维护一个requirements.txt文件记录项目依赖。8. 高级技巧与优化建议8.1 使用Jupyter Notebook虽然AI Studio原生Notebook不支持PyTorch但我们可以在终端启动自己的Jupyterpip install jupyter jupyter notebook --ip0.0.0.0 --port8080 --no-browser然后在本地浏览器访问AI Studio提供的代理地址即可。不过要注意这种方式下Notebook内核也会受到资源限制。8.2 性能优化对于CPU环境可以通过以下设置提升PyTorch性能torch.set_num_threads(4) # 根据CPU核心数调整另外建议在数据加载时使用from torch.utils.data import DataLoader loader DataLoader(dataset, num_workers2, pin_memoryTrue)8.3 远程调试如果需要远程调试可以在代码中添加import pdb pdb.set_trace()然后在终端运行程序时就会进入交互式调试模式。这个技巧帮我解决过不少棘手的bug。