DeepSeek容器化部署（vLLM+Open WebUI）魔搭模型版

张

张建站

2026/4/24 11:34:52

10分钟阅读

一、环境准备前提服务器已安装NVIDIA GPU驱动系统为Ubuntu 20.04。1. 安装Dockercurl-fsSLhttps://download.docker.com/linux/ubuntu/gpg|sudogpg--dearmor-o/usr/share/keyrings/docker-archive-keyring.gpgechodeb [arch$(dpkg --print-architecture)signed-by/usr/share/keyrings/docker-archive-keyring.gpg] https://download.docker.com/linux/ubuntu focal stable|sudotee/etc/apt/sources.list.d/docker.list/dev/nullaptupdateaptinstall-ydocker-ce docker-ce-cli containerd.io systemctl startdockersystemctlenabledocker2. 安装NVIDIA-Dockerdistribution$(./etc/os-release;echo$ID$VERSION_ID)curl-s-Lhttps://nvidia.github.io/nvidia-docker/gpgkey|sudoapt-keyadd-curl-s-Lhttps://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list|sudotee/etc/apt/sources.list.d/nvidia-docker.listapt-getupdateapt-getinstall-ynvidia-docker2 systemctl restartdocker二、魔搭社区下载模型ModelScope1. 安装ModelScope工具pipinstallmodelscope2. 下载Qwen3-8B模型自定义路径modelscope download--modelQwen/Qwen3-8B--local_dir/hy-tmp/models/deepseek/模型将保存到/hy-tmp/models/deepseek/后续容器直接挂载此路径。三、拉取Docker镜像# 拉取Open WebUICUDA版dockerpull ghcr.io/open-webui/open-webui:cuda# 拉取vLLM推理镜像dockerpull vllm/vllm-openai四、启动vLLM容器挂载魔搭模型dockerrun-d\--gpusall\--restartunless-stopped\--namedeepseek-container\--networkhost\-v/hy-tmp/models/deepseek:/model\vllm/vllm-openai:latest\--model/model\--served-model-name qwen3-8b\--dtypehalf\--api-key OPENWEBUI123关键说明-v /hy-tmp/models/deepseek:/model挂载魔搭下载的模型路径--served-model-name qwen3-8b自定义服务模型名--api-key OPENWEBUI123接口密钥WebUI需保持一致五、启动Open WebUI容器dockerrun-d\--nameopenwebui-container\--networkhost\--gpusall\-eOPENAI_API_BASE_URLhttp://localhost:8000/v1\-eOPENAI_API_KEYSOPENWEBUI123\-eUSE_CUDA_DOCKERtrue\ghcr.io/open-webui/open-webui:cuda六、验证与访问检查容器状态dockerps浏览器访问Open WebUIhttp://服务器IP:8080首次访问创建管理员账号即可选择qwen3-8b模型对话。七、常见参数说明参数作用--gpus all容器调用全部GPU--network host复用主机网络端口直通-v 本地路径:容器路径模型目录挂载--dtype halfFP16精度降低显存占用--api-key接口鉴权密钥

如何快速使用网盘直链下载助手：面向初学者的完整指南

如何快速使用网盘直链下载助手：面向初学者的完整指南【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ，支持百度网盘 / 阿里云盘 / 中国移动云盘 / 天翼云…...

2026/4/18 21:48:36 阅读更多 →

手把手教你用LangChain4j打造一个“会追问”的AI客服：以航空货运下单为例

用LangChain4j构建会主动追问的航空货运AI客服：从交互设计到代码实现想象一下，当你需要预订航空货运服务时，面对的是一个只会机械回答问题的客服机器人——你问一句，它答一句，信息不全时直接卡壳。这种体验有多糟糕&a…...

2026/4/17 1:31:13 阅读更多 →

终极指南：阴阳师自动化脚本OnmyojiAutoScript完整使用技巧

终极指南：阴阳师自动化脚本OnmyojiAutoScript完整使用技巧【免费下载链接】OnmyojiAutoScript Onmyoji Auto Script | 阴阳师脚本项目地址: https://gitcode.com/gh_mirrors/on/OnmyojiAutoScript 还在为阴阳师繁琐的日常任务而烦恼吗？每天重复…...

2026/4/23 7:13:23 阅读更多 →