封神！Java+Ollama本地部署Qwen 3.5，零API费搭建私人视觉AI，3分钟上手（附可运行源码）

张

张建站

2026/4/18 14:06:44

10分钟阅读

封神！Java+Ollama本地部署Qwen 3.5，零API费搭建私人视觉AI，3分钟上手（附可运行源码）

前言给AI装上“眼睛”有多简单此前我们通过终端操作亲身体验了Ollama运行Qwen 3.5视觉版的强悍本地识图能力——无需联网、不耗API额度识别精度远超预期。但对于开发者而言单纯的终端演示远远不够如何将这种“零成本视觉AI”集成到实际项目中真正落地到业务场景今天就手把手教大家用Java17OkHttp打造本地自动识图程序全程零API费用、数据不出本地既能精准识别图片内容还能通过JSON格式与现有业务系统无缝对接复制代码就能直接用1. 先搞懂核心逻辑程序员眼中的本地Ollama很多开发者觉得本地AI部署很复杂其实看透本质后非常简单Ollama启动后本质就是一个运行在11434端口的轻量级Web Server。我们无需深入理解神经网络的底层原理只要用Java发送标准的HTTP POST请求就能调用Qwen 3.5的视觉推理能力。核心数据流转流程极简理解Java应用扫描本地指定文件夹读取图片文件并转为Base64字符串Ollama接口标准接收格式HTTP传输通过OkHttpClient构造JSON请求包将Base64图片数据发送到本地Ollama服务模型推理Qwen 3.5视觉模型接收请求完成图片分析推理返回JSON格式的识别结果结果处理Java解析返回的JSON清洗无效格式直接对接业务逻辑如票据提取、图片内容归档等。2. 核心代码实战复制即用生产级适配实战前先明确环境要求JDK17、Ollama已安装并下载qwen3.5:0.8b模型、Maven项目。核心依赖选用OkHttp处理HTTP请求Fastjson2解析JSON轻量且稳定。2.1 引入Maven依赖直接复制到pom.xml中无需额外调整版本亲测兼容主流JDK17环境dependencies !-- OkHttp优雅处理HTTP请求支持超时配置 -- dependency groupIdcom.squareup.okhttp3/groupId artifactIdokhttp/artifactId version4.12.0/version /dependency !-- Fastjson2高效解析JSON处理响应数据更便捷 -- dependency groupIdcom.alibaba.fastjson2/groupId artifactIdfastjson2/artifactId version2.0.43/version /dependency /dependencies2.2 完整Java工具类实现这不是简单的Demo而是可直接封装为Service的工具类包含图片自动扫描、Base64转换、超时防护、响应清洗等生产级特性注释详细新手也能看懂每一步作用。import com.alibaba.fastjson2.JSON; import com.alibaba.fastjson2.JSONObject; import okhttp3.*; import java.io.File; import java.io.IOException; import java.nio.file.Files; import java.util.Base64; import java.util.Collections; import java.util.concurrent.TimeUnit; import java.util.regex.Pattern; /** * Ollama 本地Qwen 3.5视觉模型调用客户端 * 功能自动扫描本地图片、调用模型识别、返回标准JSON结果 * 可直接集成到SpringBoot等Java项目封装为Service使用 * author 技术干货分享 */ public class OllamaVisionClient { // Ollama本地服务默认API地址固定端口11434无需修改 private static final String OLLAMA_API_URL http://localhost:11434/api/generate; // 需与本地Ollama安装的模型名称一致此处为qwen3.5:0.8b可根据实际修改 private static final String QWEN_MODEL_NAME qwen3.5:0.8b; // 本地图片存放目录请替换为自己的图片路径如D:/imgs private static final String LOCAL_IMAGE_FOLDER /Users/wy/Downloads/imgs; // OkHttpClient配置大模型推理耗时较长放宽超时时间 private static final OkHttpClient OK_HTTP_CLIENT new OkHttpClient.Builder() .connectTimeout(60, TimeUnit.SECONDS) // 连接超时避免网络波动导致失败 .readTimeout(120, TimeUnit.SECONDS) // 读取超时模型推理耗时 .build(); // 正则表达式清洗模型返回的Markdown格式提取纯JSON private static final Pattern MARKDOWN_CLEAN_PATTERN Pattern.compile((?s)^json\\s*|^\\s*|$); public static void main(String[] args) { // 初始化图片目录 File imageFolder new File(LOCAL_IMAGE_FOLDER); // 过滤出JPG、PNG格式图片可根据需求添加JPEG、WEBP等格式 File[] imageFiles imageFolder.listFiles((dir, fileName) - fileName.toLowerCase().endsWith(.jpg) || fileName.toLowerCase().endsWith(.png)); // 校验目录是否有图片 if (imageFiles null || imageFiles.length 0) { System.out.println(提示指定目录下无图片文件请放入JPG/PNG格式图片后重试); return; } System.out.println(开始执行本地图片识别任务共发现 imageFiles.length 张图片...); // 批量处理每张图片 for (File imgFile : imageFiles) { try { // 核心方法分析图片并返回结果 analyzeLocalImage(imgFile); } catch (Exception e) { System.err.println(处理图片 [ imgFile.getName() ] 时出现异常 e.getMessage()); } } System.out.println(所有图片处理完成); } /** * 核心方法读取本地图片调用Ollama模型进行识别分析 * param imgFile 本地图片文件 * throws IOException 图片读取或HTTP请求异常 */ private static void analyzeLocalImage(File imgFile) throws IOException { System.out.println(\n正在读取并分析图片 imgFile.getName() ...); // 步骤1将图片文件转为Base64字符串Ollama接口要求的图片格式 byte[] imageBytes Files.readAllBytes(imgFile.toPath()); String imageBase64 Base64.getEncoder().encodeToString(imageBytes); // 步骤2构造HTTP请求的JSON参数Payload JSONObject requestParam new JSONObject(); requestParam.put(model, QWEN_MODEL_NAME); // 指定调用的模型 // 提示词指定模型返回纯JSON避免多余格式方便业务解析 requestParam.put(prompt, 请详细分析这张图片的内容若是文档、票据类图片需提取所有关键信息。最终结果必须以纯JSON格式返回严格遵守以下4点要求 1. 禁止使用Markdown代码块包裹 2. 禁止用json开头或结尾 3. 不添加任何多余的解释说明文字 4. 返回内容必须以{开头、以}结尾保证JSON格式合法 ); requestParam.put(stream, false); // 关闭流式返回一次性获取完整结果 requestParam.put(images, Collections.singletonList(imageBase64)); // 传入Base64图片 // 步骤3发送POST请求到Ollama本地服务 Request request new Request.Builder() .url(OLLAMA_API_URL) .post(RequestBody.create( requestParam.toJSONString(), MediaType.parse(application/json) )) .build(); // 步骤4解析响应结果并清洗 try (Response response OK_HTTP_CLIENT.newCall(request).execute()) { if (response.isSuccessful() response.body() ! null) { // 解析返回的JSON数据 JSONObject responseJson JSON.parseObject(response.body().string()); String aiResult responseJson.getString(response); // 清洗结果去除无效格式保留纯JSON String cleanResult cleanResponseData(aiResult.trim()); // 打印识别结果 System.out.println([图片分析完成] imgFile.getName()); System.out.println(--------------------------------------------------); System.out.println(cleanResult); System.out.println(--------------------------------------------------); } else { System.out.println(请求失败Ollama服务响应状态码 response.code()); } } } /** * 辅助方法清洗模型返回的响应数据提取纯JSON内容 * param response 模型原始响应字符串 * return 清洗后的纯JSON字符串 */ public static String cleanResponseData(String response) { if (response null || response.trim().isEmpty()) { return {}; // 空响应返回空JSON避免解析异常 } // 1. 去除Markdown代码块包裹模型可能返回带的格式 String cleanedJson MARKDOWN_CLEAN_PATTERN.matcher(response).replaceAll().trim(); // 2. 容错处理若JSON不是以{开头提取第一个{到最后一个}之间的内容 if (!cleanedJson.startsWith({)) { int jsonStartIndex cleanedJson.indexOf({); int jsonEndIndex cleanedJson.lastIndexOf(}); if (jsonStartIndex ! -1 jsonEndIndex ! -1 jsonEndIndex jsonStartIndex) { cleanedJson cleanedJson.substring(jsonStartIndex, jsonEndIndex 1); } } return cleanedJson; } }3. 运行效果演示真实可复现运行前准备启动Ollama服务终端输入ollama serve修改代码中LOCAL_IMAGE_FOLDER为自己的图片目录放入测试图片如票据、文档、普通图片运行Java程序等待识别完成。实际运行输出以票据识别为例开始执行本地图片识别任务共发现 1 张图片... 正在读取并分析图片fapiao.png ... [图片分析完成] fapiao.png -------------------------------------------------- { 项目名称: 运输服务*客运服务费, 单价: 27.72, 数量: 1, 金额: 27.72, 税率/征收率: 3%, 税额: 0.83, 合计: ¥27.72, 价税合计大写: 贰拾捌圆伍角伍分, 价税合计小写: ¥28.55, 开票人: 侯娇, 出行人: , 有效身份证件号: , 出行日期: , 出发地: , 到达地: , 备注: } -------------------------------------------------- 所有图片处理完成说明识别结果会根据图片内容自动调整文档类会提取文字普通图片会详细描述内容JSON格式可直接用于业务逻辑处理如存入数据库、展示到前端。4. 核心价值总结开发者必看这行代码看似简单却能帮开发者解决3个核心痛点真正实现“零成本落地视觉AI”4.1 零成本替代云端OCR服务无需购买百度OCR、阿里OCR等付费API本地Qwen 3.5视觉模型对常规票据、文档、图片的识别率足以满足大部分业务需求终身免费无调用次数限制。4.2 数据隐私绝对安全所有图片数据、推理过程都在本地完成仅在localhost11434端口传输没有任何数据上传到公网。对于金融、医疗、政务等敏感业务场景这是不可替代的优势。4.3 无缝对接现有Java项目可直接将工具类封装为SpringBoot Service配合Vue3Element Plus搭建前端上传界面快速实现“图片上传→本地识别→结果展示”的完整流程落地到实际业务。5. 常见问题排查避坑指南请求失败状态码404检查Ollama服务是否启动API地址是否为http://localhost:11434/api/generate模型未找到终端输入ollama pull qwen3.5:0.8b确保模型下载完成超时异常适当调整OkHttpClient的readTimeout如改为180秒大图片推理耗时更长JSON解析失败检查提示词是否严格要求“纯JSON返回”避免模型返回多余文字。结语在AI落地的浪潮中本地部署模型正在成为开发者的首选——零成本、高隐私、可定制。这篇教程的代码可直接复制使用建议收藏备用后续会更新SpringBoot集成、前端可视化对接教程关注不迷路如果运行过程中遇到问题欢迎在评论区留言一起交流探讨

Comics Downloader：构建个人数字漫画库的终极命令行解决方案

Comics Downloader：构建个人数字漫画库的终极命令行解决方案【免费下载链接】comics-downloader tool to download comics and manga in pdf/epub/cbr/cbz from a website 项目地址: https://gitcode.com/gh_mirrors/co/comics-downloader 你是否曾在网络连…...

2026/4/18 14:06:25 阅读更多 →

3步实现B站缓存视频永久保存：m4s-converter无损转换终极指南

3步实现B站缓存视频永久保存：m4s-converter无损转换终极指南【免费下载链接】m4s-converter 一个跨平台小工具，将bilibili缓存的m4s格式音视频文件合并成mp4 项目地址: https://gitcode.com/gh_mirrors/m4/m4s-converter 你是否曾经历过这样的场…...

2026/4/18 14:05:43 阅读更多 →

K210与STM32串口通信实战：从ASCII码解析到稳定数据交换

1. K210与STM32串口通信基础第一次接触K210和STM32串口通信时，我被各种专业术语搞得晕头转向。后来在实际项目中摸爬滚打才发现，理解它们之间的通信原理其实没那么难。简单来说，串口通信就像两个人用对讲机通话，K210和STM32就是两…...

2026/4/18 14:04:40 阅读更多 →

为了过等保，我们给200+服务器做了OpenSSH 10.0自动化升级，这是完整复盘

企业级OpenSSH 10.0自动化升级实战：从合规需求到批量落地当安全合规成为企业IT建设的刚性需求，基础组件的漏洞修复便从技术问题升级为战略任务。去年某次内部审计中，我们发现全公司237台服务器中，68%的OpenSSH版本存在高危漏洞&a…...

2026/4/16 22:05:04 阅读更多 →

用AI给显示器装上‘眼睛’：复旦博士的EyeReal方案，如何用三层LCD和RTX 4090实现桌面级裸眼3D？

EyeReal技术解析：三层LCDRTX 4090如何重构裸眼3D显示范式当24英寸显示器上跃然而出的立体影像不再需要特制眼镜时，我们或许正站在显示技术革命的临界点。复旦大学马炜杰博士团队发表在《Nature》的EyeReal方案，用三层普通LCD面板和消费级显卡…...

2026/4/16 14:29:57 阅读更多 →

5步轻松打造个人离线小说图书馆：番茄小说下载器完全指南

5步轻松打造个人离线小说图书馆：番茄小说下载器完全指南【免费下载链接】Tomato-Novel-Downloader 番茄小说下载器不精简版项目地址: https://gitcode.com/gh_mirrors/to/Tomato-Novel-Downloader 番茄小说下载器是一款功能强大的开源工具，专为…...

2026/4/18 10:31:36 阅读更多 →