AI 智能应用开发面试题
这份是AI智能应用开发Java后端方向面试题 标准答案完全按你技术栈整理可直接背诵面试命中率极高。一、大模型基础必问什么是LLM和传统机器学习区别LLM 是大规模语言模型基于Transformer架构通过海量文本预训练具备理解、生成、推理能力。区别传统ML需要特征工程标注数据针对单一任务LLM是通用能力零/少样本即可使用无需复杂特征工程。什么是Token为什么限制上下文长度Token是模型处理文本的最小单位中文一般1字≈1token。限制长度是因为模型算力与上下文长度成指数增长过长会导致显存爆炸、推理变慢。大模型幻觉是什么怎么解决幻觉指模型编造不存在的事实、数据。解决使用RAG引入真实知识优化Prompt约束增加事实校验使用更精准的垂直领域模型。temperature、top_p作用temperature越高越随机 creative越低越稳定 deterministic。top_p核采样控制累积概率越小越聚焦、越保守。什么是Embedding将文本/图像转为低维稠密向量让计算机能计算语义相似度是RAG的核心基础。SSE流式返回和普通接口区别SSE服务端持续推送数据前端逐字展示体验好适合AI对话。普通接口一次性返回等待时间长无打字机效果。二、Prompt工程必考好的Prompt包含什么角色定义、任务说明、输入输出格式、约束条件、示例Few-shot、参考资料。如何让模型输出固定JSON在Prompt强制要求返回JSON给出格式示例关闭markdown禁止额外解释。Few-shot、CoT是什么Few-shot给少量示例让模型模仿输出。CoT思维链让模型分步思考提升推理准确率。如何防止Prompt注入对用户输入过滤转义将用户输入包裹在固定标签内设置系统强约束校验输出合法性。三、RAG 检索增强生成核心必问什么是RAG为什么企业优先RAGRAG检索生成先从知识库检索相关内容再让模型基于事实回答。优点成本低、迭代快、数据可更新、无训练风险、解决幻觉比微调更适合企业。RAG完整流程文档解析→文本分块→Embedding→存入向量库→用户问题向量化→检索相似块→拼接Prompt→模型生成答案。文档分块Chunk策略按固定长度按段落/章节按语义分割带滑动窗口避免上下文断裂向量数据库作用高效存储和检索高维向量快速计算语义相似度支撑海量文本毫秒级召回。常用向量库Milvus企业级、Redis VectorJava友好、FAISS轻量、Chroma简单。如何提高RAG准确率优化分块、优化Embedding模型、混合检索关键词向量、重排序、多轮上下文改写、过滤低相关片段。RAG和微调区别RAG实时更新、成本低、适合知识库。微调修改模型权重、效果更贴合、成本高、周期长、适合固定风格/逻辑。四、AI Agent 智能体加分什么是AI Agent具备感知、规划、工具调用、记忆、反思能力能自主完成复杂任务的AI实体。Function Calling是什么模型根据用户意图自动判断并输出结构化参数调用外部接口/数据库/工具。Agent执行流程任务理解 → 规划 → 调用工具 → 获取结果 → 生成回答 → 反思校验。Agent记忆如何设计短期记忆对话上下文存在Redis/会话。长期记忆向量库存储历史经验、用户偏好。总结记忆对长对话做摘要压缩。如何避免死循环限制最大调用次数增加执行校验异常熔断人工干预机制。五、Java AI 工程化你核心优势Java如何对接大模型使用RestTemplate/Feign/OkHttp调用OpenAI格式API用Spring AI或LangChain4j简化开发。Spring AI / LangChain4j作用封装模型调用、Embedding、向量库、Prompt模板、工具调用简化AI应用开发。Java如何实现SSE流式输出使用Spring Boot的SseEmitter或WebFluxServerSentEvent逐片推送数据。如何做Token计费与限流记录输入输出token数使用Sentinel接口限流Redis缓存高频问答降低调用。AI服务如何接入微服务拆分为独立AI微服务通过Gateway统一入口使用Nacos注册发现Sentinel限流熔断。高并发下AI接口优化异步处理、队列削峰、本地缓存、批量请求、模型负载均衡、降级方案。六、项目实战题面试官最爱你的AI项目架构前端Vue/React → 网关Gateway → AI微服务 → RAG模块 → 向量库 MySQL Redis。RAG遇到的问题召回不准、分块不合理、上下文过长、答案不精准。优化混合检索、重排序、滑动窗口、Prompt精简。如何保证回答可溯源记录检索来源片段前端展示引用出处提高可信度。不同用户访问不同知识库怎么做向量库按用户/角色维度打标签检索时增加权限过滤基于租户ID隔离数据。大模型超时怎么处理超时熔断、异步任务、重试机制、降级返回兜底文案。