AI招聘平台数据安全审计：从IDOR漏洞到百万简历泄露风险链分析

张

张建站

2026/7/4 12:42:56

10分钟阅读

1. 项目概述一次由AI招聘平台引发的数据安全深度思考最近在和朋友交流安全测试思路时聊到了一个挺有意思的话题现在很多企业都在用AI招聘平台号称能智能筛选简历、自动匹配岗位效率是高了但背后的数据安全真的跟上了吗这让我想起之前做过的一次内部安全评估目标恰好就是一个新兴的AI招聘平台。整个过程与其说是一次“漏洞挖掘”不如说是一场对现代SaaS服务数据安全边界的深度审视。最终我们发现的不仅仅是几个技术漏洞而是一条可能导致百万量级求职者敏感信息包括简历、联系方式、工作经历甚至薪资期望暴露的风险链。今天我就把这个过程的思路、方法、踩过的坑以及最重要的——那些常规渗透测试报告里不会写的“业务逻辑盲点”完整地分享出来。无论你是安全工程师、开发人员还是对数据隐私感兴趣的朋友相信都能从中获得一些关于如何保护数据、如何设计更安全系统的启发。2. 目标分析与攻击面测绘2.1 目标定位与核心业务理解这次的目标是一个典型的B2B2C模式AI招聘SaaS平台。企业客户B端付费使用上传职位需求平台利用AI算法处理求职者C端的简历进行初步筛选和匹配。核心资产非常明确B端的企业账户权限、招聘职位数据C端的海量求职者简历库以及平台的AI模型参数。攻击面也因此变得立体面向求职者的官网/小程序、面向企业客户的管理后台、内部员工使用的运营后台、以及对外提供的API接口。我的切入点选择了看似最普通的求职者Web端因为这里用户交互最复杂业务逻辑链条最长往往是安全最薄弱的环节。2.2 信息收集与资产梳理第一步永远是尽可能多地收集信息。除了常规的子域名扫描、端口探测、目录爆破我特别关注了几个点前端源码分析通过浏览器开发者工具仔细查看前端JavaScript文件。现代前端框架如React, Vue打包后有时会残留测试接口、内部API路径甚至硬编码的密钥。这次就发现了一个/api/internal/的路径在前端用于获取某些配置但并未在公开文档中提及。第三方依赖与组件检查网站使用的第三方JS库、前端组件版本。已知漏洞的第三方库是快速突破的常见入口。API接口探测使用Burp Suite等工具代理所有浏览器流量观察每一个网络请求。重点记录所有API的路径、参数、请求方法GET/POST/PUT/DELETE和响应格式。特别留意那些返回数据量大、包含ID参数的接口。错误信息与调试信息故意输入异常数据触发错误观察返回的报错信息。过于详细的错误信息如SQL语句、堆栈跟踪、服务器路径会泄露大量内部信息。注意信息收集阶段一定要控制扫描频率和请求量避免对目标服务造成压力触发告警。最好在目标业务低峰期进行并使用延迟设置。3. 漏洞挖掘路径与核心发现3.1 入口一个“不起眼”的ID参数遍历在浏览求职者个人中心时我发现了一个查看“已投递职位”状态的页面。URL形如/application/status?app_id12345。这里的app_id看起来是求职者某次职位申请的记录ID。一个很自然的想法是如果我修改这个app_id能否看到别人的申请记录我首先尝试了顺序遍历12346, 12347...发现返回了“记录不存在”或“无权限”。这很正常。但当我尝试将ID改为一个很小的数字如app_id1时服务器返回了完整的申请记录包括另一名求职者的姓名、投递职位、公司名称和申请时间这是一个典型的**不安全的直接对象引用IDOR**漏洞。系统只在前端隐藏了其他用户的入口链接但后端接口没有对请求的app_id做所属权校验导致任何登录用户只要知道记录ID就能访问他人的数据。3.2 升级从单条信息到批量泄露发现IDOR后事情并没有结束。单条遍历效率太低且容易被日志发现。我进一步分析这个/application/status接口的响应。除了基础信息它还包含一个字段叫job_id职位ID和company_id公司ID。我立刻想到两个问题能否通过job_id枚举出所有申请该职位的求职者能否通过company_id枚举出该企业收到的所有简历测试第一个猜想我构造了请求/api/jobs/{job_id}/applicants?page1size20。果然这个接口存在并且在没有正确权限校验的情况下返回了申请该职位的求职者列表包含他们的用户ID和匿名化姓名但结合之前的IDOR匿名化形同虚设。更严重的是接口支持分页参数size参数可以修改。我尝试将size改为一个很大的值如1000服务器竟然接受了并返回了大量数据。这意味着攻击者可以通过遍历热门职位的job_id批量获取成千上万求职者的关联ID。3.3 关键突破接口权限混淆与水平越权获取到大量求职者用户IDuser_id后我需要找到能通过这些user_id获取详细个人信息的关键接口。在爬取前端代码时我注意到个人中心加载简历时调用了一个接口/api/profile/v2/{user_id}/full。这个接口看起来是用于获取指定用户的完整简历信息。我使用一个刚刚收集到的、不属于我的user_id替换到请求中。第一次请求返回了“权限不足”。这似乎有校验。但我没有放弃转而检查这个请求的细节。我发现在浏览器中正常访问“我的简历”时这个请求的HTTP头部带有一个特殊的令牌X-Client-Type: web_user。而我用Burp Repeater重放请求时这个头部默认没有带上。当我手动添加上X-Client-Type: web_user后再次请求他人的user_id服务器竟然返回了该用户的完整简历PDF下载链接以及所有结构化数据姓名、电话、邮箱、完整教育经历、工作经历、项目经验、技能、甚至自我评价和薪资期望问题根源在于后端接口的权限校验逻辑存在严重缺陷。它可能只校验了用户是否登录Session有效以及X-Client-Type头部是否为合法类型但却没有将请求中的user_id参数与当前登录用户的身份进行绑定校验。这导致了严重的水平越权。任何登录的普通求职者都可以通过枚举user_id查看平台上其他任何求职者的完整敏感信息。3.4 数据关联与影响范围评估利用上述几个漏洞的组合通过IDOR和接口枚举可以获取海量的job_id,company_id,user_id。通过有缺陷的/api/profile/v2/{user_id}/full接口可以下载任意user_id对应的完整简历。简历中包含的电话、邮箱是攻击者进行精准诈骗、钓鱼的绝佳素材。工作经历和技能信息可以被竞争对手公司用于挖角或分析。薪资期望更是高度敏感的商业信息。我编写了一个简单的自动化脚本在可控的、极低的请求频率下进行验证。仅从一个热门行业的100个职位ID入手就关联提取到了近5万份简历的访问入口。理论上如果放开遍历获取百万级数据只是时间和请求策略问题。这已经构成了大规模敏感个人信息泄露的风险。4. 漏洞背后的深层原因与设计缺陷4.1 权限校验体系的系统性失效表面看是几个API的编码疏漏但根子上是权限设计模型的问题。这个平台似乎采用了一种“粗粒度”的校验方式只要你是“求职者角色”就可以访问“简历相关”的接口群。但它缺少了最关键的“数据级”权限校验即每个数据对象都必须与当前主体进行所属关系校验。在查询、修改、删除任何一条记录时后端必须明确回答“当前登录用户A是否有权操作目标数据B”这个校验必须放在业务逻辑层并且是强制性的。4.2 对“用户ID”的过度信任与暴露在整个系统中user_id、app_id等作为数据主键本应是后台逻辑使用的不应过度暴露给前端更不应作为权限校验的唯一依据。前端传递的任何一个ID参数在后台都必须被视为“不可信输入”。安全的做法是当前端请求“我的简历”时后端应该从当前登录会话Session或Token中直接解析出user_id而不是让前端传过来。对于关联查询如查看某职位的申请人应使用复杂的、有时效性的令牌如一次性的列表访问Token来代替直接传递主键ID。4.3 面向客户端与面向服务端思维的混淆这个平台的前后端分离架构可能做得不够彻底。部分接口看起来像是为内部微服务调用设计的因此信任调用方但又被错误地暴露给了外部客户端。例如/api/internal/下的接口以及那些响应数据极其完整的接口。在微服务架构下对前端暴露的API应该是经过API网关聚合和裁剪的“用户友好API”而不是直接暴露底层服务的“原始API”。原始API的调用应仅限于受信任的内部网络环境。4.4 缺乏有效的安全测试与代码审计像IDOR和水平越权这类漏洞通过系统的黑盒测试以不同用户身份尝试交叉访问数据和白盒代码审计检查每个数据查询语句是否包含用户上下文校验是很容易发现的。这说明平台在开发流程中安全测试环节可能是缺失的或者不够深入。没有建立“以攻击者视角”进行业务逻辑测试的常态机制。5. 修复建议与安全开发实践5.1 立即止损措施紧急修复漏洞接口对所有涉及用户数据的查询接口增加强制性的数据归属校验。例如在/api/profile/v2/{user_id}/full接口中从认证令牌中获取当前用户ID并与参数user_id比对不一致则直接拒绝。引入访问日志与异常监控对所有敏感数据访问请求进行详细日志记录谁、何时、访问了谁的数据并设置风控规则。例如同一用户在短时间内请求大量不同的user_id应立即触发告警并临时封禁。数据脱敏与最小化返回即使是在用户自己的界面返回的简历信息也应根据场景进行脱敏。例如在“申请列表”页面其他申请者的信息应仅显示匿名化的头像和姓氏而非完整姓名和ID。5.2 中长期架构加固实施统一的权限中间件在后端框架层面设计并部署一个全局的权限校验中间件。为每个数据模型定义权限策略Policy例如ProfilePolicy其中明确定义view、update等规则。在每个业务接口处理前都必须通过权限中间件的检查。使用资源标识符替代连续ID考虑使用UUID或经过混淆处理的随机字符串如Hashids作为对外暴露的资源标识符避免简单的顺序枚举。同时这些标识符应具备时效性或与上下文绑定防止被无限次使用。API网关与BFF层设计在前端与后端微服务之间引入API网关和专属前端的后端BFF层。由BFF层负责聚合多个微服务的数据并严格根据前端页面的需求裁剪返回字段确保“前端需要什么才返回什么”绝不暴露多余字段或原始ID。建立威胁建模与安全评审流程在项目设计阶段就引入威胁建模识别数据流、信任边界和潜在威胁。对所有涉及用户数据的增删改查功能进行强制性的安全代码评审重点检查权限校验逻辑。5.3 开发人员安全清单在开发任何数据查询接口时心中必须默念并检查以下清单这个接口用来查什么数据明确数据范围谁来调用这个接口明确调用方身份前端用户、内部服务、第三方调用者凭什么能查这些数据校验依据Token中的用户ID、角色权限、访问令牌我返回的数据是否过多是否遵循最小化原则敏感字段是否脱敏这个接口会不会被批量调用是否需要限流、防爬、审计6. 反思AI时代的数据安全挑战这次测试暴露的问题在追求快速迭代的互联网产品中并不罕见。但当它与“AI”和“招聘”这两个关键词结合时风险被急剧放大。AI招聘平台的核心价值在于数据——海量的、高质量的、结构化的简历和职位数据。这些数据是训练AI模型的燃料也是吸引企业客户的核心资产。一旦数据安全失守不仅导致用户隐私泄露、法律风险如违反个人信息保护相关法规更会从根本上摧毁平台的商业信誉。对于安全从业者而言这类测试提醒我们不能只盯着SQL注入、XSS这些传统漏洞。业务逻辑漏洞尤其是与权限、数据归属相关的漏洞往往危害更大且更难通过自动化工具发现。测试时必须深度理解业务把自己代入不同角色普通用户、付费企业、恶意攻击者去思考数据是如何流动的权限边界在哪里。对于开发者和架构师这是一个警钟在设计和开发阶段必须将“零信任”原则植入骨髓。默认不信任任何来自前端的输入默认每次数据访问都需要验证。权限校验不是可有可无的边角料而是核心业务逻辑的一部分。最后对于使用此类平台的求职者和企业也需提高警惕。求职者应定期检查自己在各平台的简历可见性设置谨慎填写过于详细的个人信息。企业在选择招聘SaaS服务时应将供应商的安全能力如是否通过SOC2、ISO27001等安全认证作为重要的评估维度。数据安全永远是数字时代的基石无论技术多么智能这一点永远不会改变。