引言上一章我们让 n8n 与数据库深度对话,处理了规整的结构化数据。但在真实业务中,大量关键信息(如报表、合同、图片)都封装在文件里。本章,我们将解决一个经典痛点:如何自动抓取散落在各处的文件,提取信息并妥善归档,让 n8n 成为你的文件处理中枢。核心理论:Binary Data 与缓存机制在 n8n 中,所有非文本类数据(如图片、PDF、Excel等)都被统一抽象为Binary Data。理解其工作机制是高效处理文件的关键。二进制数据流:当节点(如 Email Attachment)读取一个文件时,它并不直接输出文件本身,而是输出一个包含该文件二进制数据引用的 JSON 对象。这个对象通常包含binary属性,其中存储了数据的标识符、文件名和 MIME 类型。智能缓存:n8n 服务端会将二进制数据暂存在内存或配置的缓存目录中。这避免了在工作流节点间传递巨大的字节流,极大提升了性能。只有当你使用特定节点(如“Write Binary File”或云存储节点)时,n8n 才会根据这个引用去缓存中读取实际数据并执行写入操作。生命周期:工作流执行完毕后,相关的临时缓存数据会被清理。因此,如需永久保存文件,务必在工作流中显式地将其存储到持久化位置(如本地磁盘、S3)。简单比喻:你可以把它想象