上篇：过拟合——那个让模型变成“书呆子”的元凶

张

张建站

2026/4/12 22:53:44

10分钟阅读

一、过拟合是什么一句话一个例子一句话过拟合就是模型把训练数据里的“规律”和“噪音”一起背下来了结果遇到没见过的数据就抓瞎。一个例子你想教一个小孩认识“猫”。你给他看了10张白猫的照片他记住了“凡是白色的、有耳朵的、四条腿的都是猫。” 然后你给他看一只黑猫——他摇头“这不是猫颜色不对。” 再给他看一只橘猫——他继续摇头“花纹不对。”这个小孩就是过拟合了。他只记住了你给他的那几张照片的细节颜色、花纹、背景却没学会“猫”的本质特征。换成模型也一样它在训练数据上准确率99%一到测试数据就掉到60%。这就是典型的过拟合。二、过拟合为什么会出现——它其实是为了解决一个“矛盾”才冒出来的你可能觉得奇怪过拟合是个坏毛病怎么还“为了解决什么问题而产生”其实过拟合这个概念的出现是为了回答一个根本问题模型到底是真的学会了规律还是仅仅背下了答案在机器学习早期大家发现一个怪现象一个模型在训练集上表现得越来越好误差越来越小但拿到新数据上一测反而越来越差。这就奇怪了——按理说学得越久应该越聪明啊怎么反倒变蠢了后来人们才明白模型不光学到了真正的规律还把训练数据里的随机噪声、异常值、特殊巧合全都学进去了。这就好比你在背历史题的时候连题目里的错别字都当成知识点记下来——下次题目里没那个错别字你就不会做了。所以过拟合这个概念是为了解决“泛化能力”这个核心问题而产生的。没有过拟合我们就没法解释“为什么训练得好好的一上场就拉胯”。它提醒我们模型不是背得越多越好而是要抓住本质。三、过拟合的几种类型其实就两大类但细分有花样严格来说过拟合可以根据原因和表现分成几种常见情况。咱们不用太学术按生活中的逻辑来分1. 数据层面的过拟合样本太少型你只给了模型10张猫的照片它把每根胡须的位置都记住了。下次换一只猫胡须歪了一点它就认不出来了。样本太单一型你只给模型看白猫它就认为“猫必须是白色”。这叫采样偏差导致的过拟合。噪声太多型你给模型的照片里有些猫旁边有玩具老鼠。模型学成了“有老鼠的才是猫”——这就把无关的噪声当成了特征。2. 模型层面的过拟合模型太“胖”型参数过多好比让你用一个有1000个变量的方程去拟合3个点。你有无数种方式让这条曲线完美穿过那3个点但每条曲线在两点之间的走势都不一样——你根本不知道哪条才是对的。模型“记忆力”太强反而丧失了推理能力。训练太久型迭代次数过多就像让你盯着同一道题做100遍你连题目里的墨渍形状都背下来了而不是真正理解了解题思路。深度学习里叫early stopping的反面。3. 特征层面的过拟合特征太细型你告诉模型“猫的瞳孔在下午3点的光线下是竖线形”——这确实是个特征但太细了换一只猫、换一个时间就变了。模型把无关紧要的细节当成了必要条件。引入无关特征型你给模型加了“照片里有没有沙发”这个特征。训练集里所有的猫照片都有沙发模型就学成了“有沙发才有猫”。这叫特征冗余导致的过拟合。你看不管是哪种类型归根结底一句话模型把局部当成了全局把偶然当成了必然。

FastAPI子应用挂载：别再让root_path坑你一夜邑

Julia（julialang.org）由Stefan Karpinski、Jeff Bezanson等在2009年创建，目标是融合Python的易用性、C的高性能、R的统计能力、Matlab的科学计算生态。其核心设计哲学是： 高性能：编译型语言（JIT&#xff0…...

2026/4/12 22:52:42 阅读更多 →

032篇：窗口管理：激活窗口、关闭窗口、获取窗口句柄

1. 前言在实际的RPA流程中，经常需要同时操作多个窗口：浏览器、Excel、记事本、ERP系统……脚本必须知道“当前应该激活哪个窗口”，才能将键盘鼠标指令发送到正确的位置。窗口管理就是解决这个问题的：通过窗口标题、类名、句柄等标识，精准地激活、关闭、定位窗口。本…...

2026/4/12 22:50:32 阅读更多 →

STK9自定义地面设施数据库实战：从零构建到批量插入

1. 为什么需要自定义地面设施数据库第一次用STK插入地面设施时，我也被它自带的数据库惊艳到了——点几下鼠标就能快速添加国际空间站、著名天文台这些预设位置。但真正开始做国内项目时，问题来了：想添加北京卫星控制中心？没有。想…...

2026/4/12 22:46:16 阅读更多 →

为了过等保，我们给200+服务器做了OpenSSH 10.0自动化升级，这是完整复盘

企业级OpenSSH 10.0自动化升级实战：从合规需求到批量落地当安全合规成为企业IT建设的刚性需求，基础组件的漏洞修复便从技术问题升级为战略任务。去年某次内部审计中，我们发现全公司237台服务器中，68%的OpenSSH版本存在高危漏洞&a…...

2026/4/12 0:00:08 阅读更多 →

用AI给显示器装上‘眼睛’：复旦博士的EyeReal方案，如何用三层LCD和RTX 4090实现桌面级裸眼3D？

EyeReal技术解析：三层LCDRTX 4090如何重构裸眼3D显示范式当24英寸显示器上跃然而出的立体影像不再需要特制眼镜时，我们或许正站在显示技术革命的临界点。复旦大学马炜杰博士团队发表在《Nature》的EyeReal方案，用三层普通LCD面板和消费级显卡…...

2026/4/12 0:01:49 阅读更多 →

5步轻松打造个人离线小说图书馆：番茄小说下载器完全指南

5步轻松打造个人离线小说图书馆：番茄小说下载器完全指南【免费下载链接】Tomato-Novel-Downloader 番茄小说下载器不精简版项目地址: https://gitcode.com/gh_mirrors/to/Tomato-Novel-Downloader 番茄小说下载器是一款功能强大的开源工具，专为…...

2026/4/12 0:07:16 阅读更多 →