【机器学习】神经网络学习手册（四）损失函数

张

张建站

2026/5/22 8:18:01

10分钟阅读

损失函数 Loss Function用来衡量模型“错的有多离谱”损失函数模型预测值 vs 真实标签之间的差距训练目标找到一组权重让损失函数的值最小化- 损失越大预测越差需要优化- 损失越小预测越好接近目标常见的损失函数函数名中文名用途MSE均方误差回归任务预测房价、温度等连续值Cross-Entropy交叉熵分类任务猫狗识别、手写数字等BCE二分类交叉熵二分类任务专用(1)均方误差数学公式MSC1n∗∑(ypred,i−ytrue,i)2 MSC \cfrac 1n * \sum (y_{pred,i} -y_{true,i})^2MSCn1∗∑(ypred,i−ytrue,i)2**特点**对离群值敏感误差被平方放大**用途**房价预测、股票预测、温度预测代码实现defmse_loss(y_pred,y_true):returnnp.mean((y_pred-y_true)**2)MSE对预测值的梯度求导得∂L∂ypred2n(ypred−ytrue) \frac{\partial L}{\partial y_{\text{pred}}} \frac{2}{n} (y_{\text{pred}} - y_{\text{true}})∂ypred∂Ln2(ypred−ytrue)代码实现defmse_gradient(y_pred,y_true):nlen(y_pred)return2*(y_pred-y_true)/n(2)交叉熵数学公式L−1n∑i1nlog⁡(pi,ytrue,i) L -\frac{1}{n} \sum_{i1}^n \log(p_{i, y_{\text{true}, i}})L−n1i1∑nlog(pi,ytrue,i)其中pi,ytrue,ip_{i, y_{\text{true}, i}}pi,ytrue,i是第iii个样本正确类别的预测概率特点对错误分类惩罚呈指数级增长如果模型对正确类别给出高概率如 0.99损失很小≈0.01如果模型对正确类别给出低概率如 0.01损失很大≈4.6模型越不自信惩罚越重用途图像分类、文本分类、多类别识别任务代码实现defcross_entropy_loss(probs,y_true_idx):nlen(probs)correct_probsprobs[np.arange(n),y_true_idx]correct_probsnp.clip(correct_probs,1e-12,1.0)# 防止 log(0)return-np.mean(np.log(correct_probs))defsoftmax(x):x_shiftedx-np.max(x,axis-1,keepdimsTrue)exp_xnp.exp(x_shifted)returnexp_x/np.sum(exp_x,axis-1,keepdimsTrue)(3)二分类交叉熵数学公式L−1n∑i1n[yilog⁡(pi)(1−yi)log⁡(1−pi)] L -\frac{1}{n} \sum_{i1}^{n} \left[ y_i \log(p_i) (1 - y_i) \log(1 - p_i) \right]L−n1i1∑n[yilog(pi)(1−yi)log(1−pi)]其中pip_ipi是预测为正类的概率yi∈{0,1}y_i \in \{0, 1\}yi∈{0,1}是真实标签特点专门用于二分类问题是/否、真/假、正例/负例当预测正确且自信时损失接近 0当预测错误时损失迅速增大用途垃圾邮件检测、欺诈检测、疾病筛查、点击率预测代码实现defbinary_cross_entropy(y_pred,y_true): 二分类交叉熵 (Binary Cross Entropy) 公式: L -[y*log(p) (1-y)*log(1-p)] epsilon1e-12y_prednp.clip(y_pred,epsilon,1-epsilon)return-np.mean(y_true*np.log(y_pred)(1-y_true)*np.log(1-y_pred))

验证回文串【双指针、字符串】

力扣：https://leetcode.cn/problems/valid-palindrome/description/?envTypestudy-plan-v2&envIdtop-interview-150 如果在将所有大写字符转换为小写字符、并移除所有非字母数字字符之后，短语正着读和反着读都一样。则可以认为该短语是一个回文串…...

2026/5/22 8:17:07 阅读更多 →

IX6012 vs ASM1812@ACP# 完整规格场景对比｜PIN-TO-PIN 直接替代、供货稳、支持快

一、核心定位说明 IX6012：芯动微电子 12 通道 PCIe 2.0 交换芯片，工业级、低功耗、P2P / 组播全功能 ASM1812：祥硕 12 通道 PCIe 2.0 交换芯片，商用级、基础功能关键优势：IX6012 完全 PIN‑to‑PIN 兼容 ASM1812&…...

2026/5/22 8:16:05 阅读更多 →

GEO优化的时间窗口期：从流量分发到语义占位的技术范式转移

过去几十年，互联网的信息检索逻辑建立在倒排索引与超链接分析的基础之上：用户输入关键词，搜索引擎通过爬虫抓取并返回链接列表，网站则通过SEO（搜索引擎优化）争夺SERP（搜索结果页）的排…...

2026/5/22 8:14:21 阅读更多 →

单相光伏发电并网控制【附代码】

✨ 长期致力于光伏电池、整流控制、逆变控制、最大功率点跟踪技术研究工作，擅长数据搜集与处理、建模仿真、程序编写、仿真设计。 ✅ 专业定制毕设、代码 ✅ 如需沟通交流，点击《获取方式》 （1）自适应变步长电导增量法最大功率点跟…...

2026/5/21 5:49:52 阅读更多 →

【代码】hot100

Easy 两数之和两数之和 class Solution:def twoSum(self, nums: List[int], target: int) -> List[int]:xdict{}for i in range(len(nums)):jtarget-nums[i]if j in xdict.keys():return [i,xdict[j]]else:xdict[nums[i]]i 有效的括号有效的括号 class Soluti…...

2026/5/21 9:16:32 阅读更多 →

G-Helper终极教程：华硕笔记本轻量级性能控制神器

G-Helper终极教程：华硕笔记本轻量级性能控制神器【免费下载链接】g-helper Lightweight Armoury Crate alternative for Asus laptops with nearly the same functionality. Works with ROG Zephyrus, Flow, TUF, Strix, Scar, ProArt, Vivobook, Zenbook, Expertb…...

2026/5/21 14:56:19 阅读更多 →