机器学习

2023年06月05日 419 字大概 1 分钟

损失函数：用来估量模型的预测值f(x)与真实值Y的不一致程度，它是一个非负实值函数,通常使用L(Y, f(x))来表示，损失函数越小，模型的鲁棒性就越好。损失函数是经验风险函数的核心部分，也是结构风险函数重要组成部分。模型的结构风险函数包括了经验风险项和正则项，通常可以表示成如下式子

前面的均值函数表示的是经验风险函数，L代表的是损失函数，后面的Φ是正则化项

整个式子表示的意思是找到使目标函数最小时的θ值

在深度学习中，我们通常会使用损失函数来计算每个小批次数据上的损失，然后通过对整个数据集的所有损失进行平均，得到代价函数

梯度下降算法：神经网络模型训练最常用的优化算法。对于深度学习模型，基本都是采用梯度下降算法来进行优化训练的。

原理：目标函数 J（θ）关于参数 θ 的梯度将是损失函数（loss function）上升最快的方向。而我们要最小化loss，只需要将参数沿着梯度相反的方向前进一个步长，就可以实现目标函数（loss function）的下降，这个步长η又称为学习速率。

公式：θ <- θ - η*▽J（θ） J（θ）是参数的梯度

梯度下降法

反向传播算法（Backpropagation，BP算法）

反向传播算法的推导

符号约定