4.2 基本术语

标签一般指的是我们要预测的真实事务，在图3中，我们用y坐标的值进行表示。

特征是指用于描述数据的输入变量，一般使用{x1,x2,…,xn}进行表示，在图3所示的线性回归问题中只有一个x轴。

样本是指数据的特定实例：x ，有标签样本具有{特征，标签}：{x，y}，被用于训练模型；无标签样本具有{特征，？}：{x，?}，用于对新数据做出预测。

模型可将样本映射到预测标签：y’，由模型的内部参数定义，这些内部参数值是通过学习得到的。

4.2.3 训练（学习）

训练模型表示通过有标签样本来学习（确定）所有权重和偏差的理想值，在监督式学习中，机器学习算法通过以下方式构建模型：检查多个样本并尝试找出可最大限度地减少损失的模型，这一过程称为经验风险最小化。

损失是对糟糕预测的惩罚，损失是一个数值，表示对于单个样本而言模型预测的准确程度。

如果模型的预测完全准确，则损失为零，否则损失会较大。

训练模型的目标是从所有样本中找到一组平均损失“较小”的权重（w）和偏差（b）。

Last updated 5 years ago