6.3 本讲小结与作业

> 本讲小结

这一讲是MNIST手写数字识别的初步应用,通过一个神经元实现了分类任务,下一讲中,我们将会进入它的进阶——使用多层神经网络实现分类。

> 作业和思考题

Q1:本讲MNIST数据集中,标签数据为什么要用独热编码而不是直接用数字的数值本身?

Q2:分类问题的损失函数为什么一般不用MSE?为什么用交叉熵?查找一下资料,看看还有别的合适的损失函数吗?

Last updated