欢迎来到我的博客 链接到标题
机器学习
1.前置知识 链接到标题
通常使用三个数据集:训练,验证,测试。
训练集 —— “平时的课本和练习题”
-
这是什么:占总数据量最大的一部分(通常是 70% ~ 80%)。
-
它的作用:模型唯一以用来“学习”的数据。在反向传播过程中,模型通过不断地看这些数据,计算误差,并更新自己的权重。
-
比喻:这就是学生平时刷的《五年高考三年模拟》。学生可以通过对着答案不断做题,来掌握解题的套路和知识点。
-
用来调整权重
验证集:
-
这是什么:占总数据量的一小部分(通常是 10% ~ 15%)。
-
它的作用:模型在训练集上学了一段时间后,用验证集来“摸底测验”。绝对不能通过验证集来更新权重,它只能用来计算当前的准确率或误差。
-
核心目的:
-
调节超参数 :比如学习率设多少合适?网络需要几层?我们可以试好几个配置,看哪个在验证集上得分最高。
-
防止过拟合 :如果模型在“训练集”上得分越来越高,但在“验证集”上得分反而开始下降了,说明模型变成了“做题家”(死记硬背了训练集,失去了泛化能力)。这时候框架就会自动喊停(早停法)。
-
-
比喻:这就是每个月一次的模拟考。考试分数不计入最终成绩,只是为了让老师知道你的真实水平,帮你调整复习策略,防止你只会背平时的练习题答案。
-
用来调整超参数
测试集 —— “最终的高考”
-
这是什么:留给最后的一块“净土”(通常占 10% ~ 15%)。
-
它的作用:在模型完全训练好、并且通过验证集挑出了最佳版本之后,只使用一次的数据集。它用来客观评估模型在面对从未见过的真实世界数据时的表现。
-
比喻:这就是最终的高考。题目你绝对没见过,考完直接出分。论文里标榜的模型的准确率(比如 YOLO 的 mAP 指标),必须是在测试集上跑出来的才算数。
Training Loss (Error) 训练损失
$$ loss = (\hat{y} - y)^2 = (x * \omega - y)^2 $$
Mean Square Error 平均损失MSE:
$$ cost = \frac{1}{N} \sum_{n=1}^{N} (\hat{y}_n - y_n)^2 $$
2. 链接到标题
早期在神经科学中,认为生物受到刺激,神经元会放电。通过实验检测了猫的神经元电流,得出一个结论:哺乳动物的视觉系统是分层的。
由神经元得到了一个东西:感知机。由很多感知机产生了一个概念就是人工神经网络。
在人工神经网络的发展过程中,反向传播这一算法是一个核心的东西,
同时在此声明 本次博客网址搭建感谢我的好朋友Gemini提供技术细节支持,感谢GLM与Claude Code提供技术实现支持,感谢王甫12135、刻舟求剑的人、男男等好友提供的GLM密匙与环境搭建。