<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
  <channel>
    <title>Pytorch on 范彼得</title>
    <link>/tags/pytorch/</link>
    <description>Recent content in Pytorch on 范彼得</description>
    <generator>Hugo</generator>
    <language>zh-cn</language>
    <lastBuildDate>Sun, 12 Apr 2026 14:00:00 +0800</lastBuildDate>
    <atom:link href="/tags/pytorch/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>9-机器学习线性模型</title>
      <link>/posts/9-%E7%BA%BF%E6%80%A7%E6%A8%A1%E5%9E%8B/</link>
      <pubDate>Sun, 12 Apr 2026 14:00:00 +0800</pubDate>
      <guid>/posts/9-%E7%BA%BF%E6%80%A7%E6%A8%A1%E5%9E%8B/</guid>
      <description>&lt;h1 id=&#34;欢迎来到我的博客&#34;&gt;&#xA;  欢迎来到我的博客&#xA;  &lt;a class=&#34;heading-link&#34; href=&#34;#%e6%ac%a2%e8%bf%8e%e6%9d%a5%e5%88%b0%e6%88%91%e7%9a%84%e5%8d%9a%e5%ae%a2&#34;&gt;&#xA;    &lt;i class=&#34;fa-solid fa-link&#34; aria-hidden=&#34;true&#34; title=&#34;链接到标题&#34;&gt;&lt;/i&gt;&#xA;    &lt;span class=&#34;sr-only&#34;&gt;链接到标题&lt;/span&gt;&#xA;  &lt;/a&gt;&#xA;&lt;/h1&gt;&#xA;&lt;p&gt;机器学习&lt;/p&gt;&#xA;&lt;hr&gt;&#xA;&lt;h4 id=&#34;1前置知识&#34;&gt;&#xA;  1.前置知识&#xA;  &lt;a class=&#34;heading-link&#34; href=&#34;#1%e5%89%8d%e7%bd%ae%e7%9f%a5%e8%af%86&#34;&gt;&#xA;    &lt;i class=&#34;fa-solid fa-link&#34; aria-hidden=&#34;true&#34; title=&#34;链接到标题&#34;&gt;&lt;/i&gt;&#xA;    &lt;span class=&#34;sr-only&#34;&gt;链接到标题&lt;/span&gt;&#xA;  &lt;/a&gt;&#xA;&lt;/h4&gt;&#xA;&lt;p&gt;通常使用三个数据集：训练，验证，测试。&lt;/p&gt;&#xA;&lt;p&gt;训练集 —— “平时的课本和练习题”&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&#xA;&lt;p&gt;这是什么：占总数据量最大的一部分（通常是 70% ~ 80%）。&lt;/p&gt;&#xA;&lt;/li&gt;&#xA;&lt;li&gt;&#xA;&lt;p&gt;它的作用：模型唯一以用来“学习”的数据。在反向传播过程中，模型通过不断地看这些数据，计算误差，并更新自己的权重。&lt;/p&gt;&#xA;&lt;/li&gt;&#xA;&lt;li&gt;&#xA;&lt;p&gt;比喻：这就是学生平时刷的《五年高考三年模拟》。学生可以通过对着答案不断做题，来掌握解题的套路和知识点。&lt;/p&gt;&#xA;&lt;/li&gt;&#xA;&lt;li&gt;&#xA;&lt;p&gt;用来调整权重&lt;/p&gt;&#xA;&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;p&gt;验证集：&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&#xA;&lt;p&gt;这是什么：占总数据量的一小部分（通常是 10% ~ 15%）。&lt;/p&gt;&#xA;&lt;/li&gt;&#xA;&lt;li&gt;&#xA;&lt;p&gt;它的作用：模型在训练集上学了一段时间后，用验证集来“摸底测验”。绝对不能通过验证集来更新权重，它只能用来计算当前的准确率或误差。&lt;/p&gt;&#xA;&lt;/li&gt;&#xA;&lt;li&gt;&#xA;&lt;p&gt;核心目的：&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&#xA;&lt;p&gt;调节超参数 ：比如学习率设多少合适？网络需要几层？我们可以试好几个配置，看哪个在验证集上得分最高。&lt;/p&gt;&#xA;&lt;/li&gt;&#xA;&lt;li&gt;&#xA;&lt;p&gt;防止过拟合 ：如果模型在“训练集”上得分越来越高，但在“验证集”上得分反而开始下降了，说明模型变成了“做题家”（死记硬背了训练集，失去了泛化能力）。这时候框架就会自动喊停（早停法）。&lt;/p&gt;&#xA;&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;/li&gt;&#xA;&lt;li&gt;&#xA;&lt;p&gt;比喻：这就是每个月一次的模拟考。考试分数不计入最终成绩，只是为了让老师知道你的真实水平，帮你调整复习策略，防止你只会背平时的练习题答案。&lt;/p&gt;&#xA;&lt;/li&gt;&#xA;&lt;li&gt;&#xA;&lt;p&gt;用来调整超参数&lt;/p&gt;&#xA;&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;p&gt;测试集  —— “最终的高考”&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&#xA;&lt;p&gt;这是什么：留给最后的一块“净土”（通常占 10% ~ 15%）。&lt;/p&gt;&#xA;&lt;/li&gt;&#xA;&lt;li&gt;&#xA;&lt;p&gt;它的作用：在模型完全训练好、并且通过验证集挑出了最佳版本之后，只使用一次的数据集。它用来客观评估模型在面对从未见过的真实世界数据时的表现。&lt;/p&gt;&#xA;&lt;/li&gt;&#xA;&lt;li&gt;&#xA;&lt;p&gt;比喻：这就是最终的高考。题目你绝对没见过，考完直接出分。论文里标榜的模型的准确率（比如 YOLO 的 mAP 指标），必须是在测试集上跑出来的才算数。&lt;/p&gt;&#xA;&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;p&gt;Training Loss (Error) 训练损失&lt;/p&gt;&#xA;&lt;p&gt;$$&#xA;loss = (\hat{y} - y)^2 = (x * \omega - y)^2&#xA;$$&lt;/p&gt;&#xA;&lt;p&gt;Mean Square Error 平均损失MSE：&lt;/p&gt;&#xA;&lt;p&gt;$$&#xA;cost = \frac{1}{N} \sum_{n=1}^{N} (\hat{y}_n - y_n)^2&#xA;$$&lt;/p&gt;</description>
    </item>
    <item>
      <title>8-pytorch学习</title>
      <link>/posts/8-pytorch%E5%AD%A6%E4%B9%A0/</link>
      <pubDate>Wed, 08 Apr 2026 14:00:00 +0800</pubDate>
      <guid>/posts/8-pytorch%E5%AD%A6%E4%B9%A0/</guid>
      <description>&lt;h1 id=&#34;欢迎来到我的博客&#34;&gt;&#xA;  欢迎来到我的博客&#xA;  &lt;a class=&#34;heading-link&#34; href=&#34;#%e6%ac%a2%e8%bf%8e%e6%9d%a5%e5%88%b0%e6%88%91%e7%9a%84%e5%8d%9a%e5%ae%a2&#34;&gt;&#xA;    &lt;i class=&#34;fa-solid fa-link&#34; aria-hidden=&#34;true&#34; title=&#34;链接到标题&#34;&gt;&lt;/i&gt;&#xA;    &lt;span class=&#34;sr-only&#34;&gt;链接到标题&lt;/span&gt;&#xA;  &lt;/a&gt;&#xA;&lt;/h1&gt;&#xA;&lt;p&gt;pytorch&lt;/p&gt;&#xA;&lt;h2 id=&#34;知识点&#34;&gt;&#xA;  知识点&#xA;  &lt;a class=&#34;heading-link&#34; href=&#34;#%e7%9f%a5%e8%af%86%e7%82%b9&#34;&gt;&#xA;    &lt;i class=&#34;fa-solid fa-link&#34; aria-hidden=&#34;true&#34; title=&#34;链接到标题&#34;&gt;&lt;/i&gt;&#xA;    &lt;span class=&#34;sr-only&#34;&gt;链接到标题&lt;/span&gt;&#xA;  &lt;/a&gt;&#xA;&lt;/h2&gt;&#xA;&lt;h4 id=&#34;1维度诅咒&#34;&gt;&#xA;  1.维度诅咒&#xA;  &lt;a class=&#34;heading-link&#34; href=&#34;#1%e7%bb%b4%e5%ba%a6%e8%af%85%e5%92%92&#34;&gt;&#xA;    &lt;i class=&#34;fa-solid fa-link&#34; aria-hidden=&#34;true&#34; title=&#34;链接到标题&#34;&gt;&lt;/i&gt;&#xA;    &lt;span class=&#34;sr-only&#34;&gt;链接到标题&lt;/span&gt;&#xA;  &lt;/a&gt;&#xA;&lt;/h4&gt;&#xA;&lt;p&gt;它的核心含义是：当数据的特征维度（即变量的数量）增加时，数据所在空间的体积会呈指数级爆炸式增长，导致我们手头现有的数据在这样庞大的高维空间里变得极其“稀疏”。&lt;/p&gt;&#xA;&lt;p&gt;导致的问题：样本需求量呈指数级爆炸；“距离”失去了意义；极易发生过拟合&lt;/p&gt;&#xA;&lt;p&gt;解决方法：流行假设；降维技术；深度学习与表示&lt;/p&gt;&#xA;&lt;p&gt;分类、回归、聚类和降维，这四个概念构成了传统机器学习的四大核心功能支柱。&lt;/p&gt;&#xA;&lt;p&gt;分类回归为监督，聚类降维是无监督。&lt;/p&gt;&#xA;&lt;h4 id=&#34;2神经网络的简单历史&#34;&gt;&#xA;  2.神经网络的简单历史&#xA;  &lt;a class=&#34;heading-link&#34; href=&#34;#2%e7%a5%9e%e7%bb%8f%e7%bd%91%e7%bb%9c%e7%9a%84%e7%ae%80%e5%8d%95%e5%8e%86%e5%8f%b2&#34;&gt;&#xA;    &lt;i class=&#34;fa-solid fa-link&#34; aria-hidden=&#34;true&#34; title=&#34;链接到标题&#34;&gt;&lt;/i&gt;&#xA;    &lt;span class=&#34;sr-only&#34;&gt;链接到标题&lt;/span&gt;&#xA;  &lt;/a&gt;&#xA;&lt;/h4&gt;&#xA;&lt;p&gt;早期在神经科学中，认为生物受到刺激，神经元会放电。通过实验检测了猫的神经元电流，得出一个结论：哺乳动物的视觉系统是分层的。&lt;/p&gt;&#xA;&lt;p&gt;由神经元得到了一个东西：感知机。由很多感知机产生了一个概念就是人工神经网络。&lt;/p&gt;&#xA;&lt;p&gt;在人工神经网络的发展过程中，反向传播这一算法是一个核心的东西，&lt;/p&gt;&#xA;&lt;hr&gt;&#xA;&lt;p&gt;同时在此声明 本次博客网址搭建感谢我的好朋友Gemini提供技术细节支持，感谢GLM与Claude Code提供技术实现支持，感谢王甫12135、刻舟求剑的人、男男等好友提供的GLM密匙与环境搭建。&lt;/p&gt;</description>
    </item>
  </channel>
</rss>
