Scikit-learn 学习笔记（1）统计推断

原创 2022年 8月 4日

标签： MACHINE LEARNING

系列： Scikit Learn 学习笔记

全文 513 字

本页面分享链接

这个系列是我通过阅读 Scikit-learn 的文档，结合自己的理解和掌握的知识，重新把文档描述出来。希望能加深自己的理解，希望能帮到有需要的人。

学习材料：https://scikit-learn.org/stable/tutorial/statistical_inference/index.html

目标

机器学习要解决的任务包括有：

对于有标签的观测结果，构建一个统一的预测函数，不但能描述此前的多次观测结果，还能判断未来的观测结果属于哪一类
从无标签的观测结果中，学习归纳出数据的内在结构和形式

途径

为了实现上述学习目标，一种比较有效的方法是统计学习方法：统计推断（statistical inference）。

统计推断是由于总体的特征难以得到，只能通过有限的观测值来推断总体的特征。这么做的逻辑是：

每一次的观测值一定携带着有关总体的信息，通过统计的方法，就能把有关总体的信息尽可能多地提取出来。
观测值又不能完全体现有关总体的信息，所以利用观测值的统计结果代替总体的特征，总会有一定的信息损失。
如果我们能将信息的损失程度加以量化，就能寻找一种方法，将损失程度降到最低。

总体的特征又有两个方面：

确定分布时，需要估计分布的参数
未知分布时，需要对总体的做出假设

各位读后有什么想法，请在下方留言吧！如果对本文有疑问或者寻求合作，欢迎联系邮箱。邮箱已到剪贴板

标签： MACHINE LEARNING

系列： Scikit Learn 学习笔记

« 前一篇: SQLite 文档的学习笔记（2）测试方法

后一篇: Scikit-learn 学习笔记（2）数据集 »

精彩评论

称呼

本站是个人网站，采用署名协议 CC-BY-NC 授权。
欢迎转载，请保留原文链接 https://www.lfhacks.com/tech/scikit-learn-1/ ，且不得用于商业用途。

相关文章

Scikit-learn 学习笔记（0）名词术语
Scikit-learn 学习笔记（3）监督学习的例子
Scikit-learn 学习笔记（1）统计推断
Scikit-learn 学习笔记（2）数据集

本文目录