Scikit-learn 学习笔记(0)名词术语

这个系列是我通过阅读 Scikit-learn 的文档,结合自己的理解和掌握的知识,重新把文档描述出来。希望能加深自己的理解,希望能帮到有需要的人。

学习材料:https://scikit-learn.org/stable/tutorial/basic/tutorial.html

生活中的例子

以人类的学习过程为例:我们小时候学习 4 这个符号,给我们的学习样例是:

对于学习数字的人类幼崽来说,上面这个图片就是训练样本,学习的内容是把这个图案和 4 这个符号关联起来。

当我们学会后,会在生活中见到多种多样的 4,比如说:

当我们从上面每张图里都能正确的认出 4 时,就证明我们已经成功学习了 4 这个符号,能正确的将符号 4 和 这些图案所携带的信息关联起来。

概念

一般来讲,学习问题是以 $n$ 个采样数据为基础,预测未知数据的属性。

训练数据集:带有已知标签信息的数据集,比如上节中学习用的图案 4.

测试数据集:无标签信息,需要使用算法预测标签的数据集,比如上节中多种多样的 4.

概述

Scikit-learn 是一个 Python 的库,将机器学习算法与已有的一些科学计算库(NumPy, SciPy, matplotlib)紧密结合,充分利用了这些科学计算库的优点和便捷性,通过 统计方法 以实现 上述目标

捐助本站

为了保证阅读体验,本站不安放广告。但是,租用服务器和编写文章需要个人资金和时间的投入。

如果您觉得文章对您有用,请考虑捐助小站(金额不限),以期待更多原创文章。捐助记录

本站是个人网站,若无特别说明,文章均为原创,并采用 署名协议 CC-BY-NC 授权。
欢迎转载,惟请保留原文链接,且不得用于商业用途。