监督机器学习类似于人类或动物的
理解监督学习
监督学习在技术上意味着学习一种函数,该函数基于一组定义的输入-输出对,为给定的输入提供输出。
它借助由一组训练示例组成的标记“训练数据”来实现这一点。
在我们之前的例子中,鞋子的图片和名称“鞋子”分别是输入和输出。
在从数百或数千张不同的鞋子图片和“鞋子”的名称以及袜子的名称中学习之后,当我们的系统仅给出输入(一张新的鞋子图片)时,它将给出输出(名称:鞋子)。
通常,函数 y = f(x) 用于表示监督 ML,其中“x”是输入数据,“y”是输出变量, “x”是需要预测的函数。
在任何训练数据中,示例对通常由一个输入组成,该输入通常是一个向量(确定样本的特征集合)。
我们把期望的输出值称为‘监控信号’,其含义从名称上就很容易理解。
有趣的是,“概念学习”或“类别学习”。
它的定义是“寻找并列出可用于区分各类范例和非范例的属性”(Bruner、Goodnow、Austin(1967))。
广义上讲,监督式机器学习 顶级电子邮件列表 可分为以下类型:
1.分类
顾名思义,分类算法承担着预测标签或将变量归入某个类别(分类)的任务。
例如,将我们前面的例子中的某物归类为“袜子”。
分类预测算法的日常应用是电子邮件中的垃圾邮件检测器,它将识别有助于将电子邮件归类为“垃圾邮件”或“非垃圾邮件”的属性。
能够识别问题是分类问题还是回归问题非常重要。
分类问题的特点:
(i)示例可以归入两个 树立公司的正面形象 或多个类别之一
(二)两个类的问题 销售线索也可以称为二元问题
(三)如果问题涉及两个以上的类别,则可以称为多类分类问题
下图显示了一个典型的分类问题,其中变量被“归类”为“猫”类别或“狗”类别。
从边界线上还可以看出,将一些狗归类为猫,反之亦然,这是有误的。
在属性可能相似的情况下会出现此问题,例如当身高是分类标准之一时,某些品种的狗可能身体较矮。