监督学习是什么

www.zhiqu.org     时间: 2024-06-16
所谓监督学习,就是先利用有标签的训练数据学习得到一个模型,然后使用这个模型对新样本进行预测。在本质上,监督学习的目标在于,构建一个由输入到输出的映射,该映射用模型来表示。

模型属于由输入空间到输出空间的映射集合,这个集合就是假设空间(hypothesis space)。假设空间的确定,就意味着学习范围的确定。而如何在假设空间中找到最好的映射,这就是监督学习的最大动机所在。

对于监督学习来说,所构建的模型通常在训练集中学习,调整模型参数,而在测试数据集中进行预测验证。因此,训练集通常用如下公式的方式进行描述:

T ={(x 1 , y 1 ),(x 2 , y 2 ),...,(x j , y j ),...(x m , y m )}

在学习过程中需要使用训练数据,而训练数据往往是人为给出的。在这个训练集中,系统的预期输出(即标签信息)已经事先给定,如果模型的实际输出与预期不符(二者有差距),那么模型就有责任“监督”学习系统重新调整模型参数,直至二者的误差在可容忍的范围之内。因此,预期输出(标签信息)也被称为“教师信号”。

监督学习的流程框架大致分为两个部分—学习和预测,如图 1 所示。具体来说:

图 1:监督学习的流程框架

前面讲过,如果输入变量和输出变量是不同的类型(既可以是连续的,也可以是离散的),那么人们通常会根据输入和输出变量的不同类型,给预测任务赋予不同的名称,如分类、回归、标注。

举例来说,诗仙李白的那首《梦游天姥吟留别》中有一句“云青青兮欲雨”,如果我们用机器学习的角度来解析它,这个“云青青”就是输入,“青青”就是云的特征,而“雨”就是我们的预测结果。在这个问题中,我们想得到的输出是天气状态,它可能是晴朗、阴或雨等,这些状态是离散值,非此即彼,所以这就是一个典型的分类问题。

https://docs.qq.com/pdf/DR1doYmNBYUZ3RVNX

我们还拿诗仙李白的诗歌来说事。他有一首《秋浦歌》,里面有一句“白发三千丈,缘愁似个长”,假设这个“白发”是我们提取的特征,“三千丈”就是特征值,而“愁”是我们要预测的输出。那么到底有多愁呢?有一丝丝愁?有点愁?比较愁?深愁?其实它们之间并没有明显的界限,我们把这类输出变量看作连续的。对于输出变量连续的监督学习,我们将这类问题称为回归问题。

回归的主要功能在于,预测输入变量 X(自变量,即特征向量)和输出变量 Y(连续的因变量,即标签)之间的关系。这个关系的表现形式通常是一个函数解析式。在函数中,每个输入变量都有一个权值,也称为“系数”,对于特定的训练集而言,输入变量 X 可视为已知量,训练的目的在于,找到合适的系数,让 Y 和 X 在学习得到的系数框架下得到很好的拟合,即给定 X 就能很好地预测 Y。

因此,对回归问题的学习,在某种程度上等价于函数的拟合,即选择一条函数曲线,使其能很好地拟合已知数据,并较好地预测未知数据。

类似地,回归问题也分为学习和预测两部分。学习系统基于训练数据构建出一个模型,即函数 Y:

Y ≈f(x, β)

其中,β 表示未知参数,它可以是一个标量,也可以是一个向量。通过回归模型就可以把 Y 与 X 和 β 关联起来。然后,给定某个新的输入,预测系统就会根据所学的模型给出相应的输出。

~


#吴方童# 监督学习的监督学习中需要注意的问题: -
(17233347522): 1、偏置方差权衡 第一个问题就是偏见和方差之间的权衡.假设我们有几种不同的,但同样好的演算数据集.一种学习算法是基于一个未知数的输入,在经过这些数据集的计算时,系统会无误的预测到并将正确的未知数输出.一个学习算法在不...

#吴方童# 监督学习 非监督学习 半监督学习 包含哪些算法 -
(17233347522): 半监督学习(Semi-Supervised Learning,SSL)是模式识别和机器学习领域研究的重点问题,是监督学习与无监督学习相结合的一种学习方法.半监督学习使用大量的未标记数据,以及同时使用标记数据,来进行模式识别工作.当使用半监督学习时,将会要求尽量少的人员来从事工作,同时,又能够带来比较高的准确性,因此,半监督学习目前正越来越受到人们的重视.

#吴方童# 强化学习是什么 意思 -
(17233347522): 强化学习(reinforcement learning),又称再励学习、评价学习,是一种重要的机器学习方法,在智能控制机器人及分析预测等领域有许多应用.但在传统的机器学习分类中没有提到过强化学习,而在连接主义学习中,把学习算法分为三种类型,即非监督学习(unsupervised learning)、监督学习(supervised leaning)和强化学习.

#吴方童# 监督学习是怎么样的?
(17233347522): 如果真正的功能是简单的,则一个“不灵活的”学习算法具有高偏压和低的方差将能够从一个小数据量的学习

#吴方童# 什么是无监督学习 -
(17233347522): 首先看什么是学习(learning)?一个成语就可概括:举一反三.此处以高考为例,高考的题目在上考场前我们未必做过,但在高中三年我们做过很多很多题目,懂解题方法,因此考场上面对陌生问题也可以算出答案.机器学习的思路也类似:...

#吴方童# 什么是强化学习 -
(17233347522): 强化学习(RL)是一个序列决策问题. 例如:撩妹的过程就是一个优化问题.你的每一时刻的行为会对你最终撩妹是否成功,以多大的收益成功都会有影响.那么,你就会考虑,每一步采取什么行为才能(最优)撩妹!这可以看作一个RL问题.你肯定迫不及待的想知道怎么去求解了! action:你的行为 state:你观察到的妹子的状态 reward:妹子的反应:开心or不开心 所以,一个RL的基本模型已经建立.

#吴方童# 机器学习中监督学习的目标是否是最小化训练误差 -
(17233347522): 监督学习包括训练和测试两部分,模型在训练中是以最小化训练误差为目标的.但是看一个模型的好坏是看它在测试集合中的误差.

#吴方童# 多层感知器MLP 的 BP 算法是不是有监督学习! -
(17233347522): 多层感知器MLP 的 BP 算法是有监督学习. MLP学习中的BP算法是由学习过程由信号的正向传播与误差的反向传播两个过程组成.正向传播时,输入样本从输入层传入,经各隐层逐层处理后,传向输出层.若输出层的实际输出与期望的输出(教师信号)不符,则转入误差的反向传播阶段.误差反传是将输出误差以某种形式通过隐层向输入层逐层反传,并将误差分摊给各层的所有单元,从而获得各层单元的误差信号,此误差信号即作为修正各单元权值的依据.这种信号正向传播与误差反向传播的各层权值调整过程,是周而复始地进行的.权值不断调整的过程,也就是网络的学习训练过程.此过程一直进行到网络输出的误差减少到可接受的程度,或进行到预先设定的学习次数为止. BP算法介绍