非监督学习名词解释

www.zhiqu.org     时间: 2024-05-24

非监督学习是指在没有类别信息情况下,通过对所研究对象的大量样本的数据分析实现对样本分类的一种数据处理方法。

由于在很多实际应用中,缺少所研究对象类别形成过程的知识,或者为了判断各个样本(模式)所属的类别需要很大的工作量(例如卫星遥感照片上各像元所对应的地面情况),因此往往只能用无类别标答的样本集进形学习。

通过无监督式学习,把样本集划分为若干个子集(类别),从而直接解决看样本的分类问题,或者把它作为训练样本集,再用监督学习方法进行分类器设计。

在非监督学习中,数据并不会被特别标识,学习模型是为了推断出数据的一些内在结构。非监督学习一般有两种思路:

(1)第一种思路是在指导Agent时不为其指定明确的分类,而是在成功时采用某种形式的激励制度。需要注意的是,这类训练通常会被置于决策问题的框架里,因为它的目标不是产生一个分类系统,而是做出最大回报的决定,这类学习往往被称为强化学习。

(2)第二种思路称为聚合(Clustering),这类学习类型的目标不是让效用函数最大化,而是找到训练数据中的近似点,本节将重点介绍此类非监督学习思路。

无监督学习主要有以下两大类方法:

(1) 基于概率密度函数估计的直接方法如果给定的样本集是由各类都服从高斯分布的样本混合在一起组成的,在类别数已知的条件下,可以用最大似然法或Bayes估计法,从混合的概率密度函数中分解出各个类的概率密度函数,然后用Bayes决策方法设计模式分类器。

在非高斯概率分布情况下,只要各类的概率密度函数的形式已知,且分解是惟一的,都可以用上述方法实现分类器设计。在没有任何概率分布先验知识的情况下,可以把特征空间划分为着若干个队域,使每个区域都具有单峰的分布性质,每一个区域就相当于一个类别。

(2) 基于样本间相似度呈的间接聚类方法如果用样本在特征窄问中相互问的距离来度量样本间的相似度,就可以设计出某种评价分类质量的准则函数,通过数学方法把特征空间划分为与各个类别相对应的区域,也就是通常所说的聚类分析。

聚类分析是无监督学习的主要方法,它能从大量的数据集中找出有规律性的结果。为了适应各种实际问题的数据结构的特点,还发展了以上述方法为基础的各种其他算法



~


#辛晨京# 非监督分类的具体概念 -
(19264354792): 非监督分类是指人们事先对分类过程不施加任何的先验知识,而仅凭数据(遥感影像地物的光谱特征的分布规律),即自然聚类的特性,进行“盲目”的分类;其分类的结果只是对不同类别达到了区分,但并不能确定类别的属性,亦...

#辛晨京# 非监督分类可以用混淆矩阵进行精度评价吗 -
(19264354792): 混淆矩阵(Confusion Matrix)是用来评价有监督学习的准确性的.一般每一行代表真实类别数量,每一列代表预测的数量.非监督学习没有Ground Truth,因此没有混淆矩阵的概念.