www.zhiqu.org     时间: 2024-06-16
机器学习 一 监督学习和无监督学习的区别~

1、机器学习按照方法来分类,可以分成四类,分别是:监督学习、无监督学习、半监督学习和强化学习。
2、监督学习针对有标签数据集,它通过学习出一个模型(其实就是一个函数)来拟合数据,按照模型(函数)的输出结果是否离散又可以分为两类,分别是:(1)输出结果为离散值,则为分类问题(常见的分类算法:KNN、贝叶斯分类器、决策树、SVM、神经网络、GBDT、随机森林等);(2)输出结果为连续值,则为回归问题(有线性回归和逻辑回归两种)。
3、无监督学习针对没有标签的数据集,它将样本按照距离划分成类簇,使得类内相似性最大,类间相似性最小。通过观察聚类结果,我们可以得到数据集的分布情况,为进一步分析提供支撑。常见的聚类算法有K-means、高斯混合模型和LDA。

机器学习任务根据训练样本是否有label,可以分为监督学习和无监督学习
监督学习的训练样本有label,主要是学习得到一个特征空间到label的映射,如分类、回归等
无监督学习的训练样本没有label,主要是发现样本的内部结构,如聚类、降维、可视化等