
资料内容:
1.1 机器学习分类回顾
在机器学习的大框架下,我们最为熟知的两大分支便是监督学习和无监督学习。
监督学习就像是有一位老师在旁边指导的学习过程。我们会有一组已经标注好的数据,这些数据就像
是已经有答案的练习题。例如在图像分类任务中,我们有一堆图片,并且已经知道每张图片是猫还是
狗,通过这些带有明确标签的数据来训练模型 ,模型学习数据中的特征与标签之间的映射关系,从而
能够对新的未知数据进行准确分类或预测。常见的监督学习算法包括决策树、支持向量机、逻辑回归
等。
无监督学习则像是一个人在独自探索未知领域。我们面对的是没有标注的数据,没有 “标准答案” 的
指引,目标是让模型自己去发现数据中的潜在结构、模式或关系 。比如聚类算法,它可以将数据集中
相似的数据点聚集在一起,形成不同的簇,帮助我们理解数据的分布情况。像 K-Means 聚类算法,就
是通过不断迭代,将数据划分到不同的簇中,使得同一簇内的数据点相似度高,不同簇之间的数据点
相似度低。主成分分析(PCA)也是无监督学习中的一种常用方法,它主要用于数据降维,去除数据
中的冗余信息,提取主要特征。
而半监督学习,正如其名,它处于监督学习和无监督学习之间,巧妙地结合了两者的特点 。它利用少
量的标注数据和大量的未标注数据来进行模型训练,这在实际应用中具有重要意义,下面我们就来详
细了解一下半监督学习。