监督学习和无监督学习有什么区别?
artificial-intelligence
machine-learning
6
0

在人工智能和机器学习方面,有监督和无监督学习有什么区别?您能否通过示例提供基本,简单的说明?

参考资料:
Stack Overflow
收藏
评论
共 10 个回答
高赞 时间 活跃

监督学习

训练数据包括输入向量的示例及其对应的目标向量的应用程序称为监督学习问题。

无监督学习

在其他模式识别问题中,训练数据由一组输入向量x组成,没有任何相应的目标值。此类无监督学习问题的目标可能是发现数据中相似样本的组,在此称为聚类

模式识别和机器学习(Bishop,2006年)

收藏
评论

机器学习:它研究和学习可以从数据中学习并进行数据预测的算法。此类算法通过从示例输入中构建模型来进行操作,以便将数据驱动的预测或决策表达为输出,而不是严格遵循静态程序说明。

监督学习:这是从标记的训练数据中推断功能的机器学习任务,训练数据由一组训练示例组成。在监督学习中,每个示例都是一对,由输入对象(通常是矢量)和期望的输出值(也称为监督信号)组成。监督学习算法会分析训练数据并产生一个推断函数,可用于映射新示例。

呈现给计算机的样例输入及其期望的输出(由“老师”给出),目标是学习将输入映射到输出的通用规则。具体地说,监督学习算法采用一组已知的输入数据和已知的响应数据(输出),并训练模型以生成对新数据响应的合理预测。

无监督学习:这是没有老师的学习。您可能想对数据进行处理的一件事是将其可视化。机器学习任务是从未标记的数据中推断出描述隐藏结构的功能。由于提供给学习者的示例是未标记的,因此没有错误或奖励信号可以评估潜在的解决方案。这将无监督学习与有监督学习区分开来。无监督学习使用尝试查找模式自然划分的过程。

在无监督学习的情况下,没有基于预测结果的反馈,即没有老师纠正您。在无监督学习方法下,没有提供带标签的示例,并且在学习过程中没有输出的概念。结果,取决于学习方案/模型来找到模式或发现输入数据的组

当您需要大量数据来训练模型,实验和探索的意愿和能力时,应该使用无监督学习方法,当然,通过更成熟的方法也无法很好地解决挑战。与监督学习相比,可以学习更大,更复杂的模型。 是一个很好的例子

收藏
评论

我一直发现,无监督学习和无监督学习之间的区别是任意的,有些令人困惑。两种情况之间没有真正的区别,相反,在一系列情况下,算法可以具有或多或少的“监督”。半监督学习的存在就是明显的例子,这条线是模糊的。

我倾向于将监督视为对算法的反馈,指出应该采用哪种解决方案。对于传统的监督设置(例如垃圾邮件检测),您要告诉算法“不要在训练集上犯任何错误” ;对于传统的无监督设置(例如聚类),您告诉算法“彼此靠近的点应在同一聚类中” 。碰巧的是,第一种反馈形式比后者更具体。

简而言之,当有人说“有监督”时,请思考分类,而当他们说“无监督”时,请考虑聚类,并尽量不要为此担心太多。

收藏
评论

由于您提出了这个非常基本的问题,因此似乎值得指定机器学习本身。

机器学习是一类由数据驱动的算法,即与“普通”算法不同的是,数据“说明”了“好答案”。示例:一种用于图像中人脸检测的假想非机器学习算法将尝试定义人脸(皮肤圆形的彩色圆盘,期望眼睛的区域较暗,等等)。机器学习算法将没有这样的编码定义,但会“通过示例学习”:您将显示几张面孔和非面孔的图像,并且一个好的算法最终将学习并能够预测是否看不见图像是一张脸。

这个特定的面部检测示例是受监督的 ,这意味着您的示例必须标记为 ,或明确指出哪些是面部,哪些不是。

无监督算法中,您的示例未标记为 ,即您什么也没说。当然,在这种情况下,算法本身不能“发明”一张脸是什么,但是它可以尝试将数据聚类到不同的组,例如,它可以区分出脸与风景有很大不同,而风景与马有很大不同。

由于另一个答案提到了它(尽管以错误的方式):存在“中间”形式的监督,即半监督主动学习 。从技术上讲,这些是受监督的方法,其中有些“智能”方法可以避免使用大量带标签的示例。在主动学习中,算法本身决定应该标记的东西(例如,可以很确定地识别风景和马匹,但是它可能会要求您确认大猩猩是否确实是一张脸的图片)。在半监督学习中,有两种不同的算法,从带标签的示例开始,然后以他们对大量未标签数据的思考方式相互“讲述”。他们从这种“讨论”中学习。

收藏
评论

监督学习

在这种情况下,用于训练网络的每个输入模式都与输出模式相关联,该输出模式是目标或所需模式。当在网络的计算输出和正确的预期输出之间进行比较以确定错误时,假定在学习过程中有教师在场。然后可以使用该错误来更改网络参数,从而提高性能。

无监督学习

在这种学习方法中,目标输出不会呈现给网络。好像没有老师演示所需的模式,因此,系统通过发现并适应输入模式中的结构特征来学习自己的模式。

收藏
评论

例如,训练神经网络经常是有监督的学习:您是在告诉网络与要输入的特征向量对应的类。

聚类是无监督的学习:让算法决定如何将样本分组为具有共同属性的类。

无监督学习的另一个例子是Kohonen的自组织图

收藏
评论

在监督学习中,为输入x提供预期的结果y (即,当输入为x时模型应该产生的输出),通常称为相应输入的“类”(或“标签”) x

在无监督学习中,不提供示例x的“类”。因此,可以将无监督学习视为在未标记的数据集中找到“隐藏结构”。

监督学习的方法包括:

  • 分类(1R,朴素贝叶斯,决策树学习算法,例如ID3 CART等)

  • 数值预测

无监督学习的方法包括:

  • 聚类(K均值,分层聚类)

  • 关联规则学习

收藏
评论

我可以举个例子。

假设您需要识别哪种车辆是汽车,哪种车辆是摩托车。

监督学习情况下,您的输入(训练)数据集需要标记,即对于输入(训练)数据集中的每个输入元素,应指定它代表的是汽车还是摩托车。

无监督学习的情况下,您不标记输入。无监督模型基于例如相似的特征/属性将输入聚类为聚类。因此,在这种情况下,没有像“汽车”这样的标签。

收藏
评论

监督式学习是指您为算法提供数据的数据是“标记”或“标记”的,以帮助您的逻辑做出决策。

示例:贝叶斯垃圾邮件过滤,您必须将某个项目标记为垃圾邮件以优化结果。

无监督学习是尝试寻找相关性而没有原始数据以外的任何外部输入的算法类型。

示例:数据挖掘聚类算法。

收藏
评论

监督学习

监督学习基于训练来自数据源的数据样本,其中已经分配了正确的分类。此类技术用于前馈或多层感知器(MLP)模型中。这些MLP具有三个鲜明的特征:

  1. 不属于网络输入或输出层一部分的一层或多层隐藏神经元,这些层使网络能够学习和解决任何复杂的问题
  2. 神经元活动中反映的非线性是可区分的,并且
  3. 网络的互连模型表现出高度的连通性。

这些特征以及通过培训获得的学习解决了各种难题。通过在有监督的ANN模型中进行训练来学习,也称为错误反向传播算法。纠错学习算法基于输入输出样本来训练网络,并找到误差信号,该误差信号是计算出的输出与所需输出的差,并调整与误差乘积成比例的神经元的突触权重。信号和突触权重的输入实例。基于此原理,错误反向传播学习分两步进行:

前向通行证:

在这里,输入向量被呈现给网络。该输入信号通过神经元通过神经元向前传播,并作为输出信号出现在网络的输出端: y(n) = φ(v(n))其中v(n)是神经元的感应局部场由v(n) =Σ w(n)y(n).将在输出层o(n)计算出的输出与所需响应d(n)并找到该神经元的误差e(n) 。在此过程中,网络的突触权重保持不变。

后向通行证:

起源于该层输出神经元的错误信号通过网络向后传播。这将计算每一层中每个神经元的局部梯度,并允许网络的突触权重根据增量规则进行更改,如下所示:

Δw(n) = η * δ(n) * y(n).

递归计算将继续进行,每个输入模式的前向遍历,然后是后向遍历,直到网络收敛为止。

人工神经网络的监督学习范例非常有效,可以找到一些线性和非线性问题的解决方案,例如分类,工厂控制,预测,预测,机器人等。

无监督学习

自组织神经网络使用无监督学习算法进行学习,以识别未标记输入数据中的隐藏模式。这种无人监督是指在不提供错误信号来评估潜在解决方案的情况下学习和组织信息的能力。在无监督学习中缺少学习算法的方向有时可能是有利的,因为它使算法可以回顾以前未考虑的模式。自组织图(SOM)的主要特征是:

  1. 它将任意维度的输入信号模式转换为一维或二维映射,并自适应地执行此转换
  2. 该网络表示前馈结构,具有单个计算层,该单个计算层由以行和列排列的神经元组成。在表示的每个阶段,每个输入信号都保持在适当的上下文中,并且
  3. 处理紧密相关信息的神经元靠在一起,并通过突触连接进行交流。

由于该层中的神经元相互竞争以变得活跃,因此计算层也称为竞争层。因此,该学习算法称为竞争算法。 SOM中的无监督算法分为三个阶段:

比赛阶段:

对于呈现给网络的每个输入模式x ,计算具有突触权重w内积,竞争层中的神经元找到判别函数,该判别函数会诱导神经元之间的竞争,并且突触权重向量接近于神经元中的输入向量。欧几里德距离宣布为比赛的获胜者。该神经元被称为最佳匹配神经元,

i.e. x = arg min ║x - w║.

合作阶段:

获胜的神经元确定了协作神经元的拓扑邻域h的中心。这是通过协作神经元之间的横向相互作用d来执行的。该拓扑邻域会在一段时间内减小其大小。

适应阶段:

通过适当的突触权重调整,使获胜的神经元及其附近的神经元相对于输入模式增加判别功能的各个值,

 Δw = ηh(x)(x –w).

在重复呈现训练模式时,由于邻域更新,突触权重矢量趋向于遵循输入模式的分布,因此ANN在没有主管的情况下学习。

自组织模型自然地代表了神经生物学行为,因此可用于许多实际应用中,例如聚类,语音识别,纹理分割,矢量编码等。

参考。

收藏
评论
新手导航
  • 社区规范
  • 提出问题
  • 进行投票
  • 个人资料
  • 优化问题
  • 回答问题

关于我们

常见问题

内容许可

联系我们

@2020 AskGo
京ICP备20001863号