0

我是新来的数据挖掘概念,并试图了解有监督学习和无监督学习之间的差异。到目前为止,我所知道的是监督意味着从标记数据集中获取信息,而无监督意味着对数据进行聚类,而不给出任何标签。如何提出有监督和无监督学习的问题?

我有点了解它们是什么,但不能真正将它们应用于现实生活中(不能真正将这些概念应用于提出实时问题)。我在其中一个机器学习网络论坛上发现了下面的示例问题,并且想知道是否有人可以帮助我,所以我可以用它作为例子来理解这个概念。问题是:

给出以下数据集在不同的汽车上,根据监督和无监督学习构成2个问题。

image

任何形式的帮助表示赞赏。

谢谢:)

回答

0

监督学习:

所以上面的数据集有11个属性。从11个属性中我们可以看出,如果列为0,则手动变速器将列为分类,如果为1,则自动变速器为汽车。 因此,通常在监督学习中,我们会得到一个带有响应变量的训练数据,所以在这种情况下,如果你认为这是给监督学习的数据,你可以使用适当的算法训练你的模型,然后为任何测试数据预测相应的上午(手动或自动)。

无监督学习:

假定传输列没有给出,并尝试组汽车进入基于任何神经网络算法集群,看看你能不能跟两个集群这将是一个集群由手动变速箱车和一个由自动变速箱车组成的组群。

你可以查看下面的链接,这是来自Andrew Ng讲座的两个视频 他们是非常短的视频,可以帮助你更好地理解。

https://www.youtube.com/watch?v=ls7Ke48jCt8&index=3&list=PLZ9qNFMHZ-A4rycgrgOYma6zxF4BZGGPW

https://www.youtube.com/watch?v=qHfUlFHGG08&list=PLZ9qNFMHZ-A4rycgrgOYma6zxF4BZGGPW&index=4