正在阅读:关于机器学习 这些最熟悉的陌生词你都懂吗?关于机器学习 这些最熟悉的陌生词你都懂吗?

2016-08-09 00:15 出处:PConline原创 作者:卡夫卡 责任编辑:sunziyi

  下面要说的是分类与回归,之所以将两者放在一起说,是因为它们之间联系紧密。关于分类的含义,是打造模型,将数据分类进入不同类别。这些模型的打造方式,是输入一个训练数据库,其中有预先标记好的类别供算法进行学习。之后,在模型中输入类别未经标记的数据库,让模型基于它从训练数据库中所学到的知识,预测新数据的类别。

  由于分类算法需要明确的类别标记,因此它算的上是“监督学习”的一种形式。至于回归,其与分类紧密联系在一起。怎么讲?分类是预测离散的类别,而回归则适用于预测“类别”由连续的数字组成的情况下,我们说的线性回归,便是回归技术的一个例子。

  什么是决策树?是一种自上而下,分步解决的递归分类器。通常来说,决策树由两种任务组成,即归纳与修剪。其中,归纳是用一组预先分类的数据作为输入,判断最好用哪些特性来分类,之后再将数据库分类,基于其产生的分类数据库再进行递归,直至所有的训练数据都完成分类。

  打造决策树的目标是找到特性来分类,以创造出最纯粹的子节。如此,要将数据库中所有数据分类,只需最少的分类次数,这种纯度是以信息的概念来衡量。而一个完整的决策树模型可能过于复杂,包含非必要结构,难于解读。因此,还需简化这个环节,将不需要的结构从决策树中剔除,令决策树更高效更简单易读也更加精确。

键盘也能翻页,试试“← →”键

为您推荐

加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多

网络设备论坛帖子排行

最高点击 最高回复 最新
最新资讯离线随时看 聊天吐槽赢奖品