机器学习-监督学习1

k-近邻算法 kNN

概念
采用测量不同特征值之间的距离方法进行分类
优点
精度高
对异常值不敏感
无数据输入假定
缺点
计算复杂度高
空间复杂度高
适用
数值型
标称型
案例
约会网站效果匹配
手写识别

决策树

概念
按特征值划分法
二元划分法
划分数据集原则
信息熵entropy
信息增益information gain最大化
优点
计算复杂度不高
输出结果易于理解
对中间值的缺失不敏感
可以处理不相关特征数据
缺点
可能会过度匹配
适用
数值型
标称型
案例
眼部状况和适配的隐形眼镜类型

朴素贝叶斯

概念
计算某一点落在不同群落里的概率
利用条件概率
假定特征相互独立
优点
在数据较少情况下仍然有效
可以处理多类别问题
缺点
对输入数据的准备方式较敏感
适用
标称型
案例
垃圾邮件检测

赞(2) 打赏
特别声明:除特殊标注,本站文章均为原创,遵循CC BY-NC 3.0,转载请注明出处。三伏磨 » 机器学习-监督学习1

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏