第二节:朴素贝叶斯(垃圾邮件分类)
朴素贝叶斯(垃圾邮件分类) 邮箱训练集下载地址 邮件训练集下载地址https://pan.baidu.com/s/1uwDJJeJAr-DX82XlCRGR9Q 模块导入 import re import os from jieba import cut from itertools import chain from co…
第一节:决策树ID3算法
决策树ID3算法 决策树(decision tree)是一种基本的分类与回归方法,同时由于自身是弱分类器特别适合集成学习,例如随机森林、XgBoost。 本文将通过ID3算法带大家入门决策树,之后会另写文章谈谈C4.5算法和CART分类回归树。 决策树ID3算法学习目标 信息增益 决策树ID3算法流程…
第二节:决策树C4.5算法
决策树C4.5算法 为了解决决策树ID3算法的不足,ID3算法的作者昆兰基于它的不足改进了决策树ID3算法。但是可能会有人有疑问,既然上一个决策树算法叫做ID3算法,为什么改进版本不叫做ID4或者ID5呢?因为当时决策树过于火爆,有人二次创新把ID4、ID5都用掉了,由此作者另辟蹊径把ID3算法的改进版本称为C4算法,后来C…