第6章 支持向量机
6.0 基础知识:支持向量机的发展史
问题的由来:通过小鼠的重量来判断是否肥胖?
6.0.1 最大边际分类器
- 两个边界点中间称为阈值。
- 两个边界点到阈值的和称为间隔。
- 当阈值位于两个边界点的中间时,间隔取最大值,用间隔最大值为标准确定阈值的方法,叫做最大边际分类器(Maximal Margin Classifier)
- 缺点:对异常值过于敏感。
6.0.2 支持向量分类器
前者局限:
- 为了避免异常值造成的不利影响,可以允许有分类错误
用哪两个点更好:使用交叉验证
- 两个边界点内部的点均叫做支持向量(因为在计算时错误率,阈值均要考虑他们,因此叫做支持向量)
二维数据:支持向量分类器是一条线
三维数据:支持向量分类器是一个面

- 高维数据:超平面
6.0.3 支持向量机
二者局限:
解决办法:升维
核函数:详见6.3。
6.1 间隔与支持向量
支持向量:最靠近两条虚边界的向量叫做支持向量。
间隔:两个异类支持向量到超平面的距离之和称为间隔。