支持向量机(SVM)概念图解(人话版)

techbrood 发表于 2019-03-24 12:05:34

标签: 模式识别, 支持向量机, svm

- +

支持向量机(support vector machine)是模式识别里面的基本概念,通俗来讲,它是一种二类分类模型,其基本模型定义为特征空间上的间隔最大的线性分类器,学习策略便是间隔最大化。

理解SVM,需要先弄清楚一个概念:线性分类。

如下图所示,现在有一个二维平面,平面上有两种不同的数据,分别用圈和叉表示。由于这些数据是线性可分的,所以可以用一条直线将这两类数据分开,这条直线就相当于一个超平面(所谓超平面就是多维空间的线性数据全集),超平面一边的数据点所对应的y全是0 ,另一边所对应的y全是1。

logistic.png

那么如何找到这样一条最适合的分隔线(或者超平面)呢?直观上我们认为线条离数据点越远越安全,那么判定“最适合”的标准就是这条直线离直线两边的数据的间隔最大。如下图中黑色、绿色和橘色线条都可以把X和O数据分开,但直观上黑线是最合适的,因为黑线到两边数据的最短距离margin是最大的,所以SVM有时候也称为大间隔分类器。

image.png

所以,得寻找有着最大间隔的超平面。

这里不列公式,直接上图说明如何从概念上寻找这样的超平面:

image.png

首先得确定两边数据集的边际线(图中的2条虚线),而位于两条虚线中间,且和两边虚线间隔相等的这个线条就是要找的超平面。

而落在两条虚线上的X和O数据点就是所谓的支持向量,相应的分析模型就是支持向量机。

最后分享一个很直白的视频解说:

possitive(19) views10971 comments0

发送私信

最新评论

请先 登录 再评论.
相关文章