加入收藏 | 设为首页 | 会员中心 | 我要投稿 | RSS
您当前的位置:首页 > 客户留言

基于朴素贝叶斯的分类模型及代码示例机器分类

时间:2018-09-17 04:15:12  来源:本站  作者:

  有时使用概率要比那些硬规则有效的多,贝叶斯准则和贝叶斯定理就是利用已知值来估计未知概率的方法。使用概率论进行分类,首先从一个最简单的概率分类器开始,进而给出一些假设来学习朴素贝叶斯分类器。之所以称之为朴素,是因为在整个过程当中我们都使用的是最原始,最简单的假设。贝叶斯算法的基础是概率问题,分类的原理是通过某对象的先验概率,利用贝叶斯公式计算出它的后验概率(对象属于某一类的概率),选取具有最大后验概率的类作为该对象所属的类。

  分类的原理是通过某对象的先验概率,利用贝叶斯公式计算出它的后验概率(对象属于某一类的概率),选取具有最大后验概率的类作为该对象所属的类。把A和B看作是随机变 量,那么 P(BA)就是B的后验概率,P(B)是 B 的先验概率。 对于朴素贝叶斯分类器,要做出两个假设: 1)特征之间相互独立,即一个特征的出现于其它相邻的特征并无关系; 2)每个特征同等重要。

  整个文档看成是实例,而文档中的元素相应的构成特征。我们可以观察文档中出现的词,并把每个词的出现与否相应的作为特征,进而构造分类器对文档进行分类。以一个留言社区为例,为了过滤掉那些内容不当的侮辱性言论,对此可以建立两个类别:侮辱性和非侮辱性,分别用 0 和 1 来表示。

来顶一下
返回首页
返回首页
推荐资讯
相关文章
    无相关信息
栏目更新
栏目热门