关于我们MORE>>
    中国航天科技集团公司是根据国务院深化国防科技工业管理体制改革的战略部署,经国务院批准,于1999年7月1日在原中国航天工业总公司所属部分企事业单位基础上组建的国有特大型高科...
当前位置:首页 > 期刊导读 > 2011 > 12 >

一种改进的文本分类特征选择算法

作者: 陈建华 ; 王治和 ; 蒋芸 ; 许虎寅 ; 樊东辉

摘要:现有的一种特征选择算法DPM(Discriminating Power Measure)[1],是通过计算每个特征在某一类别和剩余其他类别中的文档频,比较了特征对一个类别和对其他类别的贡献,提取出具有强类别区分能力的特征词.在研究此特征选择算法的基础上,提出了一种改进的特征选择算法,该算法同时考虑了每个特征的类别频次在计算特征类别区分能力方面的重要性.经实验验证,改进后的特征选择算法能够获得较好的分类效果.


关键字: 特征选择 DPM 文档频 词频


上一篇:基于Halcon的图像拼接算法研究
下一篇:电力系统中假数据注入攻击研究