成果
科易网>技术转让>技术列表>一种MapReduce并行化大数据文本分类方法

一种MapReduce并行化大数据文本分类方法

专利(申请号):201510297189.X

专利类型:发明专利

技术成熟度:正在研发

所 在 地:陕西西安

最近更新:2019-10-14 14:23:38

行    业:电子信息-网络,电子信息-信息安全,电子信息-通信,电子信息-软件

价    格:

查看联系方式 立即评估该技术价值>>
一种MapReduce并行化大数据文本分类方法0
    项目简介
    查看技术详细文件>>

    一种MapReduce并行化大数据文本分类方法,包括如下步骤:第一步:建立用于文本分类的基准测试数据集,进行数据预处理,包括分词、去停用词、词根还原;将该基准测试数据集随机划分为训练文本和测试文本,将所述基准测试数据集采用向量空间模型建立文本表示模型;第二步:根据上述文本表示模型采用CDMT对所述基准测试数据集进行特征选择;第三步:采用贝叶斯分类器对所述基准测试数据集进行训练学习,得到分类结果。本发明提供一种分类性能良好、区分度较高的MapReduce并行化大数据文本分类方法。

    交易保障

    猜您感兴趣的

    Copyright © 2007- 科易网 版权所有
    运营商:厦门科易网科技有限公司