万本电子书0元读

万本电子书0元读

顶部广告

基于半监督与集成学习的文本分类方法电子书

售       价:¥

纸质售价:¥20.00购买纸书

28人正在读 | 0人评论 6.2

作       者:唐焕玲

出  版  社:电子工业出版社

出版时间:2013-08-01

字       数:11.1万

所属分类: 科技 > 计算机/网络 > 计算机理论与教程

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(0条)
  • 读书简介
  • 目录
  • 累计评论(0条)
文本分类技术广泛应用于新闻媒体、网络期刊文献、数字图书馆、互联网等领域,是人类处理海量文本信息的重要手段。 本书重探讨了利用信息论中的评估函数量化特征权值的方法;基于权值调整改Co-training的算法;利用互信息或CHI统计量构造特征独立模型,行特征子集划分的方法;基于投票熵维护样本权重的BoostVE分类模型;融合半监督学习和集成学习的SemiBoost-CR分类模型。 其中特征选择和权值调整方法、基于特征独立模型划分特征子集的方法适用于文本分类,其他算法不仅适用于文本分类,对机器学习和数据挖掘的其他研究也有较大的参考价值和借鉴作用。<br/>【作者】<br/>山东工商学院计算机科学与技术学院<br/>
目录展开

内容简介

前 言

第1章 绪论

1.1 研究背景及意义

1.2 国内外相关研究

1.3 本书内容组织

第2章 文本分类技术概述

2.1 文本分类预处理

2.2 文本的表示

2.3 特征选择

2.4 文本分类算法

2.5 实验数据集

2.6 分类模型的评估方法

2.7 本章小结

第3章 TEF-WA权值调整技术

3.1 特征选择存在的问题

3.2 TEF-WA权值调整技术

3.3 实验结果与分析

3.4 本章小结

第4章 结合TEF-WA技术的Co-training改进算法

4.1 Co-training算法及其存在的问题

4.2 基于TEF-WA的特征多视图

4.3 基分类器间的差异性评估

4.4 TV-SC算法与TV-DC算法

4.5 实验结果及其分析

4.6 本章小结

第5章 基于特征独立模型的Co-training改进算法

5.1 特征独立模型

5.2 特征子集划分算法PMID

5.3 基于MID-Model的改进算法SC-PMID

5.4 实验结果及其分析

5.5 本章小结

第6章 基于投票信息熵和多视图的AdaBoost改进算法

6.1 AdaBoost算法

6.2 利用特征评估函数构造多视图

6.3 基于投票信息熵的样本权重维护新策略

6.4 BoostVE算法

6.5 实验结果及其分析

6.6 本章小结

第7章 结合半监督学习的SemiBoost-CR分类模型

7.1 SemiBoost-CR模型的目标函数

7.2 未标注样本的置信度

7.3 基于置信度的重取样策略

7.4 样本权重维护策略

7.5 SemiBoost-CR分类算法

7.6 实验结果及其分析

7.7 本章小结

第8章 文本自动分类系统SECTCS

8.1 系统简介

8.2 系统总体结构

8.3 系统的用户界面

8.4 实验数据集

8.5 本章小结

结束语

参考文献

累计评论(0条) 0个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部