万本电子书0元读

万本电子书0元读

顶部广告

汉语文本自动校对研究电子书

售       价:¥

24人正在读 | 0人评论 6.2

作       者:刘亮亮

出  版  社:江苏人民出版社

出版时间:2020-08-01

字       数:9.9万

所属分类: 人文社科 > 社会科学 > 新闻传播/语言文字

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(0条)
  • 读书简介
  • 目录
  • 累计评论(0条)
【内容简介】 文本自动校对是自然语言理解的应用,也是自然语言理解的一个研究难题。本书介绍文本校对的研究现状,对中文文本自动校对的方法进行了归纳和总结,并对汉语文本中的错误进行分类;论述了文本校对所需的知识与资源以及获取知识与资源的方法;详细阐述了文本自动校对的方法与实验分析方法,包括基于模糊分词的错别字识别,基于统计模型与冲突的错别字识别等方法等。在论述的过程中,作者理论结合应用,列举了大量实际的案例,使得本书很有可读性。
目录展开

第一章 文本自动校对概述

一、文本自动校对的研究背景与意义

(一)研究背景

(二)研究意义

二、国内外研究现状

(一)英文文本自动校对的研究现状

(二)中文文本自动校对研究现状

(三)中英文文本自动校对比较

三、文本校对的相关理论和技术

(一)自然语言理解相关技术

(二)文本知识获取

(三)实体名称识别

四、关于本文

(一)主要内容

(二)本文结构

第二章 文本错误分析与资源构建

一、引言

二、汉语文本错误分析

(一)汉字错别字类型

(二)汉语文本错误类型

(三)文本中错别字统计

三、资源及其构建

(一)汉字混淆集

(二)错字词对

(三)搭配知识

(四)同音词与近音词词典

(五)叠词词典

(六)离合词词典

(七)统计知识

第三章 汉字混淆集的构造方法

一、引言

二、相关工作

三、种子混淆集的生成

(一)概念与定义

(二)种子混淆集生成算法

四、基于混淆集图的自扩展与验证

(一)混淆集图的扩充规则

(二)自扩展与验证

五、基于模糊匹配的开放扩展与验证

(一)中文词串的相似度

(二)中文模糊匹配

(三)基于二元语法与混淆概率的验证方法

六、实验结果与分析

(一)基于图的扩展方法实验结果

(二)基于模糊匹配方法实验结果

(三)混淆集有效性验证实验

第四章 错字词对的获取

一、引言

二、相关工作

三、基于散串分析的错字词对的获取

(一)获取算法框架

(二)散串合并及统计

(三)相似词串聚类

(四)上下文语境统计

(五)统计结果验证

(六)错字词对获取

(七)实验结果及分析

四、基于模糊匹配的错字词对获取

五、基于混淆集的错字词对的获取

(一)获取框架图

(二)混淆词的生成

(三)错字词对的验证与生成

六、实验结果与分析

第五章 汉语文本错别字识别的模型与方法

一、引言

二、基于模糊分词的错别字识别

(一)基本思想

(二)模型求解

(三)词典结构

(四)精确匹配算法

(五)模糊匹配算法

(六)最短路径求解

(七)实验结果与分析

三、基于词的n-gram模型的错别字识别方法

(一)基于词的三元错别字识别

(二)基于词的二元错别字识别

(三)基于词的二元与三元的错别字识别方法

(四)当前文档统计信息的使用

(五)实验结果与分析

四、基于统计模型与冲突的错别字识别方法

(一)相关定义

(二)查错思想

(三)基于冲突与三元的错别字识别

(四)基于冲突与二元的错别字识别

(五)基于搭配冲突的错别字识别

(六)基于模式匹配的错别字识别

五、基于冲突验证的自动校对方法

(一)纠错建议的产生

(二)纠错建议的验证与生成

六、实验结果与分析

(一)实验结果

(二)查错与纠错实例

(三)实验分析

第六章 总结

参考文献

后记

累计评论(0条) 0个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部