万本电子书0元读

万本电子书0元读

顶部广告

中文文本自动分词和标注电子书

售       价:¥

纸质售价:¥11.80购买纸书

16人正在读 | 0人评论 6.2

作       者:刘开瑛

出  版  社:商务印书馆

出版时间:2000-01-01

字       数:12.3万

所属分类: 人文社科 > 社会科学 > 新闻传播/语言文字

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(0条)
  • 读书简介
  • 目录
  • 累计评论(0条)
商务印书馆在1997年提出了出版“语言与计算机”丛书的设想。这套丛书共包括《中文文本自动分词和标注》、《计算语言学基础》、《机器翻译》和《语料库语言学》等。作者承担了《中文文本自动分词和标注》的编纂任务。1998年5月中旬在京召了丛书样稿讨论会。关于“语言与计算机”丛书的定位问题,经过讨论,大家认为本套丛书应是有一定学术性、一定专业水平的读物,是大专院校语言文字应用、计算机应用等专业师生、语言文字和计算机工作者及大专以上文化程度读者的参考书。清华大学黄昌宁教授针对编辑这套丛书的意图,作了一步的深化和明确的论述,他指出:这套丛书实际上是一座桥梁,它把语言学和计算机科学紧密地联系在一起,一方面向语言学工作者介绍语言学知识在计算机领域中的应用,计算机研究和处理语言现象、语言信息的方法及成果;一方面把计算机处理各种语言信息过程中遇到的语言学方面的问题、难题告诉语言学工作者,把更多的语言学工作者吸引到这一领域来,使之为解决计算机处理中的语言学问题提供更多的、更有针对性的帮助,从而促计算语言学的发展。
目录展开

作者的话

第1章 自动分词是中文信息处理的基础工程

第一节 分词的重要性及其主要目标

第二节 自动分词中存在的主要问题

第2章 《信息处理用现代汉语分词规范》设计原则及规范内容

第一节 国标《分词规范》的简介与评述

第二节 《资讯处理用中文分词规范》的基本架构[B2]

第3章 信息处理用现代汉语分词词表的收词原则和方法

第一节 研制《分词词表》的原则和有关问题

第二节 分词词表的选词方法

第4章 中文文本歧义字段切分技术

第一节 歧义字段的类别和采集方法[C3,C4]

第二节 交集型歧义字段处理技术

第三节 多义型歧义字段分类及其处理技术

第5章 中国姓名和未登录新词语的自动辨识

第一节 中国姓名的自动识别技术

第二节 未登录新词语的自动识别技术

第6章 中国地名、组织机构名称和英译名的自动辨识

第一节 中国地名自动识别技术

第二节 中文机构名称的识别与分析

第三节 英语译名的自动辨识

第7章 汉语词性自动标注技术

第一节 词性标注的意义和主要难点

第二节 信息处理用现代汉语词类及标记集

第三节 语料库词类自动标注算法研究[E2,E6,E8]

第四节 基于规则的词性标注方法[E7,E17]

第8章 汉语词义自动标注技术

第一节 基于字义排歧的实验模型和评价

第二节 一种自组织的汉语词义排歧方法

第9章 汉语自动分词软件系统

第一节 串频统计和词形匹配相结合的分词系统

第二节 基于联想—回溯算法的汉语自动分词系统

附录1 信息处理用现代汉语分词规范

附录2 信息处理用现代汉语词类及标记集

参考文献

累计评论(0条) 0个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部