读者对象: 1.人工智能领域的技术工程师,尤其是从事图像识别和NLP的技术工程师; 2.专门研究OCR的专业人士或院校师生等。 (1)作者阵容豪华,由阿里巴巴本地生活研究院算法团队技术专家领衔,海康威视、趣头条等企业的算法专家以及知名场景文本算法作者共同撰写; (2)行业应用和学术理论相结合,既有来自于阿里巴巴本地生活实际应用场景的一线实践经验和方法,又有来自学术前沿的新理论;
售 价:¥
纸质售价:¥64.20购买纸书
温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印
为你推荐
推荐序
前言
第1章 绪论
1.1 人工智能大潮中的OCR发展史
1.2 文字检测
1.3 文字识别
1.4 产业应用现状
1.5 本章小结
1.6 参考文献
第2章 图像预处理
2.1 二值化
2.2 平滑去噪
2.3 倾斜角检测和校正
2.4 实战
2.5 参考文献
第3章 传统机器学习方法绪论
3.1 特征提取方法
3.2 分类方法模型
3.3 实战:身份证号码的识别
3.4 本章小结
3.5 参考文献
第4章 深度学习基础知识
4.1 单层神经网络
4.2 双层神经网络
4.3 深度学习
4.4 训练网络技巧
4.5 实战
4.6 参考文献
第5章 数据生成
5.1 背景介绍
5.2 传统单字OCR数据生成
5.3 基于深度学习的OCR数据生成
5.4 通过GAN的技术生成数据
5.5 图像增广
5.6 常用的开源数据集
5.7 ICDAR的任务和数据集
5.8 本章小结
5.9 参考文献
第6章 深度学习高级方法
6.1 图像分类模型
6.2 循环神经网络
6.3 Seq2Seq
6.4 CTC Loss
6.5 Attention
6.6 本章小结
6.7 参考文献
第7章 文字检测
7.1 研究意义
7.2 目标检测方法
7.3 文本检测方法
7.4 本章小结
7.5 参考文献
第8章 字符识别
8.1 任务概览
8.2 数据集说明
8.3 评测指标
8.4 主流算法介绍
8.5 CRNN模型实战
8.6 本章小结
8.7 参考文献
第9章 OCR后处理方法
9.1 文本纠错
9.2 文本结构化
9.3 本章小结
9.4 参考文献
第10章 版面分析
10.1 版面分析详解
10.2 复杂版面识别
10.3 文档恢复
10.4 本章小结
10.5 参考文献
买过这本书的人还买过
读了这本书的人还在读
同类图书排行榜