当当云阅读 > 科技 > 计算机/网络 > 软件系统 > 深度实践OCR:基于深度学习的文字识别

深度实践OCR:基于深度学习的文字识别电子书

读者对象： 1.人工智能领域的技术工程师，尤其是从事图像识别和NLP的技术工程师； 2.专门研究OCR的专业人士或院校师生等。（1）作者阵容豪华，由阿里巴巴本地生活研究院算法团队技术专家领衔，海康威视、趣头条等企业的算法专家以及知名场景文本算法作者共同撰写；（2）行业应用和学术理论相结合，既有来自于阿里巴巴本地生活实际应用场景的一线实践经验和方法，又有来自学术前沿的新理论；

售价：¥

纸质售价：¥64.20购买纸书

44人正在读 | 1人评论

6.7

作者：刘树春

出版社：机械工业出版社

出版时间：2020-04-01

字数：23.1万

所属分类：科技 > 计算机/网络 > 软件系统

温馨提示：数字商品不支持退换货，不提供源文件，不支持导出打印

为你推荐

读书简介
目录
累计评论(1条)

读书简介
目录
累计评论(1条)

这是一部融合了企业界先工程实践经验和学术界前沿技术和思想的ORC著作。本书由阿里巴巴本地生活研究院算法团队技术专家领衔，从组件、算法、实现、工程应用等维度系统讲解基于深度学习的OCR技术的原理和落地。书中一步步剖析了算法背后的数学原理，提供大量简洁的代码实现，帮助读者从零基础始构建OCR算法。全书共10章：第1章从宏观角度介绍了ORC技术的发展历程、概念和产业应用；第2章讲解了OCR的图像预处理方法；第3~4章介绍了传统机器学习方法和深度学习的相关基础知识；第5章讲解了基于传统方法和深度学习方法的OCR的数据生成；第6章讲解了与OCR相关的一些高级深度学习方法，方便读者理解后续的检测和识别部分；第7章讲解了文字的检测技术，从通用的目标检测到文字的检测，一步步加深读者对文字检测问题的认识；第8章讨论了文字识别的相关技术，定位到文字的位置之后，需要对文字的内容行一步的解析；第9章介绍了一些OCR后处理的方法；第10章介绍了一些版面分析方法。 【推荐语】 读者对象： 1.人工智能领域的技术工程师，尤其是从事图像识别和NLP的技术工程师； 2.专门研究OCR的专业人士或院校师生等。（1）作者阵容豪华，由阿里巴巴本地生活研究院算法团队技术专家领衔，海康威视、趣头条等企业的算法专家以及知名场景文本算法作者共同撰写；（2）行业应用和学术理论相结合，既有来自于阿里巴巴本地生活实际应用场景的一线实践经验和方法，又有来自学术前沿的新理论；（3）本书得到了阿里巴巴本地生活、达摩院、旷视科技、字节跳动、狗尾草等知名AI企业或机构的知名AI技术专家的联袂推荐；（4）本书不仅讲解了OCR的组件、方法、算法、实现，而且还介绍了学术界*前沿的文字检测和文字识别方法。 【作者】 刘树春阿里巴巴本地生活研究院算法专家，前复旦七牛云联合实验室OCR算法负责人，在OCR相关技术的落地和实现方面有深的研究和丰富的实践经验，在菜单识别、车牌检测识别、卡证识别、商业广告文字检测和识别、票据类识别等应用场景中积累了丰富的经验。曾经组队参加COCO竞赛、ICDAR刷榜等活动，并发表多篇论文。贺盼佛罗里达大学在读博士，担任 CVPR、ICCV、ECCV等10多家国际顶会审稿人或程序委员，在场景文本领域发表过多篇国际会议论文 (DTRN、CTPN、SSTD等)。曾经在中科院先技术研究院、港中文、旷视美国研究院等做过相关研究工作，对场景文本有深刻的认识，并且对场景文本学术前沿有很强的感知力。马建奇著名的RRPN算法的作者，发表过多篇国际会议论文，曾经在旷视研究院做过检测相关的工作，在上海高等研究院做过文字检测相关的工作，曾经组队参加过ICDAR 17 MLT比赛，获得前三名。曾获Facebook研究实习机会。目前即将始修读博士学位，正在做文字识别相关的工作，对于OCR的问题有独到的见解。王佳军阿里巴巴本地生活研究院高级算法专家，负责本地生活研究院图像算法团队的管理、研发等工作，曾经在滴滴研究院做相关算法的研究。业余时间担任深度学习框架MXNet的技术专家，对实际算法的落地优化等有非常深的耕耘，具有很强的OCR相关项目的落地能力。谢雨飞趣头条算法工程师，曾在七牛云做OCR、NLP相关算法的研究工作，发表过多篇国际论文。陈明曦纽约大学硕士研究生，曾在七牛云从事OCR相关工作，发表相关论文数篇。

目录展开