《Kaldi语音识别实战》陈果果等电子书txt下载、在线阅读、内容简介、评论读后感-当当读书

内容简介

Kaldi是目前语音识别领域，广受欢迎并流行的源工具包。Kaldi设计之初对通用性，可拓展性等一系列源代码层次的考量，大大降低了Kaldi作为语音识别工具包的门槛，同时拥有非常完整的语音识别系统训练脚本。本书通过对Kaldi已有训练脚本的梳理和引导，帮助读者快速搭建可用的语音识别系统。
【推荐语】
Kaldi的出现，被业内公认为极大地降低了语音识别技术学习与使用的门槛，成为广受欢迎的工具。本书由Kaldi的知名贡献者和社区技术骨干撰写，结合实际场景，系统全面地阐述了Kaldi的基础理论和应用知识，非常适合门，是珍贵的学习资料。本书特色： 1 以Kaldi脚本实例为线索，结合大量示例，降低学习门槛 2 详述各类实践技巧，举一反三 3 实际场景问题分析与解决方案 4兼述语音技术其他关键应用：语音唤醒（关键词识别）、说话人识别、语种识别
【作者】
陈果果清华大学本科学位，约翰霍普金斯大学博士学位，主要研究方向是语音识别及关键词检索，师从语音识别源工具Kaldi主要发者Daniel Povey，以及约翰霍普金斯大学语言语音处理中心教授Sanjeev Khudanpur。博士期间为Google发了Google的唤醒词Okay Google的原型，现在已经用到数以亿计的安卓设备及Google智能语音交互设备上。博士期间同时参与发语音识别源工具Kaldi，以及神经网络源工具CNTK。博士毕业以后联合创办KITT.AI，专注于语音识别及自然语言处理，公司于2017年被百度收，目前担任百度智能生活事业群组（SLG）主任架构师。都家宇本科毕业于大连理工大学，后于澳大利亚新南威尔士大学电子信息工程学院学习，取得信号处理专业硕士学位。研究生期间在导师 Julien Epps 指导下始行语音处理、情绪识别方向的研究。毕业后先后任职于清华大学语音技术实验室、百度语音技术部，以及阿里巴巴iDST、达摩院语音组，从事声学模型、解码器、语音唤醒等方面的研发工作。参与过与 Kaldi 相关的工作有：Kaldi nnet1神经网络框架中 lstm 作者；发起并推动全球规模的中文源数据集语音项目AISHELL-1、AISHELL-2，已服务于清华大学、北京大学、南洋理工大学、哥伦比亚大学等近200所国内外高校的科研项目。那兴宇本科和博士均毕业于北京理工大学，主要研究方向是语音识别和语音合成。先后任职于中国科学院声学研究所和阿里巴巴机器人，从事语音识别模型训练系统和语音交互系统的发。目前就职于微软，担任资深应用科学家，从事语音识别算法和技术架构的发及业务支持工作。2015年始在Kaldi源项目中贡献代码，参与了nnet3和chain模型的发工作，并维护其中若干示例及OpenSLR的中文语音识别模型。张俊博博士毕业于中国科学院声学研究所，师从颜永红研究员。在小米公司从零起主导构建了整套语音算法研究框架，包括语音识别、智能设备语音唤醒、声纹识别、语音增强、用于语音应用的神经网络部署，均达到了当时的先水平，并发表顶会论文若干篇，为后续的语音研发工作建立了基础。近期上线了用于外语学习的发音质量评测引擎，并给Kaldi贡献了发音良好度评分的代码。

展开