本书在介绍大数据发展背景、特及主要技术层面的基础上,对大数据的数据采集、数据存储、常见计算模式和典型系统工具行了分析介绍。本书同时对各种典型系统工具行了讲解,包括大数据查询分析计算及典型工具(HBase、Hive)、批处理计算及典型工具(MapReduce、Spark)、流式计算及典型工具(Storm、Apex、Flink)、事件流及典型工具(Druid)等。 本书提供了大量的实例和源代码供读者参考,指导读者快速、无障碍地了解和掌握常见大数据分析工具的使用。本书适合作为计算机及相关专业的教学用书,也可以作为大数据初学者的自学教材和参考手册。 【推荐语】 1.内容丰富多样,对比学习 考虑当前大数据发展处于起步并逐步赶超先,其应用领域丰富广泛,本书除了介绍典型源大数据处理框架Apache Hadoop框架之外,还介绍了批处理计算Spark、流式计算及典型工具(Storm、Apex、Flink)和事件流及典型工具(Druid)等,让读者了解不同类型工具系统的特,并配以丰富简单易上手的实例,让读者能够切实体会和掌握各种类型工具的特和应用。 2.轻量级理论,重在培养动手实践能力 为了让读者能够快速掌握技能并保证理论能够适应实践要求,本书本着轻量级理论原则,给出丰富的实例、详实的实验操作步骤和使用普通读者也易于配置的实验环境,让读者能够快速上手,在做中学。 3.有效结合实际应用 除了各章节给出的配套实例外,本书在*后还给出电商领域的大数据分析综合实例,以实际行业应用案例说明大数据处理和计算工具的使用以及一步阐述大数据行业应用的重大意义。 【作者】 陈志德,2005年至今在福建师范大学数学与计算机科学学院工作,任计算机系副主任。主要研究方向包括网络与信息安全、物联网与移动计算等,指导硕士研究生20多人,指导研究生的学位论文曾获校优秀硕士论文一等奖。近年来主持福建省自然科学基金、福建省科技厅K类基金等项目10项,参与国家自然科学基金和省科技厅高校产学合作科技重大项目课题各1项。出版学术专著2本,教材1本。在Journal of Computer and System Sciences、Concurrency and Computation: Practice and Experience等期刊发表学术论文40多篇,申请专利10多项,软件著作权10多项。担任CTCIS和NSS等国内和国际学术会议的程序委员会委员。