将理论与实践结合。本书以知识和广电大数据案例为主线,介绍在大数据技术中Hive的主要用法。 以任务为导向。本书从知识到实操,再到具体的项目,让读者明白如何利用所学知识来解决问题,通过实训和课后习题帮助读者巩固所学知识,从而使读者真正理解并应用所学知识。 注重启发式教学。本书内容围绕利用Hive处理大数据的流程展,不堆砌知识,着重于思路的启发与解决方案的实施。通过对从任务需求到实现这一完整工作流程的体验,读者将真正理解并掌握Hive大数据存储和处理技术。
售 价:¥
纸质售价:¥42.20购买纸书
温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印
为你推荐
内容提要
大数据技术精品系列教材专家委员会
前言
第1章 广电大数据用户画像需求分析
任务1.1 需求分析与架构
任务1.2 认识Hive
小结
课后习题
第2章 部署开发环境
任务2.1 安装部署Hadoop集群
任务2.2 安装部署Hive
任务2.3 使用Hive CLI
小结
课后习题
第3章 广电用户数据存储
任务3.1 创建业务数据表
任务3.2 将数据导入Hive表中
小结
实训 创建轮船乘客表并导入数据至表中
课后习题
第4章 广电用户基本数据简单查询
任务4.1 查询广电用户的用户编号及开户时间
任务4.2 查询指定用户状态的用户基本数据
任务4.3 统计用户基本数据表中品牌名称的种类数
任务4.4 统计不同用户等级名称的记录数
任务4.5 统计不同用户状态的记录数
任务4.6 统计指定用户数量范围的用户等级
任务4.7 统计用户数最多的3种用户状态
任务4.8 查询用户发生状态变更的时间及开户时间
小结
实训 查询电商货品订单数据
课后习题
第5章 广电用户账单与订单数据查询进阶
任务5.1 统计订单的消费类型
任务5.2 统计用户每年消费应付总额
任务5.3 统计用户每月消费应付总额
任务5.4 统计用户每月实际账单金额
任务5.5 查询用户宽带订单的地址数据
任务5.6 抽样统计用户订购产品情况
小结
实训
课后习题
第6章 广电用户收视行为数据查询优化
任务6.1 使用视图统计不同节目的用户观看人数
任务6.2 优化统计直播频道数
任务6.3 使用子查询统计节目类型为直播的频道Top10
小结
实训
课后习题
第7章 广电用户数据清洗及数据导出
任务7.1 清洗无效用户数据
任务7.2 清洗无效收视行为数据
任务7.3 清洗无效账单和订单数据
任务7.4 导出处理结果至Linux本地和HDFS
小结
实训
课后习题
第8章 广电用户数据存储与处理的程序开发
任务8.1 配置Hive远程服务
任务8.2 搭建Hive远程连接环境
任务8.3 编写程序实现广电数据的存储
任务8.4 编写程序实现广电数据的查询与处理
小结
实训
课后习题
买过这本书的人还买过
读了这本书的人还在读
同类图书排行榜