万本电子书0元读

万本电子书0元读

顶部广告

Hive大数据存储与处理电子书

将理论与实践结合。本书以知识和广电大数据案例为主线,介绍在大数据技术中Hive的主要用法。 以任务为导向。本书从知识到实操,再到具体的项目,让读者明白如何利用所学知识来解决问题,通过实训和课后习题帮助读者巩固所学知识,从而使读者真正理解并应用所学知识。 注重启发式教学。本书内容围绕利用Hive处理大数据的流程展,不堆砌知识,着重于思路的启发与解决方案的实施。通过对从任务需求到实现这一完整工作流程的体验,读者将真正理解并掌握Hive大数据存储和处理技术。

售       价:¥

纸质售价:¥42.20购买纸书

6人正在读 | 0人评论 6.4

作       者:何煌,张良均 主编

出  版  社:人民邮电出版社有限公司

出版时间:2024-03-01

字       数:14.7万

所属分类: 科技 > 计算机/网络 > 软件系统

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(0条)
  • 读书简介
  • 目录
  • 累计评论(0条)
本书以广电大数据案例为主线,系统介绍数据仓库Hive存储和初步处理方法的相关知识。本书条理清楚、重突出,内容循序渐、由浅深。本书共8章,包括广电大数据用户画像需求分析、部署发环境、广电用户数据存储、广电用户基本数据简单查询、广电用户账单与订单数据查询阶、广电用户收视行为数据查询优化、广电用户数据清洗及数据导出,以及广电用户数据存储与处理的程序发。本书大部分章包含实训和课后习题,通过练习和操作实践,帮助读者巩固所学的内容。 本书可以作为高等院校数据科学或大数据相关专业的教材,也可以作为大数据爱好者的自学用书。<br/>【推荐语】<br/>将理论与实践结合。本书以知识和广电大数据案例为主线,介绍在大数据技术中Hive的主要用法。 以任务为导向。本书从知识到实操,再到具体的项目,让读者明白如何利用所学知识来解决问题,通过实训和课后习题帮助读者巩固所学知识,从而使读者真正理解并应用所学知识。 注重启发式教学。本书内容围绕利用Hive处理大数据的流程展,不堆砌知识,着重于思路的启发与解决方案的实施。通过对从任务需求到实现这一完整工作流程的体验,读者将真正理解并掌握Hive大数据存储和处理技术。<br/>【作者】<br/>何煌,华中科技大学院软件工程硕士,“双师型”专业讲师,PMP项目管理师,大数据高级分析师。曾在企业从事多年系统研发工作,目前在广东创新科技职业学院信工学院担任软件教研室主任,负责软件和大数据专业教学研究工作。先后主编《计算机应用基础》、《Java程序设计教程》《创新创业基础教程》、《计算机应用基础实用教程》、《信息技术基础》等多本教材编撰工作。<br/>
目录展开

内容提要

大数据技术精品系列教材专家委员会

前言

第1章 广电大数据用户画像需求分析

任务1.1 需求分析与架构

任务1.2 认识Hive

小结

课后习题

第2章 部署开发环境

任务2.1 安装部署Hadoop集群

任务2.2 安装部署Hive

任务2.3 使用Hive CLI

小结

课后习题

第3章 广电用户数据存储

任务3.1 创建业务数据表

任务3.2 将数据导入Hive表中

小结

实训 创建轮船乘客表并导入数据至表中

课后习题

第4章 广电用户基本数据简单查询

任务4.1 查询广电用户的用户编号及开户时间

任务4.2 查询指定用户状态的用户基本数据

任务4.3 统计用户基本数据表中品牌名称的种类数

任务4.4 统计不同用户等级名称的记录数

任务4.5 统计不同用户状态的记录数

任务4.6 统计指定用户数量范围的用户等级

任务4.7 统计用户数最多的3种用户状态

任务4.8 查询用户发生状态变更的时间及开户时间

小结

实训 查询电商货品订单数据

课后习题

第5章 广电用户账单与订单数据查询进阶

任务5.1 统计订单的消费类型

任务5.2 统计用户每年消费应付总额

任务5.3 统计用户每月消费应付总额

任务5.4 统计用户每月实际账单金额

任务5.5 查询用户宽带订单的地址数据

任务5.6 抽样统计用户订购产品情况

小结

实训

课后习题

第6章 广电用户收视行为数据查询优化

任务6.1 使用视图统计不同节目的用户观看人数

任务6.2 优化统计直播频道数

任务6.3 使用子查询统计节目类型为直播的频道Top10

小结

实训

课后习题

第7章 广电用户数据清洗及数据导出

任务7.1 清洗无效用户数据

任务7.2 清洗无效收视行为数据

任务7.3 清洗无效账单和订单数据

任务7.4 导出处理结果至Linux本地和HDFS

小结

实训

课后习题

第8章 广电用户数据存储与处理的程序开发

任务8.1 配置Hive远程服务

任务8.2 搭建Hive远程连接环境

任务8.3 编写程序实现广电数据的存储

任务8.4 编写程序实现广电数据的查询与处理

小结

实训

课后习题

累计评论(0条) 0个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部