欢迎光临当当，请登录免费注册

男频| 女频

当当云阅读

当当云阅读文字

万本电子书0元读

万本电子书0元读

搜索

购物车

图书分类

小说: 侦探/悬疑/推理; 情感/都市; 科幻/魔幻; 作品集; 外国小说

文艺: 文学; 青春文学; 传记; 艺术; 动漫/幽默

历史文化: 哲学/宗教; 历史; 政治/军事; 文化; 社会科学; 古籍; 法律

经济/管理: 管理; 经济; 投资理财; 市场/营销; 商务沟通; 中国经济; 国际经济

心理/励志: 心理学; 女性心理学; 儿童心理学; 情绪管理; 职场/人际交往; 人生哲学

生活: 两性关系; 亲子/家教; 旅游/地图; 烹饪/美食; 保健/养生

童书: 儿童文学; 启蒙读物; 少儿英语; 动漫/图画书

科技/教育: 科普读物; 计算机/网络; 自然科学; 中小学教辅; 考试; 外语; 工具书

原版书: 外文原版书; 港台圖書; 小语种

我要充值赠送20%

顶部广告

当当云阅读 > 科技 > 计算机/网络 > 程序设计 > Hadoop与大数据挖掘

Hadoop与大数据挖掘

| | 手机阅读

扫描下载当当云阅读App

Hadoop与大数据挖掘电子书

售价：¥

纸质售价：¥49.70购买纸书

10人正在读 | 0人评论

6.5

作者：张良均

出版社：机械工业出版社

出版时间：2017-05-01

字数：6.2万

所属分类：科技 > 计算机/网络 > 程序设计

温馨提示：数字商品不支持退换货，不提供源文件，不支持导出打印

为你推荐

读书简介
目录
累计评论(1条)

读书简介
目录
累计评论(1条)

这是一本适合教学和零基础自学的Hadoop与大数据挖掘的教程，即便你完全没有Hadoop编程基础和大数据挖掘基础，根据本书中的理论知识和上机实践，也能迅速掌握如何使用Hadoop行大数据挖掘。全书主要分为两篇：基础篇（1-7章），首先从宏观上介绍了大数据相关概念和技术，然后逐一对Hadoop、Hive、HBase、Pig、Spark、Oozie等一系列大数据技术的概念、原理、架构，以及企业应用方法行了详细介绍，同时配有大量的案例。掌握了这些内容，就具备了大数据技术的基础；挖掘实战篇（第8章），主要是一个企业级大数据应用项目——电子商务智能推荐系统。通过分析应用背景、构建系统，使读者了解针对系统的每一层应用使用什么大数据技术来解决问题。涉及的流程有数据采集、数据预处理、模型构建等，在每一个流程中会行大数据相关技术实践，运用实际数据来行分析，使读者切身感受到利用大数据技术解决问题的魅力。<br/>

目录展开

前言

为什么要写这本书

本书特色

第一篇基础篇

第1章浅谈大数据

1.1 大数据概述

1.2 大数据平台

1.3 本章小结

第2章大数据存储与运算利器—Hadoop

2.1 Hadoop概述

2.1.1 Hadoop简介

2.2 Hadoop配置及IDE配置

2.2.1 准备工作

2.3 Hadoop集群命令

2.3.1 HDFS常用命令hdfs dfs

2.3.2 动手实践：hdfs dfs命令实战

2.3.3 MapReduce常用命令mapred job

2.3.4 YARN常用命令yarn jar

2.3.5 动手实践：运行MapReduce任务

2.4 Hadoop编程开发

2.4.1 HDFS Java API操作

2.5 K-Means算法原理及Hadoop MapReduce实现

2.5.1 K-Means算法原理

2.6 TF-IDF算法原理及Hadoop MapReduce实现

2.6.1 TF-IDF算法原理

2.6.2 Hadoop TF-IDF编程思路

2.7 本章小结

第3章大数据查询—Hive

3.1 Hive概述

3.1.1 Hive体系架构

3.2 HiveQL语句

3.2.1 数据库操作

3.2.2 Hive表定义

3.3 动手实践：基于Hive的学生信息查询

3.4 基于Hive的航空公司客户价值数据预处理及分析

3.4.1 背景与挖掘目标

3.5 本章小结

第4章大数据快速读写—HBase

4.1 HBase概述

4.2 配置HBase集群

4.2.1 Zookeeper简介及配置

4.3 HBase原理与架构组件

4.3.1 HBase架构与组件

4.4 HBase Shell操作

4.4.1 HBase常用Shell命令

4.5 Java API&MapReduce与HBase交互

4.5.1 搭建HBase开发环境

4.6 基于HBase的冠字号查询系统

4.6.1 案例背景

4.7 本章小结

第5章大数据处理—Pig

5.1 Pig概述

5.1.1 Pig Latin简介

5.2 配置运行Pig

5.2.1 Pig配置

5.2.2 Pig运行模式

5.3 常用Pig Latin操作

5.3.1 数据加载

5.4 综合实践

5.4.1 动手实践：访问统计信息数据处理

5.4.2 动手实践：股票交易数据处理

5.5 本章小结

第6章大数据快速运算与挖掘—Spark

6.1 Spark概述

6.2 Spark安装集群

6.2.1 3种运行模式

6.2.2 动手实践：配置Spark独立集群

6.3 Spark架构与核心原理

6.3.1 Spark架构

6.4 Spark编程技巧

6.4.1 Scala基础

6.4.2 Spark基础编程

6.5 如何学习Spark MLlib

6.5.1 确定应用

6.5.2 ALS算法直观描述

6.5.3 编程实现

6.5.4 问题解决及模型调优

6.6 动手实践：基于Spark ALS电影推荐系统

6.6.1 动手实践：生成算法包

6.6.2 动手实践：完善推荐系统

6.7 本章小结

第7章大数据工作流—Oozie

7.1 Oozie简介

7.2 编译配置并运行Oozie

7.2.1 动手实践：编译Oozie

7.3 Oozie WorkFlow实践

7.3.1 定义及提交工作流

7.4 Oozie Coordinator实践

7.4.1 动手实践：基于时间调度

7.5 本章小结

第二篇挖掘实战篇

第8章法律服务大数据智能推荐

8.1 背景

8.2 目标

8.3 系统架构及流程

8.4 分析过程及实现

8.4.1 数据传输

8.5 构建法律服务大数据智能推荐系统

8.5.1 动手实践：构建推荐系统JavaEE

8.6 本章小结

累计评论(1条) 1个书友正在讨论这本书 发表评论

发表评论

发表评论，分享你的想法吧！

当当云阅读

买过这本书的人还买过

读了这本书的人还在读

支持设备

同类图书排行榜

01

图解Skill:AI提效实战指南

图解Skill:AI提效实战指南￥39.90

宝玉著

￥39.90

02

Python从入门到全栈开发

Python从入门到全栈开发￥70.00

钱超

￥70.00

03

大模型应用开发动手做AI Agent

大模型应用开发动手做AI Agent ￥57.47

黄佳著

￥57.47

04

Python编程:从入门到实践(第3版)

Python编程:从入门到实践(第3版) ￥54.90

[美]埃里克·马瑟斯(Eric Matthes) 著

￥54.90

05

Python网络爬虫与数据分析从入门到实践

Python网络爬虫与数据分析从入门到实践￥55.86

马国俊

￥55.86

06

程序员必会的40种算法

程序员必会的40种算法￥59.40

(加)伊姆兰·艾哈迈德(Imran Ahmad)

￥59.40

07

Python完全自学教程

Python完全自学教程￥57.54

明日科技编著

￥57.54

08

懒人“养虾”攻略:OpenClaw+豆包+扣子+飞书落地实战指南

懒人“养虾”攻略:OpenClaw+豆包+扣子+飞书落地实战指南￥45.00

林园编著

￥45.00

09

量化投资：策略与技术

量化投资：策略与技术￥22.00

丁鹏

￥22.00

10

Python+Office:轻松实现Python办公自动化

Python+Office:轻松实现Python办公自动化￥55.30

王国平

￥55.30

更多同类图书 >

电子书排行榜

新书排行榜

5元封顶

关注我们

最受欢迎的阅读产品

关注我们：
- 新浪微博
- 官方微信
关于我们

欢迎反馈宝贵意见给我们

客服书吧：当当云阅读问答

意见反馈

Copyright (C) 当当网 2004-2022, All Rights Reserved

京ICP备17043473号-1 | 出版物经营许可证新出发京批字第直0673号

当当网收录的免费小说作品、频道内容、书友评论、用户上传文字、图片等其他一切内容及在当当网所做之广告均属用户个人行为，与当当网无关。

当当云阅读

二维码

0元畅读数万本精选电子书