万本电子书0元读

万本电子书0元读

顶部广告

数据科学与大数据分析 数据的发现 分析 可视化与表示电子书 租阅

数据科学和大数据分析是指利用数据的力量来发现新的见解。本书涵盖了数据科学涉及的行为广度以及所使用的方法和工具。本书内容侧重于任何行业和技术环境中都会用到的概念、原理和实际应用,并通过源软件来分析案例,以帮助读者更好地理解。本书将帮助您:成为数据科学团队中的一名贡献者;部署结构化的生命周期方法来分析数据问题;应用合适的分析技术和工具来分析大数据;学习如何用数据来讲一个动人的故事,以推动商业行为;备考EMC Proven Professional数据科学家认证。EEMC专家认证是IT行业领先的教育和认证项目,涵盖了信息存储技术、虚拟化技术、云计算、数据科学与大数据分析等领域。通过认证是一种很好的自我投资方式,同时也是对自己专业知识的正式验证。本书可以作为准备数据科学专员(EMCDSA)认证的资料。在驱动企业和服务提供商转型其运营方式以及以服务形式交付IT(IT as a service)方面,EMC是全球领导者。而该转型的基础则是云计算。通过创新的产品和服务,EMC加速了云计算的展,旨在帮助IT部门以一种更为敏捷、可信和具备成本效益的方式来存储、管理、保护和分析它们有价值的资产——信息。关于EMC的更多信息,请访问www.EMC.com。

售       价:¥

纸质售价:¥47.60购买纸书

402人正在读 | 4人评论 6.2

作       者:[美]EMC教育服务团队(EMC Education Services)

出  版  社:人民邮电出版社

出版时间:2016-07-01

字       数:44.5万

所属分类: 科技 > 计算机/网络 > 计算机理论与教程

温馨提示:此类商品不支持退换货,不支持下载打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(4条)
  • 读书简介
  • 目录
  • 累计评论(4条)
数据科学与大数据分析在当前是炙手可热的概念,关注的是如何通过分析海量数据来洞悉隐藏于数据背后的见解。本书是数据科学领域为数不多的实用性技术图书,它通过详细剖析数据分析生命周期的各个阶段来讲解用于发现、分析、可视化、表示数据的相关方法和技术。《数据科学与大数据分析——数据的发现 分析 可视化与表示》总共分为12章,主要内容包括大数据分析的简单介绍,数据分析生命周期的各个阶段,使用R语言行基本的数据分析,以及高级的分析理论和方法,主要涉及数据的聚类、关联规则、回归、分类、时间序列分析、文本分析等方法。此外,本书还涵盖了用来行高级数据分析所使用的技术和工具,比如MapReduce和Hadoop、数据库内分析等。《数据科学与大数据分析——数据的发现 分析 可视化与表示》内容详细,示例丰富,侧重于理论与练习的结合,因此比较适合对大数据分析、数据科学感兴趣的人员阅读,有志于成为数据科学家的读者也可以从本书中获益。 数据科学与大数据分析在当前是炙手可热的概念,关注的是如何通过分析海量数据来洞悉隐藏于数据背后的见解。本书是数据科学领域为数不多的实用性技术图书,它通过详细剖析数据分析生命周期的各个阶段来讲解用于发现、分析、可视化、表示数据的相关方法和技术。《数据科学与大数据分析——数据的发现 分析 可视化与表示》总共分为12章,主要内容包括大数据分析的简单介绍,数据分析生命周期的各个阶段,使用R语言行基本的数据分析,以及高级的分析理论和方法,主要涉及数据的聚类、关联规则、回归、分类、时间序列分析、文本分析等方法。此外,本书还涵盖了用来行高级数据分析所使用的技术和工具,比如MapReduce和Hadoop、数据库内分析等。《数据科学与大数据分析——数据的发现 分析 可视化与表示》内容详细,示例丰富,侧重于理论与练习的结合,因此比较适合对大数据分析、数据科学感兴趣的人员阅读,有志于成为数据科学家的读者也可以从本书中获益。
【推荐语】
数据科学和大数据分析是指利用数据的力量来发现新的见解。本书涵盖了数据科学涉及的行为广度以及所使用的方法和工具。本书内容侧重于任何行业和技术环境中都会用到的概念、原理和实际应用,并通过源软件来分析案例,以帮助读者更好地理解。本书将帮助您:成为数据科学团队中的一名贡献者;部署结构化的生命周期方法来分析数据问题;应用合适的分析技术和工具来分析大数据;学习如何用数据来讲一个动人的故事,以推动商业行为;备考EMC Proven Professional数据科学家认证。EEMC专家认证是IT行业领先的教育和认证项目,涵盖了信息存储技术、虚拟化技术、云计算、数据科学与大数据分析等领域。通过认证是一种很好的自我投资方式,同时也是对自己专业知识的正式验证。本书可以作为准备数据科学专员(EMCDSA)认证的资料。在驱动企业和服务提供商转型其运营方式以及以服务形式交付IT(IT as a service)方面,EMC是全球领导者。而该转型的基础则是云计算。通过创新的产品和服务,EMC加速了云计算的展,旨在帮助IT部门以一种更为敏捷、可信和具备成本效益的方式来存储、管理、保护和分析它们有价值的资产——信息。关于EMC的更多信息,请访问www.EMC.com。
【作者】
作者简介David Dietrich是EMC Education Services的数据科学教育团队的负责人,他领导着大数据分析和数据科学相关的课程、策略和课程发工作。他参与编写了EMC数据科学课程的首门课程,以及两门额外的EMC课程(以向领导和管理人员讲授大数据和数据科学为主),而且还是本书的作者兼编辑。他在数据科学、数据隐私和云计算领域已经申请了14项专利。David曾指导若干所大学设数据分析相关的课程项目,而且还经常在会议和行业活动中发表演讲。他还是波士顿地区几所大学的客座讲师。他的作品已被精选到包括福布斯杂志、哈佛商业评论以及由美国马萨诸塞州长Deval Patrick委托起草的2014 马萨诸塞大数据报告等内在的主流出版物中。David在分析和技术领域已经浸淫了近20年。在其职业生涯中,他曾在多家财富500强公司工作过,出任多个与数据分析相关的职位,其中包括管理分析和运营团队,提供分析咨询服务,管理用于规范美国银行业的分析软件产品线,以及发软件即服务(Software-as-a-Service)和Bl即服务(Bl-as-a-Service)的产品。此外,David还曾与美联储一起合作发用于监控房产抵押贷款的预测模型。Barry Heller是EMC Education Services的一名咨询技术教育顾问。Barry是大数据和数据科学新兴技术领域的课程发人员和课程顾问。在此之前,Barry曾是一名顾问研究科学家,在EMC全面客户体验(Total Customer Experience)部门内发起并领导了许多与数据分析相关的项目。在其EMC职业生涯的早期,他负责管理统计工程团队,并负责企业资源企划(ERP)实施中的数据仓库工作。在加盟EMC之前,Barry在医疗诊断和技术公司担任过可靠性工程功能(Reliability Engineering Functions)的管理和分析角色。在此期间,他将其数量分析技能应用到了客户服务、工程、制造、销售/营销、金融和法律领域内的无数商业应用中。他强调与客户管理人员深互动的重要性,他的许多成功案例不仅源自对分析的技术细节的关注,也源自针对分析结果会做出的决策的关注。Barry拥有罗彻斯特理工学院计算数学专业的本科学位,以及纽约州立大学新帕尔兹分校数学专业的硕士学位。Beibei Yang是EMC Education Services的一名技术教育顾问,在EMC负责发若干与数据科学和大数据分析相关的公课程。Bebei在IT行业有7年的从业经验。在加盟EMC之前,她在一家财富500强公司先后担任过软件工程师、系统管理员和网络管理员等职位,并引了多种提升效率和鼓励合作的新技术。Beibei曾
目录展开

内容提要

主要贡献人

致谢

译者简介

主审人员简介

前言

第1章 大数据分析介绍

1.1 大数据概述

1.2 分析的实践状态

1.3 新的大数据生态系统中的关键角色

1.4 大数据分析案例

1.5 总结

1.6 练习

参考书目

第2章 数据分析生命周期

2.1 数据分析生命周期概述

2.2 第1阶段:发现

2.3 第2阶段:数据准备

2.4 第3阶段:模型规划

2.5 第4阶段:模型建立

2.6 第5阶段:沟通结果

2.7 第6阶段:实施

2.8 案例研究:全球创新网络和分析(GINA)

2.9 总结

2.10 练习

参考书目

第3章 使用R进行基本数据分析

3.1 R简介

3.2 探索性数据分析

3.3 用于评估的统计方法

3.4 总结

3.5 练习

参考文献

第4章 高级分析理论与方法:聚类

4.1 聚类概述

4.2 k均值聚类

4.3 其他算法

4.4 总结

4.5 练习

参考书目

第5章 高级分析理论与方法:关联规则

5.1 概述

5.2 Apriori算法

5.3 评估候选规则

5.4 关联规则的应用

5.5 杂货店交易示例

5.6 验证和测试

5.7 诊断

5.8 总结

5.9 练习

参考书目

第6章 高级分析理论与方法:回归

6.1 线性回归

6.2 逻辑回归

6.3 选择理由和注意事项

6.4 其他回归模型

6.5 总结

6.6 练习

第7章 高级分析理论与方法:分类

7.1 决策树

7.2 朴素贝叶斯

7.3 分类器诊断

7.4 其他分类方法

7.5 总结

7.6 练习

参考书目

第8章 高级分析理论与方法:时间序列分析

8.1 时间序列分析概述

8.2 ARIMA模型

8.3 其他方法

8.4 总结

8.5 练习

第9章 高级分析理论与方法:文本分析

9.1 文本分析步骤

9.2 一个文本分析的示例

9.3 收集原始数据

9.4 表示文本

9.5 词频-逆文档频率(TFIDF)

9.6 通过主题来分类文件

9.7 情感分析

9.8 获得洞察力

9.9 总结

9.10 练习

参考书目

第10章 高级分析技术与工具:MapReduce和Hadoop

10.1 非结构化数据分析

10.2 Hadoop生态系统

10.3 NoSQL

10.4 总结

10.5 练习

参考书目

第11章 高级分析技术与工具:数据库内分析

11.1 SQL基本要素

11.2 数据库内的文本分析

11.3 高级SQL技术

11.4 总结

11.5 练习

参考书目

第12章 结尾

12.1 沟通和实施一个分析项目

12.2 创建最终可交付成果

12.3 数据可视化基础

12.4 总结

12.5 练习

12.6 参考文献与扩展阅读

参考书目

累计评论(4条) 4个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部