万本电子书0元读

万本电子书0元读

顶部广告

图灵程序设计丛书:数据科学从入门到实战(套装全8册)(套装共8册)电子书

  大数据时代,人们越来越意识到数据在工作和生活中的重要性,数据科学家应运而生。面对媒体天花乱坠的炒作,怎么才能拨云见日,真正掌握这门跨学科利用数据的学问呢?这本脱胎于常春藤名校哥伦比亚大学“数据科学导论”课程的实战手册能够给你一个满意的回答。   《数据科学实战》作者Rachel Schutt曾在谷歌研究院工作多年,现为美国新闻集团数据科学高 级副总裁。她在哥伦比亚大学任教期间,广泛邀请了谷歌、微软、eBay及一些创业公司的数据科学家为学生授课,打破了所谓大学里教不出数据科学家的神话。这些讲座涵盖了上述公司及业界使用的全新算法、方法和模型。本书就是在这些一手资料基础上汇编而成的,它不仅可供不具备相关领域知识的初学者真正了解数据科学,而且也是熟悉线性代数、概率论、统计学、机器学习等主题的人士开阔视野、提升实战技能的指南。

售       价:¥

19人正在读 | 1人评论 6.2

作       者:[美]舒特(Rachel Schutt),[美]奥尼尔(Cathy O'Neil),[荷]詹森斯(Jeroen Janssens),[美] 唐尼(Allen B· Downey)等

出  版  社:人民邮电出版社有限公司

出版时间:2021-01-01

字       数:182.3万

所属分类: 科技 > 计算机/网络 > 程序设计

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(1条)
  • 读书简介
  • 目录
  • 累计评论(1条)
  《数据科学实战》脱胎于哥伦比亚大学“数据科学导论”课程的教学讲义,它界定了数据科学的研究范畴,是一本注重人文精神,多角度、全方位、深入介绍数据科学的实用指南,堪称大数据时代的实战宝典。本书旨在让读者能够举一反三地解决重要问题,内容包括:数据科学及工作流程、统计模型与机器学习算法、信息提取与统计变量创建、数据可视化与社交网络、预测模型与因果分析、数据预处理与工程方法。另外,本书还将带领读者展望数据科学未来的发展。 本书集实用性和先进性于一身,为数据分析人员使用命令行这个灵活的工具提供了重要参考。作者讲解了众多实用的命令行工具,以及如何使用它们高效地获取、清洗、探索和建模数据。无论你使用Windows、OS X,还是Linux,都可以安装包含80多个命令行工具的“数据科学工具箱”,迅速建立自己的数据分析环境。无论你是否已经习惯于使用Python或R语言,都能够通过本书体会到使用命令行的快捷、灵活与伸缩自如。 《统计思维:程序员数学之概率统计(第 2版)》是一本以全新视角讲解概率统计的入门图书。抛开经典的数学分析,Downey手把手教你用编程理解统计学。 具体说来,《统计思维:程序员数学之概率统计(第 2版)》通过一个案例研究,介绍探索性数据分析的全过程:从收集数据、生成统计信息,到发现模式、验证假设。同时研究分布、概率规则、可视化和其他多种工具及概念。此外,第 2版新增了回归、时间序列分析、生存分析和分析方法等章节。 本书主要内容包括:数据清洗在数据科学领域中的重要作用,文件格式、数据类型、字符编码的基本概念,组织和处理数据的电子表格与文本编辑器,各种格式数据的转换方法,解析和清洗网页上的HTML 文件的三种策略,提取和清洗PDF 文件中数据的方法,检测和清除RDBMS 中的坏数据的解决方案,以及使用书中介绍的方法清洗来自Twitter 和Stack Overflow 的数据。 《Python数据科学手册》是对以数据深度需求为中心的科学、研究以及针对计算和统计方法的参考书。本书共五章,每章介绍一到两个Python数据科学中的重点工具包。首先从IPython和Jupyter开始,它们提供了数据科学家需要的计算环境;第 2章讲解能提供ndarray对象的NumPy,它可以用Python高效地存储和操作大型数组;第3章主要涉及提供DataFrame对象的Pandas,它可以用Python高效地存储和操作带标签的/列式数据;第4章的主角是Matplotlib,它为Python提供了许多数据可视化功能;第5章以Scikit-Learn为主,这个程序库为重要的机器学习算法提供了高效整洁的Python版实现。 《Python数据科学手册》适合有编程背景,并打算将开源Python工具用作分析、操作、可视化以及学习数据的数据科学研究人员。 本书解释了数据科学中至关重要的统计学概念,介绍如何将各种统计方法应用于数据科学。作者以易于理解、浏览和参考的方式,引出统计学中与数据科学相关的关键概念;解释各统计学概念在数据科学中的重要性及有用程度,并给出原因。 本书介绍了使用Python进行数据分析和高效的机器学习,首先从一节Python速成课开始,然后回顾统计学和概率论的基础知识,接着深入讨论与数据挖掘和机器学习相关的60多个主题,包括贝叶斯定理、聚类、决策树、回归分析、实验设计等。 本书基于Python语言环境,从零开始讲解数据科学工作,讲述数据科学工作所需的技能与诀窍,并带领读者熟悉数据科学的核心知识:数学与统计学。作者借助大量具有现实意义的实例详细展示了什么是数据科学,介绍了从事数据科学工作需要用到的库,如NumPy、scikit-learn、pandas等,还在每章末尾推荐了很多学习资源,帮助你进一步巩固本书所学。新版基于Python 3.6,重写了所有示例和代码,并根据数据科学近几年的发展,新增了关于深度学习、统计学和自然语言处理等主题,让图书内容与时俱进。
目录展开

总目录

数据科学入门(第2版)

版权声明

O'Reilly Media, Inc. 介绍

第2版前言

第1版前言

第 1 章 导论

第 2 章 Python速成

第 3 章 数据可视化

第 4 章 线性代数

第 5 章 统计学

第 6 章 概率

第 7 章 假设和推论

第 8 章 梯度下降

第 9 章 获取数据

第 10 章 数据工作

第 11 章 机器学习

第 12 章 k 最近邻法

第 13 章 朴素贝叶斯算法

第 14 章 简单线性回归

第 15 章 多元回归

第 16 章 逻辑回归

第 17 章 决策树

第 18 章 神经网络

第 19 章 深度学习

第 20 章 聚类分析

第 21 章 自然语言处理

第 22 章 网络分析

第 23 章 推荐系统

第 24 章 数据库与 SQL

第 25 章 MapReduce

第 26 章 数据伦理

第 27 章 数据科学前瞻

关于作者

关于封面

看完了

Python数据科学与机器学习:从入门到实践

版权声明

前言

第 1 章 入门

第 2 章 统计与概率复习以及Python实现

第 3 章 Matplotlib与概率高级概念

第 4 章 预测模型

第 5 章 使用Python进行机器学习

第 6 章 推荐系统

第 7 章 更多数据挖掘和机器学习技术

第 8 章 处理真实数据

第 9 章 Apache Spark——大数据上的机器学习

第 10 章 测试与实验设计

看完了

统计思维:程序员数学之概率统计(第2版)

版权声明

O'Reilly Media, Inc. 介绍

前言

第1章 探索性数据分析

第2章 分布

第3章 概率质量函数

第4章 累积分布函数

第5章 分布建模

第6章 概率密度函数

第7章 变量之间的关系

第8章 估计

第9章 假设检验

第10章 线性最小二乘法

第11章 回归

第12章 时间序列分析

第13章 生存分析

第14章 分析方法

作者介绍

封面介绍

看完了

面向数据科学家的实用统计学

版权声明

O'Reilly Media, Inc. 介绍

前言

第 1 章 探索性数据分析

第 2 章 数据和抽样分布

第 3 章 统计实验与显著性检验

第 4 章 回归与预测

第 5 章 分类

第 6 章 统计机器学习

第 7 章 无监督学习

作者简介

封面说明

看完了

干净的数据:数据清洗入门与实践

版权声明

前言

第 1 章 为什么需要清洗数据

第 2 章 基础知识——格式、类型与编码

第 3 章 数据清洗的老黄牛——电子表格和文本编辑器

第 4 章 讲通用语言——数据转换

第 5 章 收集并清洗来自网络的数据

第 6 章 清洗PDF文件中的数据

第 7 章 RDBMS清洗技术

第 8 章 数据分享的最佳实践

第 9 章 Stack Overflow项目

第 10 章 Twitter项目

看完了

命令行中的数据科学

版权声明

O'Reilly Media, Inc.介绍

前言

第1章 简介

第2章 入门指南

第3章 数据获取

第4章 创建可重用的命令行工具

第5章 数据清洗

第6章 管理数据工作流

第7章 数据探索

第8章 并行管道

第9章 数据建模

第10章 总结

附录A 命令行工具列表

ssh

tee

附录B 参考文献

作者介绍

封面介绍

看完了

Python数据科学手册

版权声明

O'Reilly Media, Inc. 介绍

译者序

前言

第 1 章 IPython:超越Python

第 2 章 NumPy入门

第 3 章 Pandas数据处理

第 4 章 Matplotlib数据可视化

第 5 章 机器学习

关于作者

关于封面

看完了

数据科学实战

版权声明

O'Reilly Media, Inc.介绍

作者介绍

关于封面图

前言

第 1 章 简介:什么是数据科学

第 2 章 统计推断、探索性数据分析和数据科学工作流程

第 3 章 算法

第 4 章 垃圾邮件过滤器、朴素贝叶斯与数据清理

第 5 章 逻辑回归

第 6 章 时间戳数据与金融建模

第 7 章 从数据到结论

第 8 章 构建面向大量用户的推荐引擎

第 9 章 数据可视化与欺诈侦测

第 10 章 社交网络与数据新闻学

第 11 章 因果关系研究

第 12 章 流行病学

第 13 章 从竞赛中学到的:数据泄漏和模型评价

第 14 章 数据工程:MapReduce、Pregel、Hadoop

第 15 章 听听学生们怎么说

第 16 章 下一代数据科学家、自大狂和职业道德

看完了

累计评论(1条) 1个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部