万本电子书0元读

万本电子书0元读

顶部广告

Python数据科学加速:Dask、Ray、Xorbits、mpi4py电子书

掌握Python分布式计算!从语言概述到核心技术,从集群部署到机器学习、强化学习,全面解析Dask和Xorbits,还有分布式数据预处理与mpi4py的应用。无论你是Python发者还是数据科学家,本书将带你领略分布式编程的威力,让你在大规模数据处理和并行计算中事半功倍。拓展你的技术领域,加速你的项目程,成为分布式计算的大师!

售       价:¥

纸质售价:¥89.00购买纸书

6人正在读 | 0人评论 6.5

作       者:鲁蔚征 秦续业

出  版  社:清华大学出版社有限公司

出版时间:2024-11-01

字       数:15.7万

所属分类: 科技 > 计算机/网络 > 程序设计

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(0条)
  • 读书简介
  • 目录
  • 累计评论(0条)
当前,数据驱动的理念已渗透到各个领域,数据科学和人工智能技术在制造业、金融、教育等多个行业中得到了广泛应用。Python作为一种编程语言,已成为数据科学和人工智能领域的事实标准,它丰富的生态系统一步增强了它在这些领域中的重要性。然而,随着数据量的不断增长,如何利用Python加速数据科学处理,并将它扩展到集群上的并行计算,已成为数据科学家面临的重要挑战。《Python数据科学加速:Dask、Ray、Xorbits、mpi4py》详细介绍了4种数据科学工具:Dask、Ray、Xorbits和mpi4py,这些工具可以帮助数据工程师和科学家处理更大规模的数据集、训练更复杂的模型,并更高效地行机器学习模型的迭代和部署。  《Python数据科学加速:Dask、Ray、Xorbits、mpi4py》面向具备一定数据科学基础的数据工程师、数据科学家或领域专家,同时也适合大学生和研究生作为高性能数据科学领域的门读物。 <br/>【推荐语】<br/>掌握Python分布式计算!从语言概述到核心技术,从集群部署到机器学习、强化学习,全面解析Dask和Xorbits,还有分布式数据预处理与mpi4py的应用。无论你是Python发者还是数据科学家,本书将带你领略分布式编程的威力,让你在大规模数据处理和并行计算中事半功倍。拓展你的技术领域,加速你的项目程,成为分布式计算的大师!<br/>【作者】<br/>鲁蔚征 毕业于北京大学,目前就职于中国人民大学,曾在互联网公司工作,具有丰富的业界大数据和机器学习工作经验。除此之外,还发表了多篇CCF A类论文,已出版《Flink原理与实践》,并负责过多个产学合作项目。 秦续业 毕业于上海交通大学,前阿里巴巴技术专家,现任未来速度CEO,多款大数据和机器学习源框架发者和引领者,其发的项目Xorbits Xinference等在 GitHub上收获上千星标。<br/>
目录展开

作者简介

内容简介

前言

第1章 并行计算基础

1.1 现代计算机体系结构

1.2 串行执行与并行执行

1.3 线程和进程

1.4 并行程序设计方法

1.5 性能指标

第2章 数据科学

2.1 数据科学生命周期

2.2 机器学习

2.3 深度学习

2.4 超参数调优

2.5 软件生态与本书内容

第3章 Dask

3.1 Dask简介

3.2 Dask DataFrame快速入门

3.3 将Dask扩展到集群

3.4 GPU

3.5 Task Graph与数据切分

第4章 Dask DataFrame

4.1 读写数据

4.2 索引

4.3 map_partitions

4.4 Shuffle

4.5 基于Dask的数据分析案例

第5章 Dask机器学习

5.1 数据预处理

5.2 超参数调优

5.3 分布式机器学习

第6章 Ray

6.1 Ray简介

6.2 分布式函数

6.3 分布式对象存储

6.4 分布式类

第7章 Ray集群

7.1 Ray集群概述

7.2 计算资源与资源组

7.3 Ray作业

第8章 Ray Data

8.1 Ray Data简介

8.2 数据加载、查看与保存

8.3 数据转换

8.4 Preprocessor

8.5 Modin

第9章 Ray机器学习

9.1 Ray Train

9.2 Ray Tune

9.3 Ray Serve

第10章 Xorbits

10.1 Xorbits Data

10.2 Xinference

第11章 MPI

11.1 MPI简介

11.2 MPI Hello World

11.3 点对点通信

11.4 集合通信

11.5 远程内存访问

第12章 MPI与大模型

12.1 NCCL简介

12.2 数据并行

12.3 流水线并行

参考文献

累计评论(0条) 0个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部