当当读书
首页
书房
账户
购物车
分享
分享到
QQ空间
新浪微博
关闭
Spark快速数据处理
余璜 张磊
0
¥
17.90
抢
秒
原价¥17
¥
开通租阅权,免费读此书
提示:数字商品不支持退换货,不提供源文件,不支持导出打印。
评论
赠一得一
收藏
分享
此书籍暂不支持在移动端购买和阅读
秒
剩余
0
天
00
小时
00
分
00
秒
抢
此商品限时抢购中,剩余
1
天
12
小时
31
分
23
秒
减
折
满80元折上8折
N件折
满2件折上8折
N元场
已选1件,再选1件即可享8折
领券
查看对应纸书
25.2
详情
目录
评论(
0
)
内容简介
Spark是一个源的通用并行分布式计算框架,由加州大学伯克利分校的AMP实验室发,支持内存计算、多迭代批量处理、即席查询、流处理和图计算等多种范式。Spark内存计算框架适合各种迭代算法和交互式数据分析,能够提升大数据处理的实时性和准确性,现已逐渐获得很多企业的支持,如*、百度、网易、英特尔等公司。 本书系统讲解Spark的使用方法,包括如何在多种机器上安装Spark,如何配置一个Spark集群,如何在交互模式下运行个Spark作业,如何在Spark集群上构建一个生产级的脱机/独立作业,如何与Spark集群建立连和使用SparkContext,如何创建和保存RDD(弹性分布式数据集),如何用Spark分布式处理数据,如何设置Shark,将Hive查询集成到你的Spark作业中来,如何测试Spark作业,以及如何提升Spark任务的性能。
【推荐语】
从实用角度系统讲解Spark的数据处理工具及使用方法 手把手教你充分利用Spark提供的各种功能,快速编写高效分布式程序
【作者】
Holden Karau 资深软件发工程师,现就职于Databricks公司,之前曾就职于谷歌、亚马逊、微软和Foursquare等著名公司。他对源情有独钟,参与了许多源项目,如Linux内核无线驱动、Android程序监控、搜索引擎等,对存储系统、推荐系统、搜索分类等都有深研究。 译者简介 余璜 *核心系统研发工程师,OceanBase核心发人员,对分布式系统理论和工程实践有深刻理解,专注于分布式系统设计、大规模数据处理,乐于分享,在CSDN上分享了大量技术文章。 张磊 Spark爱好者,曾参与分布式OLAP数据库系统核心发,热衷于大数据处理、分布式计算。
展开
作者
余璜 张磊
出版
机械工业出版社
分类
出版物 >
计算机/网络 >
程序设计
大家都在看
换一批
Python网络爬虫:从入门到精通(附微课)
吕云翔 主编
算法详解(卷3)——贪心算法和动态规划
蒂姆·拉夫加登(Tim Roughgarden) 著
面向对象是怎样工作的(第3版)
[日]平泽章 著
Python 3.8从零开始学
刘艳,刘宇宙
Python数据分析基础与案例实战
杨果仁 张良均 主编
Python数据科学实战
尤利•瓦西列夫(Yuli Vasiliev) 著
算法详解(卷4)——NP-Hard问题算法
蒂姆·拉夫加登(Tim Roughgarden) 著
Python网络爬虫技术(第2版)(微课版)
池瑞楠,张良均 主编
程序是怎样跑起来的(第3版)
[日]矢泽久雄 著
大家都在看
换一批
Python网络爬虫:从入门到精通(附微课)
吕云翔 主编
算法详解(卷3)——贪心算法和动态规划
蒂姆·拉夫加登(Tim Roughgarden) 著
面向对象是怎样工作的(第3版)
[日]平泽章 著
Python 3.8从零开始学
刘艳,刘宇宙
Python数据分析基础与案例实战
杨果仁 张良均 主编
Python数据科学实战
尤利•瓦西列夫(Yuli Vasiliev) 著
算法详解(卷4)——NP-Hard问题算法
蒂姆·拉夫加登(Tim Roughgarden) 著
Python网络爬虫技术(第2版)(微课版)
池瑞楠,张良均 主编
程序是怎样跑起来的(第3版)
[日]矢泽久雄 著
购物车
购买
免费试读
加入购物车
领取优惠券
温馨提示:
您已领取的礼券,请到【个人中心】-【资产】中查看。
升级VIP,6万精品免费读。
快来当当读书app
取消
确定