万本电子书0元读

万本电子书0元读

顶部广告

数据预处理从入门到实战:基于SQL、R、Python电子书

一本书掌握大数据、人工智能时代需要的数据预处理技术 ·KDD CUP 2015亚军得主多行业实战经验总结; ·54道例题,涵盖常见数据预处理技术; ·3个实战案例,快速提升应用能力; ·3种语言实现对比,代码优化关键一目了然; ·配套数据 源码可下载; ·SQL的版本为Redshift,Pyhton的版本为3.6,R的版本的3.4; ·双色印刷。 数据提取/数据聚合/数据连/数据拆分/数据生成/数据扩展

售       价:¥

纸质售价:¥75.60购买纸书

63人正在读 | 0人评论 7.1

作       者:[日]本桥智光 著

出  版  社:人民邮电出版社有限公司

出版时间:2021-02-01

字       数:19.2万

所属分类: 科技 > 计算机/网络 > 计算机理论与教程

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(0条)
  • 读书简介
  • 目录
  • 累计评论(0条)
在大数据、人工智能时代,数据分析必不可少。本书以数据分析中至关重要的数据预处理为主题,通过54道例题具体介绍了基于SQL、R、Python的处理方法和相关技巧。全书共4个部分:第1部分介绍预处理的基础知识;第2部分介绍以数据结构为对象的预处理,包括数据提取、数据聚合、数据连、数据拆分、数据生成和数据扩展;第3部分介绍以数据内容为对象的预处理,涉及数值型、分类型、日期时间型、字符型和位置信息型;第4部分为预处理实战,介绍与实际业务相同的预处理流程。 本书适合新手数据科学家、系统工程师、具备编程及数理基础的技术人才,以及对数据挖掘和数据分析等感兴趣的人阅读。<br/>【推荐语】<br/>一本书掌握大数据、人工智能时代需要的数据预处理技术 ·KDD CUP 2015亚军得主多行业实战经验总结; ·54道例题,涵盖常见数据预处理技术; ·3个实战案例,快速提升应用能力; ·3种语言实现对比,代码优化关键一目了然; ·配套数据 源码可下载; ·SQL的版本为Redshift,Pyhton的版本为3.6,R的版本的3.4; ·双色印刷。 数据提取/数据聚合/数据连/数据拆分/数据生成/数据扩展 数值型/分类型/日期时间型/字符型/位置信息型 1.习题式结构,带着问题思考、学习,效果更好 本书采用问题驱动式,先抛出常见预处理任务,引导读者思考如何实现。像这样带着问题学习,可以大大提高学习效果,让理解更深。 2.对比3种不同语言的实现,把握每种语言的特长 用SQL、R、Python对比解决相同的案例问题,可以让读者了解各语言在处理各种预处理问题时有哪些优缺,从而根据情况选择合适的语言,提升预处理效率。 3.同时给出一般代码与理想代码,优化处理的关键一目了然 对于每道例题,都同时给出一般代码与理想代码,读者不仅可以边阅读边思考如何修改一般代码,还可以通过与理想代码的对比明白如何优化代码。<br/>【作者】<br/>本桥智光(作者) 先后在系统发公司担任研究员,在互联网企业担任数据科学家,目前在数字医疗初创公司SUSMED株式会社担任CTO,同时就职于HOXO-M株式会社,并以自由职业者的身份从事量子退火计算机的验证工作,拥有制造业、零售业、金融业、运输业、休闲业和互联网等多个行业的数据分析经验。曾在KDD CUP 2015中赢得亚军。爱好是发马里奥AI。 Twitter:@tomomoto_LV3 陈涛(译者) 运筹学硕士毕业,主要从事数据库、数据分析工作,对机器学习、深度学习领域相关的理论和技术较为熟悉。因兴趣自学日语,一直致力于追求兴趣和工作的完美结合。 邮箱:victory123_456@163.com<br/>
目录展开

译者序

成功源于平淡、孤独而漫长的磨炼

前言

声明

第1部分 预处理入门

第1章 什么是预处理

第2部分 对数据结构的预处理

第2章 数据提取

第3章 数据聚合

第4章 数据连接

第5章 数据拆分

第6章 数据生成

第7章 数据扩展

第 3 部分 对数据内容的预处理

第8章 数值型

第9章 分类型

第10章 日期时间型

第11章 字符型

第12章 位置信息型

第 4 部分 预处理实战

第13章 实战练习

结语

参考文献

作者简介

看完了

累计评论(0条) 0个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部