万本电子书0元读

万本电子书0元读

顶部广告

SAS数据统计分析与编程实践电子书

      建立起SAS语法的基本框架和知识体系的逻辑框架,更将数据分析行业工作流程、技巧和行业发展融书中,凝练出自我提升途径。

售       价:¥

纸质售价:¥71.50购买纸书

75人正在读 | 0人评论 6.2

作       者:马文豪,李翔宇

出  版  社:中国铁道出版社有限公司

出版时间:2021-01-01

字       数:28.5万

所属分类: 科技 > 计算机/网络 > 计算机理论与教程

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(0条)
  • 读书简介
  • 目录
  • 累计评论(0条)
       本书源自作者5年来的项目和工作实践经验,力求对SAS编程与数据分析做一个较为完整的梳理,除了从技术架构方面细致地梳理了SAS数据分析中的关键技术和实用知识,例如数据集,宏编程。图表生成等,更在讲解中埋藏了一条关于行业实践分析的案例辅线,包括嵌其中的大量实践案例和单独成章的综合案例,帮助读者将关键技术和行业实践相辅相成,让读者能身临其境地了解SAS数据分析行业的精髓。本书并不想陷于具体技术问题的解决方案中,而是希望通过一些关键技术、模型以及实例的关联讲解来帮助读者梳理清楚SAS编程的发思路,继而学会解决一类问题。<br/>【推荐语】<br/>      建立起SAS语法的基本框架和知识体系的逻辑框架,更将数据分析行业工作流程、技巧和行业发展融书中,凝练出自我提升途径。<br/>【作者】<br/>      马文豪,北京理工大学学士学位、美国德州大学信息系统管理硕士学位,美国Mallinckrodt生物制药公司高级统计分析师,精通SAS编程、宏编程、临床医药数据分析,拥有多年数据分析与培训经验,了解数据分析全产业。 李翔宇,北京工业大学通信工程学士学位,美国德州大学信息系统管理硕士学位,在通信、新能源等行业担任数据分析师和系统架构师,擅长Excel、SAS、SharePoint等工具技术,掌握数据分析和系统搭建经验。<br/>
目录展开

版权页

内容简介

作者简介

前言

第一篇 小扣柴扉——成为SAS编程高手

第1章 SAS——统计分析的专用语言

1.1 SAS程序员——一个一点也不酷的职业

1.1.1 稳定性

1.1.2 行业前景

1.1.3 职业前景

1.2 Python这么火,我为什么要学SAS

1.2.1 R语言:统计分析专业户

1.2.2 Python:成功“出圈”的编程语言

1.2.3 SAS:非开源的强大数据分析工具

1.3 SAS的行业应用

1.3.1 医药行业

1.3.2 金融行业

1.3.3 营销行业

第2章 跟SAS交个朋友

2.1 SAS的安装和版本介绍

2.1.1 先聊聊SAS的发展脉络

2.1.2 SAS三种不同版本的安装方式

2.1.3 到底该用哪一版

2.2 每个窗口都有用:日志、结果、输出

2.2.1 桌面版

2.2.2 SAS Studio版

2.3 编写你的第一个SAS程序

2.4 养成编程好习惯

2.4.1 缩进——六合刀法

2.4.2 关注日志——三分剑术

2.4.3 善用注释——太极剑法

2.4.4 帮助文档——北冥神功

第3章 data步——数据集处理小能手

3.1 逻辑判断与数据集合并

3.1.1 SAS的基本语法特点

3.1.2 data步与proc

3.1.3 逻辑判断语句

3.1.4 数据集的合并

3.2 数值型变量与字符型变量

3.2.1 两种变量的概念

3.2.2 数值型变量的相关函数

3.2.3 字符型变量的相关函数

3.3 数据格式

3.3.1 创建、改变和删除数据格式

3.3.2 数值型变量的格式

3.3.3 字符型变量的格式

3.3.4 自定义数据格式

3.3.5 字符型变量与数值型变量的转换

3.4 日期和时间的处理

3.4.1 日期和时间变量的数据格式

3.4.2 IOS8601格式

3.4.3 日期和时间变量相关函数

3.5 实战案例:多种方法计算药物副作用持续时间

3.5.1 案例背景

3.5.2 案例分析

第4章 proc是个筐——数据分析往里装

4.1 data步力所不及?proc迎难而上

4.1.1 怎么学习proc

4.1.2 从proc append说开去

4.2 数据清理第一步——排序与查重

4.2.1 排序

4.2.2 查重

4.3 数据的转置与输出

4.3.1 数据转置

4.3.2 数据输出

4.4 读取和存储外部文件

4.4.1 数据输入

4.4.2 data步与infile

4.4.3 数据输出

4.5 读取数据集和库的信息

4.5.1 proc contents——一眼看穿数据集

4.5.2 proc datasets——万能proc

4.6 好风凭借力:在SAS中使用SQL

4.6.1 SQL与proc——强强联合的数据分析工具

4.6.2 操作变量与值

4.6.3 数据集的合并

4.6.4 使用proc SQL的正确姿势

4.7 实战案例:使用proc sql进行副作用与伴随用药数据多对多合并

4.7.1 案例背景

4.7.2 数据明晰

4.7.3 需求实现

4.7.4 总结思考

第二篇 登堂入室——掌握数据分析技巧

第5章 宏——重复的事情交给程序

5.1 宏编程概念初探

5.1.1 什么是宏?三个字概括:自动化

5.1.2 宏的好处千千万

5.1.3 宏编程注意事项

5.2 编写第一个宏程序

5.2.1 宏程序的结构

5.2.2 变量与宏变量——同名而不同姓的一对

5.2.3 宏参数——让你的宏程序“活起来”

5.2.4 宏相关的选项

5.3 宏的三要素:宏变量、宏逻辑和宏函数

5.3.1 宏变量——百变游戏房

5.3.2 宏逻辑——穿针引线的书房

5.3.3 宏函数——宏程序的起居室

5.4 SAS语句无法实现?宏程序来帮你

5.4.1 %sysfunc引用SAS函数

5.4.2 %sysfunc处理文件

5.4.3 %sysfunc获取系统信息

5.5 实战案例:自动创建包含变量参数的数据集模板

5.5.1 项目背景

5.5.2 项目拆解

5.5.3 编程实现

5.5.4 调试反馈

第6章 统计分析并不难

6.1 数据分析的本质:从数据到知识

6.1.1 三级火箭与数据分析

6.1.2 统计方法

6.2 获取各种统计量

6.2.1 proc means——常用的数值型变量统计量获取方式

6.2.2 另一条道路

6.2.3 proc freq——字符型变量我擅长

6.3 实战案例:异常值处理

6.3.1 什么是异常值

6.3.2 异常值的影响与处理方法

6.3.3 异常值出现的原因

6.3.4 使用统计相关proc去除异常值

6.3.5 使用proc sql找出异常值

6.4 带你走进p value

6.4.1 显著性检验

6.4.2 P值、拒绝域和置信区间

6.4.3 常见的分布类型

6.4.4 从proc ttest说开去

6.4.5 proc freq是箩筐,各种p值里面装

6.5 实战案例:药物到底灵不灵

6.5.1 随机双盲对照试验概念

6.5.2 数据概览

6.5.3 分析与实践

6.5.4 案例总结

6.6 其他统计分析功能常用模型

6.6.1 生存分析

6.6.2 回归分析

6.6.3 相关性分析

6.6.4 主成分分析

第7章 生成统计报表

7.1 数据可视化——数据分析的最终目的

7.1.1 数据可视化概念

7.1.2 可视化方式的选择

7.1.3 从SAS到各种输出格式——ODS是一座桥

7.2 使用proc report生成数据报表

7.2.1 proc report的基础知识

7.2.2 define语句调整每一列的参数

7.2.3 让表格更易懂:表头、脚注与分行

7.2.4 proc report重要选项一览

7.2.5 如何学好proc report

7.3 实战案例:生成层级化计数报表

7.3.1 案例背景

7.3.2 数据与需求分析

7.3.3 创建数据集

7.3.4 创建输出文件

7.3.5 总结与思考

7.4 变身艺术家:使用SAS绘图

7.4.1 proc gchart——方便的绘图工具

7.4.2 proc gplot——研究趋势和变化

7.4.3 自定义你的图形——goption、symbol和其他语句

7.4.4 其他常用的绘图proc

7.5 实战案例:绘制生存曲线

7.5.1 什么是生存分析

7.5.2 案例背景与资源分析

7.5.3 实战操作

7.6 美化统计图表

7.6.1 输出结果与模板

7.6.2 模板的设计与封装

7.6.3 如何成为proc template高手

第8章 玩转数据——常用数据分析与处理技巧

8.1 设置基准线(Baseline)

8.1.1 基准线的概念与定义方法

8.1.2 SAS中定义基准线的方法

8.1.3 常见问题和处理方法

8.1.4 基准线与变化量统计图表

8.2 缺失值的处理方法

8.2.1 缺失不一定是错误

8.2.2 均值法——最简单的填补方法

8.2.3 特殊场景——末次观测值结转法(LOCF)

8.2.4 日期时间的缺失与部分缺失

8.3 数据的时间窗口

8.3.1 什么是时间窗口

8.3.2 SAS中实现日期窗口化的方法

8.3.3 使用宏程序实现窗口化

8.4 自动设置图表表头和脚注

8.4.1 回顾与思考——如何创建表头和题注

8.4.2 优秀的数据分析师应该“懒”一点

8.4.3 创建自动批量设置表头和脚注的宏程序

8.4.4 关于模块化和文档化编程的思考

第9章 大型实战——从数据到图表的临床试验分析

9.1 药物上市流程全揭秘

9.1.1 临床试验与审批

9.1.2 随机双盲对照试验

9.2 办事要按规矩来——CDISC标准浅析

9.2.1 CDISC组织与CDISC标准——没有王冠的王者

9.2.2 CDISC中包含什么

9.2.3 SDTM——数据标准化

9.2.4 ADaM——拿来就用的分析数据集

9.2.5 如何学习SDTM与ADaM

9.3 创建分析用数据集

9.3.1 从分析结果入手的逆向思维

9.3.2 从spec开始

9.3.3 SDTM数据集的结构

9.3.4 创建ADSL数据集

9.4 创建分析图表

9.4.1 项目分析

9.4.2 数值型变量的统计量

9.4.3 字符型变量的统计量

9.4.4 创建宏程序

9.4.5 创建输出图表

第三篇 炉火纯青——深入数据分析行业

第10章 进入数据分析行业

10.1 从头开始进入数据分析行业

10.1.1 数据分析的背后

10.1.2 从零开始,逐步提升

10.1.3 百尺竿头,更进一步

10.1.4 重整旗鼓,梅开二度

10.2 求职—面试—入职,每一步都先人一步

10.2.1 任尔东西南北风——全面的求职准备

10.2.2 把酒祝东风,且共从容——面试一本通

10.2.3 春风得意,不如润物无声——入职全指南

10.3 善用神兵利器,提升工作效率

10.3.1 数据分析师的事,怎么能算抄

10.3.2 宏程序已加载:工作量减50%

10.3.3 日常积累,终有大用

10.3.4 沟通交流,必不可少

第11章 是真名士自风流

11.1 什么是“士”型人才

11.1.1 已破产的理论——“|”型人才和“一”型人才

11.1.2 理论合并——“T”型人才的诞生

11.1.3 更进一步——“十”型人才

11.1.4 并非简单加一横——“士”型人才

11.2 左右逢源——了解数据分析全流程

11.2.1 为什么选择临床试验数据分析行业

11.2.2 每个流程都要懂

11.2.3 建立良好的人际关系

11.3 上食埃土,下饮黄泉——从程序到项目

11.3.1 让人又爱又恨的工作经验

11.3.2 到底什么是工作经验

11.3.3 从程序到项目的思维

11.4 单点突破,方圆掌握——数据分析师的心法与身法

11.4.1 扎稳下盘——了解数据分析在公司中的地位

11.4.2 保持灵活,伺机而动

11.4.3 八方来袭,岿然不动

11.4.4 九层之台,起于累土

累计评论(0条) 0个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部