万本电子书0元读

万本电子书0元读

顶部广告

AI源码解读:数字图像处理案例(Python版)电子书

融汇科研与教学经验,案例可二次发利用!阿里巴巴字节跳动讯飞智元腾讯百度微软 专家联袂推荐!配套程序代码、工程文件、附赠案例! 关注“人工智能科学与技术”微信公众号,在 “知识”→“资源下载”→“配书资源”菜单获取下载(或到清华大学出版社网站本书页面下载)。

售       价:¥

纸质售价:¥89.20购买纸书

48人正在读 | 0人评论 6.2

作       者:李永华

出  版  社:清华大学出版社

出版时间:2021-11-01

字       数:9.5万

所属分类: 科技 > 计算机/网络 > 程序设计

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(0条)
  • 读书简介
  • 目录
  • 累计评论(0条)
本书根据当前人工智能RNN深度学习的发展成果,具体设计基于RNN的模型算法,并给出了具体实现,算法流程及Python代码实现。其主要内容包括:基于深度学习的图像处理的20个案例,基于Python的具体实现,本书图文并茂,丰富实用,深浅出,易学易用。本书根据当前人工智能RNN深度学习的发展成果,具体设计基于RNN的模型算法,并给出了具体实现,算法流程及Python代码实现。其主要内容包括:基于深度学习的图像处理的20个案例,基于Python的具体实现,本书图文并茂,丰富实用,深浅出,易学易用。<br/>【推荐语】<br/>融汇科研与教学经验,案例可二次发利用!阿里巴巴字节跳动讯飞智元腾讯百度微软 专家联袂推荐!配套程序代码、工程文件、附赠案例! 关注“人工智能科学与技术”微信公众号,在 “知识”→“资源下载”→“配书资源”菜单获取下载(或到清华大学出版社网站本书页面下载)。<br/>【作者】<br/>李永华:北京邮电大学,教授,拥有超过10年的软硬件发经验,长期致力于物联网、云计算与人工智能的研究工作。在教学中以兴趣为导向,激发学生的创造性;以素质为基础,提高自身教学水平;以科研为手段,促教学理念的转变,在教学与科研实践中指导学生实现300余个创新案例。主持30余项与企事业单位课题的研究工作,在国内外学术期刊及会议发表论文100余篇,申请专利50余项,出版图书20余部。<br/>
目录展开

作者简介

内容简介

前言PREFACE

目 录

项目1 PROJECT 1 基于插帧和超分辨率的视频增强应用

1.1 总体设计

1.1.1 系统整体结构

1.1.2 系统流程

1.2 运行环境

1.2.1 Python环境

1.2.2 PyTorch环境

1.2.3 FFmpeg使用

1.2.4 百度AI Studio使用

1.3 模块实现

1.3.1 视频处理模块

1.3.2 超分辨率模块

1.数据载入与处理

2.模型创建与训练

3.模型生成

1.3.3 插帧模块

1.模型构造

2.模型生成

1.3.4 GUI模块

1.4 系统测试

1.4.1 算法训练

1.4.2 GUI界面效果

1.4.3 输出效果展示

项目2 PROJECT 2 基于Pix2Pix的快速图像风格迁移

2.1 总体设计

2.1.1 系统整体结构

2.1.2 系统流程

2.2 运行环境

2.2.1 Python环境

2.2.2 TensorFlow环境

2.2.3 Flask环境

2.2.4 微信小程序环境

2.3 模块实现

2.3.1 数据预处理

2.3.2 创建模型与编译

1.定义加载VGG-19各层输出函数

2.定义风格图Gram矩阵

3.定义转换网络

4.优化损失函数及模型

2.3.3 模型训练及保存

1.模型训练

2.模型保存

2.3.4 构建Pix2Pix数据集

1.生成风格迁移图片

2.Pix2Pix数据集格式处理

2.3.5 Pix2Pix模型构建

1.Pix2Pix数据集处理

2.定义辅助函数

3.定义生成器和判别器

4.定义损失函数和优化器

2.3.6 Pix2Pix模型训练及保存

1.Pix2Pix模型训练

2.Pix2Pix模型保存

2.3.7 后端搭建

1.微信小程序界面设计

2.Flask+uWSGI+Nginx搭建后端

2.4 系统测试

2.4.1 训练效果

2.4.2 测试效果

2.4.3 模型应用

1.小程序端

2.服务器端

3.应用使用说明

4.返回结果

项目3 PROJECT 3 常见花卉识别

3.1 总体设计

3.1.1 系统整体结构

3.1.2 系统流程

3.2 运行环境

3.2.1 Python环境

3.2.2 TensorFlow环境

3.2.3 Android环境

1.安装Android Studio

2.新建Android项目

3.3 模块实现

3.3.1 数据预处理

3.3.2 创建模型并编译

1.定义模型结构

2.优化损失函数及模型

3.3.3 模型训练及保存

1.模型训练

2.模型保存

3.3.4 模型生成

1.权限注册

2.模型导入及调用

3.相关代码

3.4 系统测试

3.4.1 训练准确率

3.4.2 测试效果

3.4.3 模型应用

1.程序下载运行

2.应用使用说明

3.测试结果示例

项目4 PROJECT 4 基于Keras的狗狗分类与人脸相似检测器

4.1 总体设计

4.1.1 系统整体结构

4.1.2 系统流程

4.2 运行环境

4.2.1 Python环境

4.2.2 TensorFlow环境

4.2.3 Keras环境

4.2.4 安装库

4.3 模块实现

4.3.1 数据预处理

1.数据获取

2.数据处理

4.3.2 模型编译主体

1.定义模型结构

2.损失函数及模型优化

4.3.3 图像检测

1.图片预处理

2.人脸检测

3.狗狗检测

4.3.4 文本数据翻译与爬虫

1.文本数据翻译

2.爬虫

4.3.5 模型训练评估与生成

1.模型训练并保存

2.模型加载及测试

3.模型评估

4.模型生成

4.3.6 前端界面

4.4 系统测试

4.4.1 前端界面展示

4.4.2 程序功能介绍

4.4.3 识别狗狗效果展示

4.4.4 识别人脸效果展示

项目5 PROJECT 5 猫猫相机

5.1 总体设计

5.1.1 系统整体结构

5.1.2 系统流程

5.2 运行环境

5.2.1 Python环境

5.2.2 mxnet环境

5.2.3 OpenCV环境

5.3 模块实现

5.3.1 数据预处理

5.3.2 创建模型并编译

1.定义模型结构

2.优化损失函数

5.3.3 模型训练及保存

1.模型训练

2.模型保存

5.3.4 模型测试

1.读取模型及调用

2.模型导入及调用

3.拍照功能

4.前端代码

5.4 系统测试

5.4.1 训练准确率

5.4.2 测试效果

5.4.3 模型应用

项目6 PROJECT 6 基于Mask R-CNN的动物识别分割及渲染

6.1 总体设计

6.1.1 系统整体结构

6.1.2 系统流程

6.2 运行环境

6.2.1 Python环境

6.2.2 TensorFlow-GPU环境

6.2.3 Keras环境

6.2.4 pycocotools2.0环境

6.2.5 其他依赖库

6.3 模块实现

6.3.1 数据预处理

1.Mask R-CNN算法下载

2.MS COCO预训练权重下载

3.Animal 10数据集下载

4.MS COCO数据集下载

6.3.2 数据集处理

1.Animal 10数据集标注

2.MS COCO分离数据

3.数据集可视化

4.数据集预处理

6.3.3 模型训练及保存

6.3.4 渲染效果实现

6.3.5 GUI设计

6.4 系统测试

6.4.1 模型评估

1.损失曲线

2.COCO官方评估

6.4.2 测试效果

6.4.3 模型应用

项目7 PROJECT 7 新冠肺炎辅助诊断系统

7.1 总体设计

7.1.1 系统整体结构

7.1.2 系统流程

7.2 运行环境

7.2.1 Python环境

7.2.2 PaddlePaddle环境

7.2.3 在线运行

7.3 模块实现

7.3.1 定义待测数据

1.读取数据

2.数据预处理

3.肺部图像预处理

4.展示和图像展示

7.3.2 加载预训练模型

7.3.3 数据预处理

7.3.4 可视化操作

1.后处理模型

2.融合

3.完成后处理

4.展示和保存

7.4 系统测试

7.4.1 DICOM图像

7.4.2 预处理后的图像

7.4.3 肺部分割

7.4.4 病灶分割

7.4.5 分割结果

7.4.6 统计输出结果

项目8 PROJECT 8 Stroke-Controllable快速风格迁移在网页端应用

8.1 总体设计

8.1.1 系统整体结构

8.1.2 系统流程

8.2 运行环境

8.2.1 Python环境

8.2.2 TensorFlow环境

8.2.3 Linux环境

8.2.4 网页配置环境

8.3 模块实现

8.3.1 数据预处理

8.3.2 模型构建

1.定义模型结构

2.优化损失函数

8.3.3 模型训练及保存

1.模型训练

2.模型保存

8.3.4 模型测试

1.风格迁移功能实现

2.网页配置

3.网页前端和后端代码

8.4 系统测试

8.4.1 训练准确率

8.4.2 测试效果

8.4.3 模型应用

1.打开网页

2.上传图片

3.测试结果

项目9 PROJECT 9 SRGAN网络在网站默认头像生成中的应用

9.1 总体设计

9.1.1 系统整体结构

9.1.2 系统流程

9.2 运行环境

9.2.1 TensorFlow环境

1.Anaconda安装

2.Nvidia CUDA cuDNN安装

3.TensorFlow安装

9.2.2 网页服务器开发环境

1.VScode安装

2.Python网页服务器部署环境

9.3 模块实现

9.3.1 数据预处理

1.采集数据

2.数据清洗

3.生成标签

9.3.2 模型构建

1.定义模型结构

2.优化损失函数

9.3.3 模型训练及保存

1.模型训练

2.模型保存

9.3.4 网站搭建

1.格式约定

2.并行处理

3.任务分发-网页后端服务

9.4 系统测试

项目10 PROJECT 10 乱序成语验证码识别

10.1 总体设计

10.1.1 系统整体结构

10.1.2 系统流程

10.2 运行环境

10.2.1 Python环境

10.2.2 TensorFlow环境

10.2.3 安装所需的包

10.3 模块实现

10.3.1 数据预处理

1.成语集的获取

2.数据集的生成

10.3.2 模型一的构建和训练

1.网络结构

2.模型训练及保存

10.3.3 模型二的构建和训练

1.训练集的生成

2.位置预测

3.汉字裁剪

4.测试集的生成

5.网络结构

6.模型训练及保存

10.3.4 乱序成语验证码识别

1.同时调用两个模型

2.乱序成语重排序

10.3.5 可视化界面的实现

1.界面的创建

2.乱序成语验证码的生成、保存和删除

3.乱序成语验证码的选取与识别

4.按钮实现

10.4 系统测试

10.4.1 训练准确率

10.4.2 测试效果

10.4.3 可视化界面应用

项目11 PROJECT 11 基于CNN的SNEAKERS识别

11.1 总体设计

11.1.1 系统整体结构

11.1.2 系统流程

11.2 运行环境

11.2.1 Python环境与Flask框架

11.2.2 环境配置与工具包

11.2.3 微信小程序环境

11.3 模块实现

11.3.1 数据制作

11.3.2 数据构建

1.定义模型结构

2.优化损失函数

11.3.3 模型训练及保存

1.模型训练

2.模型保存

11.3.4 模型测试

1.模型导入及调用

2.相关代码

11.3.5 前端与后台搭建

1.微信小程序端界面设计

2.Flask框架设计Web

11.4 系统测试

11.4.1 训练准确率

11.4.2 测试效果

11.4.3 模型应用

项目12 PROJECT 12 基于SRGAN的单图像超分辨率

12.1 总体设计

12.1.1 系统整体结构

12.1.2 系统流程

12.2 运行环境

12.2.1 Python环境

12.2.2 PyTorch环境

12.2.3 网页端Flask框架

12.2.4 PyQt环境配置

12.3 模块实现

12.3.1 数据预处理

12.3.2 数据导入

12.3.3 定义模型

12.3.4 定义损失函数

12.3.5 模型训练及保存

12.3.6 服务器端架构

12.3.7 本地单机程序

12.4 系统测试

项目13 PROJECT 13 滤镜复制

13.1 总体设计

13.1.1 系统整体结构

13.1.2 系统流程

13.2 运行环境

13.2.1 Anaconda环境

13.2.2 TensorFlow环境

13.2.3 Keras环境

13.3 模块实现

13.3.1 模式选择

13.3.2 任意风格模式

1.界面设计

2.图像风格迁移

13.3.3 固定风格模式

1.界面设计

2.图像风格迁移

13.4 系统测试

13.4.1 任意风格模式测试结果

13.4.2 固定风格模式测试结果

项目14 PROJECT 14 基于PyTorch的快速风格迁移

14.1 总体设计

14.1.1 系统整体结构

14.1.2 系统流程

14.2 运行环境

14.2.1 Python环境

14.2.2 PyTorch环境

14.2.3 PyQt5环境

14.3 模块实现

14.3.1 数据预处理

14.3.2 模型构建

14.3.3 模型训练及保存

14.3.4 界面化及应用

14.4 系统测试

14.4.1 训练准确率

14.4.2 测试效果

14.4.3 程序应用

1.程序下载运行

2.应用使用说明

3.测试结果示例

项目15 PROJECT 15 CASIA-HWDB手写汉字识别

15.1 总体设计

15.1.1 系统整体结构

15.1.2 系统流程

15.2 运行环境

15.2.1 Python环境

15.2.2 TensorFlow环境

15.2.3 wxPython和OpenCV环境

15.2.4 pyttsx3环境

15.3 模块实现

15.3.1 数据预处理

15.3.2 模型构建

1.读取数据

2.定义模型结构

15.3.3 模型训练及保存

1.模型训练

2.模型测试

15.3.4 前端界面

15.4 系统测试

15.4.1 测试效果

15.4.2 模型应用

1.程序运行

2.应用使用说明

项目16 PROJECT 16 图像智能修复

16.1 总体设计

16.1.1 系统整体结构

16.1.2 系统流程

16.2 运行环境

16.2.1 Python环境

16.2.2 TensorFlow环境

16.2.3 OpenFace环境

16.3 模块实现

16.3.1 数据预处理

16.3.2 模型构建

1.定义模型结构

2.优化损失函数

16.3.3 模型训练

16.3.4 程序实现

16.3.5 GUI设计

16.3.6 程序打包

16.4 系统测试

16.4.1 GAN网络损失变化

16.4.2 测试效果

项目17 PROJECT 17 黑白图像自动着色

17.1 总体设计

17.1.1 系统整体结构

17.1.2 系统流程

17.2 运行环境

17.3 模块实现

17.3.1 数据预处理

17.3.2 模型构建与训练

1.定义模型结构

2.确定损失函数

3.加载数据

4.辅助函数

5.训练函数

6.验证函数

7.训练模型

17.3.3 模型调用与结果优化

1.模型调用

2.结果优化

17.3.4 结果展示

17.4 系统测试

项目18 PROJECT 18 深度神经网络压缩与加速技术在风格迁移中的应用

18.1 总体设计

18.1.1 系统整体结构

18.1.2 系统流程

18.2 运行环境

18.2.1 Python环境

18.2.2 GPU环境

18.3 模块实现

18.3.1 数据预处理

18.3.2 创建模型

18.3.3 模型训练及保存

18.3.4 模型测试

18.4 系统测试

18.4.1 风格迁移效果

18.4.2 网络的加速与压缩

项目19 PROJECT 19 迁移学习的狗狗分类器

19.1 总体设计

19.1.1 系统整体结构

19.1.2 系统流程

19.2 运行环境

19.2.1 Python环境

19.2.2 TensorFlow环境

19.2.3 Keras环境

19.2.4 wxPython的安装

19.3 模块实现

19.3.1 数据预处理

19.3.2 模型构建

1.ResNet50模型

2.Xception模型

19.3.3 模型训练

19.3.4 API调用

19.3.5 模型生成

1.狗品种预测模块

2.图片输入模块

3.图片内容解析,引用模型训练结果模块

19.4 系统测试

19.4.1 训练准确率

19.4.2 测试效果

19.4.3 模型应用

1.模型的引用

2.应用使用说明

3.测试结果

项目20 PROJECT 20 基于TensorFlow的人脸检测及追踪

20.1 总体设计

20.1.1 系统整体结构

20.1.2 系统流程

20.2 运行环境

20.2.1 Python环境

20.2.2 TensorFlow环境

20.2.3 models环境

20.3 模块实现

20.3.1 数据预处理

1.将WiderFace数据集转换成pascal_voc格式

2.将Voc格式转化成TFrecords格式

20.3.2 模型构建

1.创建标签分类配置文件

2.配置管道配置文件

20.3.3 模型训练及保存

1.模型训练

2.模型保存

20.4 系统测试

累计评论(0条) 0个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部