娆㈣繋鍏変复褰撳綋锛岃鐧诲綍鎴愪负浼氬憳

男频| 女频

当当云阅读

当当云阅读文字

万本电子书0元读

万本电子书0元读

搜索

购物车0

图书分类

小说: 侦探/悬疑/推理; 情感/都市; 科幻/魔幻; 作品集; 外国小说

文艺: 文学; 青春文学; 传记; 艺术; 动漫/幽默

历史文化: 哲学/宗教; 历史; 政治/军事; 文化; 社会科学; 古籍; 法律

经济/管理: 管理; 经济; 投资理财; 市场/营销; 商务沟通; 中国经济; 国际经济

心理/励志: 心理学; 女性心理学; 儿童心理学; 情绪管理; 职场/人际交往; 人生哲学

生活: 两性关系; 亲子/家教; 旅游/地图; 烹饪/美食; 保健/养生

童书: 儿童文学; 启蒙读物; 少儿英语; 动漫/图画书

科技/教育: 科普读物; 计算机/网络; 自然科学; 中小学教辅; 考试; 外语; 工具书

原版书: 外文原版书; 港台圖書; 小语种

我要充值赠送20%

顶部广告

当当云阅读 > 科技 > 计算机/网络 > 多媒体/数据通信 > 深度学习视频理解

深度学习视频理解

| | 手机阅读

扫描下载当当云阅读App

深度学习视频理解电子书

暂无

售价：¥

纸质售价：¥95.20购买纸书

88人正在读 | 0人评论

6.2

作者：张皓

出版社：电子工业出版社

出版时间：2021-09-01

字数：18.7万

所属分类：科技 > 计算机/网络 > 多媒体/数据通信

温馨提示：数字商品不支持退换货，不提供源文件，不支持导出打印

为你推荐

读书简介
目录
累计评论(0条)

读书简介
目录
累计评论(0条)

视频理解是计算机视觉和深度学习的一个重要分支。本书对视频理解的3个重要领域行介绍，对于每个领域，本书不仅解释了相关算法的原理，还梳理了算法演的脉络。全书共分6章，第1章简要介绍视频行业的发展历程；第2章回顾经典图像分类模型和RNN；第3章和第4章介绍动作识别的重要算法；第5章介绍时序动作定位的重要算法；第6章介绍视频Embedding的重要算法。后总结了常用的一些视频处理工具。<br/>【作者】<br/>张皓，毕业于南京大学计算机系周志华教授领导的机器学习与数据挖掘研究所（LAMDA），导师为吴建鑫教授，研究方向为深度学习和计算机视觉，曾获国家奖学金、江苏省三好学生等荣誉。发表论文累计被引超过 190 次，合译《模式识别》一书，曾获 2016 年 CVPR 视频表象性格分析竞赛世界冠军。现任腾讯在线视频研究员，专注于腾讯视频等场景下的相关视频理解任务。曾任腾讯优图实验室研究员，为“微信看一看”等场景提供相关视频理解能力。知乎"张皓”关注深度学习和计算机视觉，担任多个自媒体作者或专栏作者。<br/>

目录展开

内容简介

前言

第1章绪论

1.1 引言

1.2 本书内容

1.2.1 图像分类

1.2.2 动作识别

1.2.3 时序动作定位

1.2.4 视频Embedding

1.3 本章小结

第2章经典网络结构回顾

2.1 经典图像分类网络

2.1.1 LetNet-5

2.1.2 AlexNet

2.1.3 VGGNet

2.1.4 GoogLeNet

2.1.5 Inception V2/V3

2.1.6 ResNet

2.1.7 preResNet

2.1.8 WRN

2.1.9 随机深度网络

2.1.10 DenseNet

2.1.11 ResNeXt

2.1.12 SENet

2.1.13 MobileNet

2.1.14 MobileNet V2/V3

2.1.15 ShuffleNet

2.1.16 ShuffleNet V2

2.2 RNN、LSTM和GRU

2.2.1 RNN

2.2.2 梯度爆炸与梯度消失

2.2.3 LSTM

2.2.4 GRU

2.3 本章小结

第3章基于2D卷积的动作识别

3.1 平均汇合

3.2 NetVLAD和NeXtVLAD

3.2.1 VLAD

3.2.2 NetVLAD

3.2.3 NeXtVLAD

3.2.4 NetFV和其他策略

3.3 利用RNN融合各帧特征

3.3.1 2D卷积+RNN的基本结构

3.3.2 对RNN结构进行改造

3.4 利用3D卷积融合各帧特征

3.4.1 什么是3D卷积

3.4.2 ECO

3.5 双流法

3.5.1 什么是光流

3.5.2 双流法的基本网络结构

3.5.3 双流法的网络结构优化

3.6 时序稀疏采样

3.6.1 TSN

3.6.2 TSN的实现

3.6.3 ActionVLAD

3.6.4 StNet

3.6.5 TRN

3.7 利用iDT轨迹

3.7.1 DT和iDT

3.7.2 TDD

3.8 本章小结

第4章基于3D卷积的动作识别

4.1 3D卷积基础网络结构

4.1.1 C3D

4.1.2 Res3D/3D ResNet

4.1.3 LTC

4.2 I3D

4.2.1 5类动作识别网络

4.2.2 2D卷积扩展为3D卷积

4.2.3 5类网络对比

4.3 3D卷积的低秩近似

4.3.1 低秩近似的基本原理

4.3.2 FSTCN

4.3.3 P3D

4.3.4 R(2+1)D

4.3.5 S3D

4.4 TSM

4.5 3D卷积+RNN

4.6 ARTNet

4.7 Non-Local

4.7.1 Non-Local 操作

4.7.2 Non-Local 动作识别网络

4.8 SlowFast

4.8.1 Slow分支和Fast分支

4.8.2 网络结构设计

4.9 3D卷积神经网络超参数设计

4.9.1 多网格训练

4.9.2 X3D

4.10 本章小结

第5章时序动作定位

5.1 基于滑动窗的算法

5.1.1 S-CNN

5.1.2 TURN

5.1.3 CBR

5.2 基于候选时序区间的算法

5.2.1 Faster R-CNN 回顾

5.2.2 R-C3D

5.2.3 TAL-Net

5.3 自底向上的时序动作定位算法

5.3.1 BSN

5.3.2 TSA-Net

5.3.3 BMN

5.4 对时序结构信息建模的算法

5.4.1 TAG 候选时序区间生成算法

5.4.2 SSN 网络结构

5.5 逐帧预测的算法

5.5.1 CDC层

5.5.2 CDC网络结构

5.6 单阶段算法

5.6.1 SSAD

5.6.2 SS-TAD

5.6.3 GTAN

5.7 本章小结

第6章视频Embedding

6.1 基于视频内容的无监督 Embedding

6.1.1 编码-解码网络

6.1.2 视频序列验证

6.1.3 视频和音频信息

6.1.4 视频和文本信息

6.2 Word2Vec

6.2.1 CBOW和Skip-Gram

6.2.2 分层Softmax

6.2.3 负采样

6.3 Item2Vec

6.3.1 Item2Vec 基本形式

6.3.2 Item2Vec的改进

6.4 基于图的随机游走

6.4.1 DeepWalk

6.4.2 Node2Vec

6.5 结合一二阶相似度

6.5.1 LINE

6.5.2 SDNE

6.6 基于图的邻居结点

6.6.1 GCN

6.6.2 GraphSAGE

6.6.3 GAT

6.7 基于多种信息学习视频Embedding

6.7.1 召回模型

6.7.2 训练

6.8 本章小结

附录A 视频处理常用工具

A.1 FFmpeg

A.2 OpenCV

A.3 Decord

A.4 Lintel

参考文献

累计评论(0条) 0个书友正在讨论这本书 发表评论

发表评论

发表评论，分享你的想法吧！

当当云阅读

买过这本书的人还买过

读了这本书的人还在读

支持设备

同类图书排行榜

01

AI艺术极简教程:零基础生成绘画、摄影、设计

AI艺术极简教程:零基础生成绘画、摄影、设计￥22.99

何惠、郭泽德、刘建军著

￥22.99

02

剪映视频剪辑/调色/*从入门到精通(手机版+电脑版)

剪映视频剪辑/调色/*从入门到精通(手机版+电脑版) ￥52.00

麓山剪辑社编著

￥52.00

03

Midjourney AI生图与修图从入门到精通

Midjourney AI生图与修图从入门到精通￥25.99

郑志强

￥25.99

04

剪映视频剪辑完全自学一本通

剪映视频剪辑完全自学一本通￥45.00

卢莉宏董磊唐增煦编著

￥45.00

05

机器学习数学基础

机器学习数学基础￥53.00

齐伟

￥53.00

06

剪映短视频制作完全自学一本通(手机版+电脑版)

剪映短视频制作完全自学一本通(手机版+电脑版) ￥44.50

徐捷;肖兴

￥44.50

07

AI提示工程——基础 ?应用?实例

AI提示工程——基础 ?应用?实例￥55.30

万欣;角志浩;等

￥55.30

08

抠图+修图+调色+合成+*Photoshop核心应用5项修炼(第2版)

抠图+修图+调色+合成+*Photoshop核心应用5项修炼(第2版) ￥57.80

李晓琳编著

￥57.80

09

基于大模型的RAG应用开发与优化——构建企业级LLM应用

基于大模型的RAG应用开发与优化——构建企业级LLM应用￥97.30

严灿平

￥97.30

10

剪映:短、中、长视频剪辑全攻略(手机版+电脑版)

剪映:短、中、长视频剪辑全攻略(手机版+电脑版) ￥48.86

构图君

￥48.86

更多同类图书 >

电子书排行榜

新书排行榜

5元封顶

关注我们

最受欢迎的阅读产品

关注我们：
- 新浪微博
- 官方微信
关于我们

欢迎反馈宝贵意见给我们

客服书吧：当当读书5.0问答

意见反馈

Copyright (C) 当当网 2004-2021, All Rights Reserved

京ICP备17043473号-1|出版物经营许可证新出发京批字第直0673号

当当网收录的免费小说作品、频道内容、书友评论、用户上传文字、图片等其他一切内容及在当当网所做之广告均属用户个人行为，与当当网无关。

当当云阅读

二维码

0元畅读数万本精选电子书