当当云阅读 > 科技 > 计算机/网络 > 计算机理论与教程 > 大模型驱动的具身智能:架构、设计与实现

大模型驱动的具身智能:架构、设计与实现电子书

（1）权威背书，实力保障作者系湖南国家应用数学中心副主任、湘潭大学博士生导师，科技部国家重子课题（大模型相关）的负责人，长期深耕AI与机器人前沿，是业界公认的具身智能专家。（2）实战丰富，产业导向主导多个具身智能项目从原型到落地，深企业应用场景，积累了大量工程实操经验，本书凝练了其技术落地的核心方法论。（3）技术全面，系统透彻从大模型能力剖析，到多模态感知、任务规划、动作控制、架构设计与部署实现，全方位讲解具身智能系统的核心技术条。

售价：¥

纸质售价：¥64.10购买纸书

42人正在读 | 0人评论

6.4

作者：程戈

出版社：机械工业出版社

出版时间：2025-06-05

字数：13.3万

所属分类：科技 > 计算机/网络 > 计算机理论与教程

温馨提示：数字商品不支持退换货，不提供源文件，不支持导出打印

为你推荐

读书简介
目录
累计评论(条)

读书简介
目录
累计评论(条)

大模型赋能，重新定义智能机器人的未来。本书是一部讲解如何用大模型驱动具身智能的权威指南，系统揭示了从底层架构到实战部署的完整技术路径。作者团队融合多年一线研发经验，深讲解如何在多模态环境中，实现智能机器人的任务理解、动作控制、记忆建构与仿真协同。本书不仅提供扎实的理论基础，更通过丰富的行业案例与系统性的方法论，帮助读者构建面向未来的具身智能系统。通过阅读本书，你将获得：（1）全面理解大模型如何赋能具身智能。揭示大型语言模型在感知-决策-执行条中的核心作用，理清从感知到行为的智能演化路径。（2）掌握任务规划与动作控制核心技术。深度解析任务分解、动作生成、空间约束与控制策略，覆盖从高层意图到低层执行的全路建模方法。（3）构建具身智能的记忆与反思机制。学习如何实现任务记忆、动态规划与自我优化机制，提升机器人在复杂环境中的自适应能力。（4）搭建可复用的发与仿真框架。熟练运用 ROS、MoveIt、Gazebo 等核心中间件与仿真平台，助力系统发与快速迭代。无论你是正在发具身智能系统的工程师；投身人工智能前沿的科研人员；关注智能机器人产业落地的技术管理者或产品决策者；本书都将成为你不可或缺的参考读物，引领你从理念到落地，真正掌握大模型时代的具身智能发的核心技术，让你在这场技术革新中把握先机。 【推荐语】 （1）权威背书，实力保障作者系湖南国家应用数学中心副主任、湘潭大学博士生导师，科技部国家重子课题（大模型相关）的负责人，长期深耕AI与机器人前沿，是业界公认的具身智能专家。（2）实战丰富，产业导向主导多个具身智能项目从原型到落地，深企业应用场景，积累了大量工程实操经验，本书凝练了其技术落地的核心方法论。（3）技术全面，系统透彻从大模型能力剖析，到多模态感知、任务规划、动作控制、架构设计与部署实现，全方位讲解具身智能系统的核心技术条。（4）案例详实，贴近实战深度解析特斯拉FSD、松灵机器人等行业级案例，配套ROS控制、仿真系统、动作规划等实操细节，既可学习框架，也可直落地。 【作者】 程戈，博士生导师，湘潭大学技术转移中心副主任，湘潭市京东智能城市与大数据研究院副院长，湘潭大学计算机学院.网络空间学院教授，CCF计算法学会执委，湖南省知识产权保护专家，湖南省知识产权行政保护技术调查官。2011年获得华中科技大学计算机系统结构专业的工学博士学位。研究方面，主要从事知识表示学习与内容安全问题研究，并逐渐聚焦于采用类似Chatgpt大规模语言模型解决人工智能在司法行业中应用的相关场景。近年来，主持国家重研发子课题2项，湖南省重研发1项，国家自科基金1项，博士基金1项，参与其他国家与省部级项目10余项；在国内外重要SSCI/SCI/EI学术期刊和会议发表论文 30 多篇；申请发明专利20多项，获得发明专利授权 20多项，软件著作权10多项。社会服务方面，产学研合作求真务实，在北京捷通华声科技有限公司等6家企业担任技术顾问，主持参与横向课题10余项，多项成果转化应用创效，其中语音识别的单项成果广泛应用于北京捷通华声科技有限公司的车载导航系统中。担任潇湘大数据研究院研究员，大数据与智慧司法研究中心研究员，省创新创业大赛的评委。

目录展开

Preface 前言

Chapter 1 第1章大模型与具身智能

1.1 具身智能的概念

1.2 传统的决策算法

1.2.1 预编程方法

1.2.2 模仿学习

1.2.3 强化学习

1.3 世界模型

1.3.1 什么是世界模型

1.3.2 世界模型在具身智能中的作用

1.4 通往世界模型的渐进之路

1.4.1 大模型编码世界

1.4.2 多模态大模型构建世界模拟器

Chapter 2 第2章机器人系统架构

2.1 机器人控制基础

2.1.1 机器人的分类与组成

2.1.2 自由度与执行器

2.2 机器人系统设计范式

2.2.1 层次范式

2.2.2 行为范式

2.2.3 混合范式

2.3 运动控制层级

2.3.1 递进规划

2.3.2 反应机制

2.3.3 双向控制架构

2.3.4 分层与端到端

Chapter 3 第3章基于大模型的混合控制架构

3.1 大模型与任务级规划

3.1.1 基础模型

3.1.2 任务级分层与端到端

3.2 大模型与动作级规划

3.2.1 直接动作规划

3.2.2 间接动作规划

3.2.3 动作级分层与端到端

3.2.4 具身大模型

3.3 基元级与伺服级

3.3.1 正向运动学的计算

3.3.2 逆向运动学的计算

3.3.3 伺服级控制

3.3.4 端到端控制网络

3.4 具身智能分级混合架构

Chapter 4 第4章具身任务级规划

4.1 任务分解

4.2 任务级分层与端到端架构

4.2.1 感知与规划

4.2.2 分层架构

4.2.3 端到端架构

4.3 任务级规划微调与外部记忆

4.3.1 具身经验的获取

4.3.2 微调与外部记忆

Chapter 5 第5章分层动作级规划

5.1 动作原语及其局限性

5.1.1 动作原语

5.1.2 技能

5.1.3 局限性

5.2 基于技能的单步动作级规划

5.2.1 低成本具身智能方案

5.2.2 GPTR工作流程

5.2.3 局限性

5.3 基于动作原语的直接动作级规划

5.3.1 代码即策略

5.3.2 提示模板

5.3.3 优势与局限性

5.4 基于价值图的动作级分层规划

5.4.1 空间信息与间接动作规划

5.4.2 价值图

5.4.3 动作规划

5.4.4 价值图的构建Prompt

5.4.5 优势与局限性

5.5 基于空间位置约束的动作级分层规划

5.5.1 空间位置约束与轨迹优化

5.5.2 面向任务的抓取

5.5.3 任务感知动作规划

5.5.4 视觉语言模型与Prompt

5.5.5 优势与局限性

Chapter 6 第6章端到端动作级规划

6.1 统一模型与多任务模型

6.2 视觉语言动作模型

6.2.1 动作规划流程

6.2.2 控制原语

6.2.3 控制参数的离散化

6.2.4 动作序列文本化

6.2.5 词表

6.2.6 具身动作微调

6.2.7 动作输出限制

6.2.8 优势和局限性

6.3 多任务端到端

6.3.1 端到端中的多任务

6.3.2 多任务端到端网络架构

6.3.3 特征提取任务

6.3.4 感知任务

6.3.5 预测任务

6.3.6 规划任务

6.3.7 多任务的分步训练

6.3.8 特斯拉全自动驾驶的多任务架构

6.3.9 具身任务迁移

6.3.10 优势和局限性

Chapter 7 第7章具身智能记忆

7.1 人类记忆

7.2 大模型的记忆机制

7.2.1 参数记忆

7.2.2 上下文与工作记忆

7.2.3 外部记忆

7.3 具身智能系统中的记忆机制实现

7.3.1 记忆来源

7.3.2 记忆实现方式

7.3.3 基于RAG的外部记忆机制

7.3.4 大模型参数微调及参数编辑

7.4 记忆在具身智能系统中的作用

7.4.1 记忆驱动具身智能

7.4.2 技能学习与泛化

Chapter 8 第8章决策优化

8.1 多计划选择

8.1.1 多计划生成

8.1.2 最优计划选择

8.2 反思与提炼

8.2.1 反思与提炼的过程

8.2.2 多角色

8.2.3 局限性

8.3 外部规划器

8.3.1 符号规划器

8.3.2 神经网络规划器

Chapter 9 第9章中间件与基础库

9.1 ROS机器人中间件框架

9.1.1 ROS的生态系统

9.1.2 ROS 2架构

9.1.3 分布式通信模式

9.1.4 节点

9.1.5 参数配置

9.2 MoveIt 2逆向运动库

9.2.1 基本概念和功能

9.2.2 MoveIt 2的解算器库

9.2.3 逆向规划的一般过程

9.3 人形具身逆向运动库

9.3.1 全身逆向运动

9.3.2 人体姿态表征

9.3.3 交互表征

9.3.4 具身数据收集

9.3.5 逆向运动迁移

9.3.6 轨迹优化

Chapter 10 第10章仿真框架

10.1 仿真框架的组成

10.2 仿真环境构建

10.2.1 交互方式

10.2.2 环境描述

10.3 代理

10.4 分层任务规划

10.5 运动生成器

10.6 强化学习支持

10.6.1 框架封装

10.6.2 并行仿真环境

10.6.3 从仿真到现实

10.7 模仿学习和远程操作

Chapter 11 第11章具身智能的未来

11.1 具身智能机器人：短暂泡沫还是未来趋势

11.1.1 人形具身热潮

11.1.2 智能化与人形具身

11.2 行业渗透预测

11.2.1 成熟度曲线

11.2.2 行业成熟度

11.2.3 加速的发展浪潮

累计评论(条) 个书友正在讨论这本书 发表评论

发表评论

发表评论，分享你的想法吧！

发表评论

买过这本书的人还买过

读了这本书的人还在读

DeepSeek硬核技术解读￥59.00

刘丹;尹俊希;杨院伶

￥59.00

豆包*学习:AI 辅助中小学生学习的方法与技巧￥47.00

薛碧芸;郭泽德

￥47.00

精通Excel数据统计与分析￥57.54

李宗璋著

￥57.54

更多同类图书 >

大模型驱动的具身智能:架构、设计与实现电子书

支持设备

豆包使用秘笈:从入门到精通的100个实用技巧￥53.00

豆包从入门到精通:AI助手和智能体轻松搞定工作、学习和生活难题￥47.00

千问从入门到精通:AI助手和智能体轻松搞定工作、学习和生活难题￥35.00

学会提问,驾驭AI:提示词从入门到精通￥61.60

OpenClaw实战指南:零基础打造会干活的AI数字员工￥79.00

腾讯元宝使用秘笈:从入门到精通的100个实用技巧￥53.00