当当云阅读 > 科技 > 计算机/网络 > 计算机理论与教程 > ChatGPT原理与架构:大模型的预训练、迁移和中间件编程

ChatGPT原理与架构:大模型的预训练、迁移和中间件编程电子书

（1）作者背景权威：作者是湘潭大学的博导，是科技部国家重子课题（大模型相关）的负责人，是资深的大模型技术专家和布道者。（2）作者经验丰富：对ChatGPT、Llama2等大模型有深研究，带领团队成功训练并部署司法领域的大模型。（3）全套技术原理：围绕ChatGPT，系统阐述了大模型的工作原理、运行机制、架构设计和底层技术等大模型工程师需要掌握的所有理论知识。

售价：¥

纸质售价：¥54.50购买纸书

112人正在读 | 0人评论

6.6

作者：程戈

出版社：机械工业出版社

出版时间：2023-12-01

字数：12.3万

所属分类：科技 > 计算机/网络 > 计算机理论与教程

温馨提示：数字商品不支持退换货，不提供源文件，不支持导出打印

为你推荐

读书简介
目录
累计评论(0条)

读书简介
目录
累计评论(0条)

内容简介这是一本深阐述ChatGPT等大模型的工作原理、运行机制、架构设计和底层技术，以及预训练、迁移、微调和中间件编程的著作。它将帮助我们从理论角度全面理解大模型，从实践角度更好地应用大模型，是作者成功训练并部署大模型的过程复盘和经验总结。第1章介绍了ChatGPT等大模型的发展历程、技术演化和技术栈等基础知识；第2~5章深讲解了Transformer的架构原理，并从GPT-1的生成式预训练到GPT-3的稀疏注意力机制详细描述了GPT系列的架构演； 6~8章从底层技术实现的角度讲解了大语言模型的训练策略、数据处理方法，以及如何利用策略优化和人类反馈来一步提升模型的表现；第9~10章首先详细讲解了大语言模型在垂直领域的低算力迁移方法，并给出了医疗和司法领域的迁移案例，然后讲解了大模型的中间件编程；第11章对GPT的未来发展趋势行预测，探讨数据资源、自回归模型的局限性，以及大语言模型时代具身智能的可行路线。 【推荐语】 （1）作者背景权威：作者是湘潭大学的博导，是科技部国家重子课题（大模型相关）的负责人，是资深的大模型技术专家和布道者。（2）作者经验丰富：对ChatGPT、Llama2等大模型有深研究，带领团队成功训练并部署司法领域的大模型。（3）全套技术原理：围绕ChatGPT，系统阐述了大模型的工作原理、运行机制、架构设计和底层技术等大模型工程师需要掌握的所有理论知识。（4）关键应用主题：从大模型的数据处理、预训练到向垂直领域迁移、微调，再到中间件编程，涵盖当下大模型应用的各项关键技术主题。（5）多位专家推荐：阿里、Google、ChatLaw等企业的多位大模型技术专家高度评价并推荐。 【作者】 程戈博士生导师，湘潭大学计算机学院·网络空间安全学院教授，湘潭大学技术转移中心副主任，湘潭市京东智能城市与大数据研究院副院长，智慧司法与数字治理湖南省重实验室副主任，CCF计算法学会执委。大模型领域技术专家和布道者，作为两项科技部国家重研发子课题的负责人，与成都数之联等多家企业合作推动人工智能在司法领域的落地，带领团队发了JusticeGPT司法大模型，不同于其他的以提升司法领域知识问答能力为核心的司法大模型，该大模型致力于提升司法文献检索增强生成以及司法文档的多跳信息聚合能力，并通过特定的多任务表征与控制指令生成框架重构司法信息化系统的业务中台，实现司法业务编排以及工作流自动化。连续创业者，先后创立湘潭安道致胜信息科技有限公司等多家企业，曾经作为共同创始人加盟美国WiFi Free llc. ，发了WiFi Free、WiFi Analyzer 等项目，其中WiFi Free在2014到2015年是Google Play市场相关WiFi分享类应用下载的前三名。作为技术顾问，先后服务于北京捷通华声等多家企业，提供知识表示学习的技术解决方案，为某知名私募发了基于深度学习的股票趋势预测系统，成为该私募公司的主要量化工具。

目录展开