
会员
ChatGPT原理与架构:大模型的预训练、迁移和中间件编程
更新时间:2024-04-25 18:20:57 最新章节:封底
书籍简介
这是一本深入阐述ChatGPT等大模型的工作原理、运行机制、架构设计和底层技术,以及预训练、迁移、微调和中间件编程的著作。它将帮助我们从理论角度全面理解大模型,从实践角度更好地应用大模型,是作者成功训练并部署大模型的过程复盘和经验总结。第1章介绍了ChatGPT等大模型的发展历程、技术演化和技术栈等基础知识;第2~5章深入讲解了Transformer的架构原理,并从GPT-1的生成式预训练到GPT-3的稀疏注意力机制详细描述了GPT系列的架构演进;6~8章从底层技术实现的角度讲解了大语言模型的训练策略、数据处理方法,以及如何利用策略优化和人类反馈来进一步提升模型的表现;第9~10章首先详细讲解了大语言模型在垂直领域的低算力迁移方法,并给出了医疗和司法领域的迁移案例,然后讲解了大模型的中间件编程;第11章对GPT的未来发展趋势进行预测,探讨数据资源、自回归模型的局限性,以及大语言模型时代具身智能的可行路线。
品牌:机械工业出版社
上架时间:2023-12-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
程戈
同类热门书
最新上架
- 会员全书通过118个实用技巧讲解+118集教学视频演示+160多个素材回复文件+144页PPT教学课件,通过“提问生成+修改润色+热门模板+应用案例”4大专项内容,帮助小白快速成为AI文案高手!本书具体内容包括16种AI提问技巧、13种指令优化技巧、11种高效提问技巧、9种文案修改技巧、7种文案润色方法、11类营销文案指令模板、12类办公文案指令模板、13类自媒体文案指令模板、12类教育学术文案指令模计算机11.6万字
- 会员本书从技术角度深度解析大模型的原理,从大模型的基础概念及领域发展现状入手,概述大模型的理论基础,介绍OpenAIGPT、清华大学GLM、MetaLlama等主流大模型的技术原理,并从大模型参数高效微调、大模型指令微调、大模型训练优化和大模型推理优化等多角度解析大模型背后的技术,带领读者全方位掌握大模型的原理和实践方法。本书最后介绍私有大模型的构建,手把手指导读者做技术选型并搭建自己的私有大模型计算机12.2万字
- 会员本书立足于AIGC技术前沿与发展趋势,全面阐述了AIGC的概念内涵、底层技术与应用场景,详细梳理全球科技巨头在AIGC领域的战略布局,并辅之以大量生动有趣的案例,深度剖析AIGC在各行业领域的应用场景,旨在引导读者真切感受AIGC革命浪潮蕴含的商业创造力。全书分为五个部分,共18章。第一部分主要厘清AIGC技术的起源与演变,阐述席卷全球的AIGC背后的技术架构以及AIGC的应用场景;第二部分重点剖计算机11.4万字
- 会员本书将为你揭开生成式AI重塑职场生态的终极密码,带你从“工具使用者”进阶为“AI协作大师”。通过DeepSeek、智谱清言、通义千问等前沿工具的实战解析,你将掌握AI时代的职场生存法则:告别低效与重复,解锁高阶创造力,构建人机协作系统,跨越职业天花板。书中融合了近百个真实案例,涵盖目标管理、会议组织、公文写作、公众演讲等12大职场刚需场景,提供即学即用的AI解决方案。无论你是疲于应付报表的职场新人计算机12.5万字
- 会员(1)AI与AIGC基础知识:从基础入手,深入讲解AI技术的基本概念和原理。通过通俗易懂的讲解和示例,帮助读者建立坚实的理论基础,为后续章节的深入学习打下良好基础。(2)智能设备上的AIGC系统设计:详细介绍AIGC技术在实际应用过程中的各种功能设计和实现方法。内容涵盖算法选择、模型训练、系统集成等各个环节,通过丰富的技术细节和设计策略,帮助读者全面掌握AIGC技术的应用要点。(3)AIGC关键工计算机18万字
- 会员本书是继《EasyRL:强化学习教程》(俗称“蘑菇书”)之后,为强化学习的读者专门打造的一本深入实践的全新教程。全书大部分内容基于3位作者的实践经验,涵盖马尔可夫决策过程、动态规划、免模型预测、免模型控制、深度学习基础、DQN算法、DQN算法进阶、策略梯度、Actor-Critic算法、DDPG与TD3算法、PPO算法等内容,旨在帮助读者快速入门强化学习的代码实践,并辅以一套开源代码框架“Joy计算机7.8万字
- 会员本书共分为10章,涵盖了贝叶斯概率、概率估计、贝叶斯分类、随机场、参数估计、机器学习、深度学习、贝叶斯网络、动态贝叶斯网络、贝叶斯深度学习等。本书涉及的应用领域包含机器学习、图像处理、语音识别、语义分析等。计算机0字