会员
大语言模型:原理、应用与优化
苏之阳 王锦鹏 姜迪 宋元峰更新时间:2024-12-18 17:07:10
最新章节:封底开会员,本书免费读 >
这是一本从工程化角度讲解大语言模型的核心技术、构建方法与前沿应用的著作。首先从语言模型的原理和大模型的基础构件入手,详细梳理了大模型技术的发展脉络,深入探讨了大模型预训练与对齐的方法;然后阐明了大模型训练中的算法设计、数据处理和分布式训练的核心原理,展示了这一系统性工程的复杂性与实现路径。除了基座模型的训练方案,本书还涵盖了大模型在各领域的落地应用方法,包括低参数量微调、知识融合、工具使用和自主智能体等,展示了大模型在提高生产力和创造性任务中的卓越性能和创新潜力。此外,书中进一步介绍了大模型优化的高级话题和前沿技术,如模型小型化、推理能力和多模态大模型等。最后,本书讨论了大模型的局限性与安全性问题,展望了未来的发展方向,为读者提供了全面的理解与前瞻性的视角。无论是人工智能领域的研究员、工程师,还是对前沿技术充满好奇的读者,本书都将是您了解和掌握大模型技术的必备指南。
品牌:机械工业出版社
上架时间:2024-10-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
苏之阳 王锦鹏 姜迪 宋元峰
主页
同类热门书
最新上架
- 会员
AI效率手册:从ChatGPT开启高效能
ChatGPT是当下最新、最热门的工具、效率工具,但为什么不同的人使用效果天差地别,整体上来说:一是认知上的不足;二是方法上的不足。这正是本书要解决的问题。本书不仅让读者会用ChatGPT,更尝试让读者意识到自己需要构建一个完整的学习体系,同时本书提供构建这个学习体系的方法。有了这个学习体系,才能真正用好ChatGPT,也不止能用好ChatGPT。读者能够根据自己的需求,用好ChatGPT,既不停计算机22.5万字 - 会员
智能计算系统:从深度学习到大模型
本书由中科院计算所、软件所的专家学者倾心写就,以“图像风格迁移”应用为例,全面介绍智能计算系统的软硬件技术栈。第2版以大模型为牵引进行更新,第1章回顾人工智能、智能计算系统的发展历程,第2、3章在介绍深度学习算法知识的基础上增加了大模型算法的相关知识,第4章介绍深度学习编程框架PyTorch的发展历程、基本概念、编程模型和使用方法,第5章介绍编程框架的工作原理,第6章回顾深度学习所用的处理器结构从计算机34.9万字 - 会员
ChatGLM3大模型本地化部署、应用开发与微调
《ChatGLM3大模型本地化部署、应用开发与微调》作为《PyTorch2.0深度学习从零开始学》的姊妹篇,专注于大模型的本地化部署、应用开发以及微调等。《ChatGLM3大模型本地化部署、应用开发与微调》不仅系统地阐述了深度学习大模型的核心理论,更注重实践应用,通过丰富的案例和场景,引导读者从理论走向实践,真正领悟和掌握大模型本地化应用的精髓。全书共分13章,全方位、多角度地展示了大模型本地化计算机13万字 - 会员
PyTorch深度学习应用实战
《PyTorch深度学习应用实战》以统计学/数学为出发点,介绍深度学习必备的数理基础,讲解PyTorch的主体架构及最新的模块功能,包括常见算法与相关套件的使用方法,例如对象侦测、生成对抗网络、深度伪造、图像中的文字辨识、脸部辨识、BERT/Transformer、聊天机器人、强化学习、自动语音识别、知识图谱等。本书配有大量案例及图表说明,同时以程序设计取代定理证明,缩短学习过程,增加学习乐趣。计算机15.2万字 - 会员
ChatGPT漫谈
本书深度探讨了构建和训练ChatGPT模型涉及的核心技术,以及ChatGPT在各种实际应用中的作用。全书精心划分为三部分,其中第1章为第1部分,第2章为第2部分,第3章和第4章为第3部分。首先,详细阐述了机器学习的历史演变与各种学习范式,同时也揭示了在人工智能生成内容(AIGC)领域下,图像处理和自然语言处理技术的历史发展趋势;接下来,对ChatGPT的运行机制和关键算法进行深度解析,包括大规模模计算机10.8万字 - 会员
Python视觉分析应用案例实战
本书以Python3.10.7为平台,以实际应用为背景,通过概念、公式、经典应用相结合的形式,深入浅出地介绍了Python图形图像处理经典实现。全书共10章,主要包括绪论、迈进Python、Python图形用户界面、数据可视化分析、图像视觉增强分析、图像视觉复原分析、图像视觉几何变换与校正分析、图像视觉分割技术分析、图像视觉描述与特征提取分析、车牌识别分析等内容。通过本书的学习,读者可领略到Py计算机12.3万字 - 会员
破解深度学习(基础篇):模型算法与实现
本书旨在采用一种符合读者认知角度且能提升其学习效率的方式来讲解深度学习背后的基础知识。本书总计9章,深入浅出地介绍了深度学习的理论与算法基础,从理论到实战全方位展开。前三章旨在帮助读者快速入门,介绍了必要的数学概念和必备工具的用法。后六章沿着深度学习的发展脉络,从最简单的多层感知机开始,讲解了深度神经网络的基本原理、常见挑战、优化算法,以及三大典型模型(基础卷积神经网络、基础循环神经网络和注意力神计算机14.8万字 - 会员
GPT图解:大模型是怎样构建的
人工智能(AI),尤其是生成式语言模型和生成式人工智能(AIGC)模型,正以惊人的速度改变着我们的世界。驾驭这股潮流的关键,莫过于探究自然语言处理(NLP)技术的深奥秘境。本书将带领读者踏上一段扣人心弦的探索之旅,让其亲身感受,并动手搭建语言模型。本书主要内容包括N-Gram,词袋模型(BoW),Word2Vec(W2V),神经概率语言模型(NPLM),循环神经网络(RNN),Seq2Seq(S2计算机14万字 - 会员
一本书读懂大模型:技术创新、商业应用与产业变革
这是一本人人都能读懂的大模型综合指南,既是一本大模型的科普书,又是一本大模型的商业书。由中国电信研究院天翼智库官方出版,从核心技术、基础设施、商业应用、产业体系、安全治理5个维度全面讲解了大模型。语言上通俗易懂,内容上深入浅出,呈现上图文并茂,给读者良好阅读体验的同时,让读者对大模型的理解事半功倍!无论你是AI工程师,还是完全没有IT技术背景的爱好者;无论你是一线的从业人员,还是企业的管理者和决策计算机13.2万字
同类书籍最近更新