"深度学习”标签的书籍

内容简介

《深度学习》由全球知名的三位专家Ian Goodfellow、Yoshua Bengio 和Aaron Courville撰写，是深度学习领域奠基性的经典教材。全书的内容包括3个部分：第1部分介绍基本的数学工具和机器学习的概念，它们是深度学习的预备知识；第2部分系统深入地讲解现今已成熟的深度学习方法和技术；第3部分讨论某些具有前瞻性的方向和想法，它们被公认为是深度学习未来的研究重点。

《深度学习》适合各类读者阅读，包括相关专业的大学生或研究生，以及不具有机器学习或统计背景、但是想要快速补充深度学习知识，以便在实际产品或平台中应用的软件工程师。

作者简介

作者简介
Ian Goodfellow，谷歌公司(Google) 的研究科学家，2014 年蒙特利尔大学机器学习博士。他的研究兴趣涵盖大多数深度学习主题，特别是生成模型以及机器学习的安全和隐私。Ian Goodfellow 在研究对抗样本方面是一位有影响力的早期研究者，他发明了生成式对抗网络，在深度学习领域贡献卓越。
Yoshua Bengio，蒙特利尔大学计算机科学与运筹学系(DIRO) 的教授，蒙特利尔学习算法研究所(MILA) 的负责人，CIFAR 项目的共同负责人，加拿大统计学习算法研究主席。Yoshua Bengio 的主要研究目标是了解产生智力的学习原则。他还教授“机器学习”研究生课程(IFT6266)，并培养了一大批研究生和博士后。
Aaron Courville，蒙特利尔大学计算机科学与运筹学系的助理教授，也是LISA 实验室的成员。目前他的研究兴趣集中在发展深度学习模型和方法，特别是开发概率模型和新颖的推断方法。Aaron Courville 主要专注于计算机视觉应用，在其他领域，如自然语言处理、音频信号处理、语音理解和其他AI 相关任务方面也有所研究。

中文版审校者简介
张志华，北京大学数学科学学院统计学教授，北京大学大数据研究中心和北京大数据研究院数据科学教授，主要从事机器学习和应用统计学的教学与研究工作。

译者简介
赵申剑，上海交通大学计算机系硕士研究生，研究方向为数值优化和自然语言处理。
黎彧君，上海交通大学计算机系博士研究生，研究方向为数值优化和强化学习。
符天凡，上海交通大学计算机系硕士研究生，研究方向为贝叶斯推断。
李凯，上海交通大学计算机系博士研究生，研究方向为博弈论和强化学习。

中文版致谢
英文原书致谢
数学符号
第1章引言
1.1 本书面向的读者
1.2 深度学习的历史趋势
第1部分应用数学与机器学习基础
第2章线性代数
2.1 标量、向量、矩阵和张量
2.2 矩阵和向量相乘
2.3 单位矩阵和逆矩阵
2.4 线性相关和生成子空间
2.5 范数
2.6 特殊类型的矩阵和向量
2.7 特征分解
2.8 奇异值分解
2.9 Moore-Penrose伪逆
2.10 迹运算
2.11 行列式
2.12 实例：主成分分析
第3章概率与信息论
3.1 为什么要使用概率
3.2 随机变量
3.3 概率分布
3.4 边缘概率
3.5 条件概率
3.6 条件概率的链式法则
3.7 独立性和条件独立性
3.8 期望、方差和协方差
3.9 常用概率分布
3.10 常用函数的有用性质
3.11 贝叶斯规则
3.12 连续型变量的技术细节
3.13 信息论
3.14 结构化概率模型
第4章数值计算
4.1 上溢和下溢
4.2 病态条件
4.3 基于梯度的优化方法
4.4 约束优化
4.5 实例：线性最小二乘
第5章机器学习基础
5.1 学习算法
5.2 容量、过拟合和欠拟合
5.3 超参数和验证集
5.4 估计、偏差和方差
5.5 最大似然估计
5.6 贝叶斯统计
5.7 监督学习算法
5.8 无监督学习算法
5.9 随机梯度下降
5.10 构建机器学习算法
5.11 促使深度学习发展的挑战
第2部分深度网络：现代实践
第6章深度前馈网络
6.1 实例：学习XOR
6.2 基于梯度的学习
6.3 隐藏单元
6.4 架构设计
6.5 反向传播和其他的微分算法
6.6 历史小记
第7章深度学习中的正则化
7.1 参数范数惩罚
7.2 作为约束的范数惩罚
7.3 正则化和欠约束问题
7.4 数据集增强
7.5 噪声鲁棒性
7.6 半监督学习
7.7 多任务学习
7.8 提前终止
7.9 参数绑定和参数共享
7.10 稀疏表示
7.11 Bagging和其他集成方法
7.12 Dropout
7.13 对抗训练
7.14 切面距离、正切传播和流形正切分类器
第8章深度模型中的优化
8.1 学习和纯优化有什么不同
8.2 神经网络优化中的挑战
8.3 基本算法
8.4 参数初始化策略
8.5 自适应学习率算法
8.6 二阶近似方法
8.7 优化策略和元算法
第9章卷积网络
9.1 卷积运算
9.2 动机
9.3 池化
9.4 卷积与池化作为一种无限强的先验
9.5 基本卷积函数的变体
9.6 结构化输出
9.7 数据类型
9.8 高效的卷积算法
9.9 随机或无监督的特征
9.10 卷积网络的神经科学基础
9.11 卷积网络与深度学习的历史
第10章序列建模：循环和递归网络
10.1 展开计算图
10.2 循环神经网络
10.3 双向RNN
10.4 基于编码-解码的序列到序列架构
10.5 深度循环网络
10.6 递归神经网络
10.7 长期依赖的挑战
10.8 回声状态网络
10.9 渗漏单元和其他多时间尺度的策略
10.10 长短期记忆和其他门控RNN
10.11 优化长期依赖
10.12 外显记忆
第11章实践方法论
11.1 性能度量
11.2 默认的基准模型
11.3 决定是否收集更多数据
11.4 选择超参数
11.5 调试策略
11.6 示例：多位数字识别
第12章应用
12.1 大规模深度学习
12.2 计算机视觉
12.3 语音识别
12.4 自然语言处理
12.5 其他应用
第3部分深度学习研究
第13章线性因子模型
13.1 概率PCA和因子分析
13.2 独立成分分析
13.3 慢特征分析
13.4 稀疏编码
13.5 PCA的流形解释
第14章自编码器
14.1 欠完备自编码器
14.2 正则自编码器
14.3 表示能力、层的大小和深度
14.4 随机编码器和解码器
14.5 去噪自编码器详解
14.6 使用自编码器学习流形
14.7 收缩自编码器
14.8 预测稀疏分解
14.9 自编码器的应用
第15章表示学习
15.1 贪心逐层无监督预训练
15.2 迁移学习和领域自适应
15.3 半监督解释因果关系
15.4 分布式表示
15.5 得益于深度的指数增益
15.6 提供发现潜在原因的线索
第16章深度学习中的结构化概率模型
16.1 非结构化建模的挑战
16.2 使用图描述模型结构
16.3 从图模型中采样
16.4 结构化建模的优势
16.5 学习依赖关系
16.6 推断和近似推断
16.7 结构化概率模型的深度学习方法
第17章蒙特卡罗方法
17.1 采样和蒙特卡罗方法
17.2 重要采样
17.3 马尔可夫链蒙特卡罗方法
17.4 Gibbs采样
17.5 不同的峰值之间的混合挑战
第18章直面配分函数
18.1 对数似然梯度
18.2 随机最大似然和对比散度
18.3 伪似然
18.4 得分匹配和比率匹配
18.5 去噪得分匹配
18.6 噪声对比估计
18.7 估计配分函数
第19章近似推断
19.1 把推断视作优化问题
19.2 期望最大化
19.3 最大后验推断和稀疏编码
19.4 变分推断和变分学习
19.5 学成近似推断
第20章深度生成模型
20.1 玻尔兹曼机
20.2 受限玻尔兹曼机
20.3 深度信念网络
20.4 深度玻尔兹曼机
20.5 实值数据上的玻尔兹曼机
20.6 卷积玻尔兹曼机
20.7 用于结构化或序列输出的玻尔兹曼机
20.8 其他玻尔兹曼机
20.9 通过随机操作的反向传播
20.10 有向生成网络
20.11 从自编码器采样
20.12 生成随机网络
20.13 其他生成方案
20.14 评估生成模型
20.15 结论
参考文献
索引

从零开始大模型开发与微调：基于PyTorch与ChatGLM

内容简介

大模型是深度学习自然语言处理皇冠上的一颗明珠，也是当前AI和NLP研究与产业中最重要的方向之一。本书使用PyTorch 2.0作为学习大模型的基本框架，以ChatGLM为例详细讲解大模型的基本理论、算法、程序实现、应用实战以及微调技术，为读者揭示大模型开发技术。本书配套示例源代码、PPT课件。

《从零开始大模型开发与微调：基于PyTorch与ChatGLM》共18章，内容包括人工智能与大模型、PyTorch 2.0深度学习环境搭建、从零开始学习PyTorch 2.0、深度学习基础算法详解、基于PyTorch卷积层的MNIST分类实战、PyTorch数据处理与模型展示、ResNet实战、有趣的词嵌入、基于PyTorch循环神经网络的中文情感分类实战、自然语言处理的编码器、预训练模型BERT、自然语言处理的解码器、强化学习实战、只具有解码器的GPT-2模型、实战训练自己的ChatGPT、开源大模型ChatGLM使用详解、ChatGLM高级定制化应用实战、对ChatGLM进行高级微调。

《从零开始大模型开发与微调：基于PyTorch与ChatGLM》适合PyTorch深度学习初学者、大模型开发初学者、大模型开发人员学习，也适合高等院校人工智能、智能科学与技术、数据科学与大数据技术、计算机科学与技术等专业的师生作为教学参考书。

作者简介

王晓华，高校计算机专业讲师，研究方向为云计算、大数据与人工智能。著有《PyTorch 2.0深度学习从零开始学》《Python机器学习与可视化分析实战》《谷歌JAX深度学习从零开始学》《Spark 3.0大数据分析与挖掘：基于机器学习》《TensorFlow深度学习应用实践》《OpenCV+TensorFlow深度学习与计算机视觉实战》《TensorFlow知识图谱实战》《TensorFlow人脸识别实战》《TensorFlow语音识别实战》《TensorFlow+Keras自然语言处理实战》《TensorFlow 2.0卷积神经网络实战》《Keras实战：基于TensorFlow2.2的深度学习实践》《TensorFlow 2.0深度学习从零开始学》《深度学习的数学原理与实现》。

1.1 人工智能：思维与实践的融合 1
- 1.1.1 人工智能的历史与未来 2
- 1.1.2 深度学习与人工智能 2
- 1.1.3 选择PyTorch 2.0实战框架 3
1.2 大模型开启人工智能的新时代 4
- 1.2.1 大模型带来的变革 4
- 1.2.2 最强的中文大模型—清华大学ChatGLM介绍 5
- 1.2.3 近在咫尺的未来—大模型的应用前景 6
1.3 本章小结 7

第2章 PyTorch 2.0深度学习环境搭建 8

2.1 环境搭建1：安装Python 8
- 2.1.1 Miniconda的下载与安装 8
- 2.1.2 PyCharm的下载与安装 11
- 2.1.3 Python代码小练习：计算Softmax函数 14
2.2 环境搭建2：安装PyTorch 2.0 15
- 2.2.1 Nvidia 10/20/30/40系列显卡选择的GPU版本 15
- 2.2.2 PyTorch 2.0 GPU Nvidia运行库的安装 15
- 2.2.3 PyTorch 2.0小练习：Hello PyTorch 18
2.3 生成式模型实战：古诗词的生成 18
2.4 图像降噪：手把手实战第一个深度学习模型 19
- 2.4.1 MNIST数据集的准备 19
- 2.4.2 MNIST数据集的特征和标签介绍 21
- 2.4.3 模型的准备和介绍 22
- 2.4.4 对目标的逼近—模型的损失函数与优化函数 24
- 2.4.5 基于深度学习的模型训练 24
2.5 本章小结 26

第3章从零开始学习PyTorch 2.0 27

3.1 实战MNIST手写体识别 27
- 3.1.1 数据图像的获取与标签的说明 27
- 3.1.2 实战基于PyTorch 2.0的手写体识别模型 29
- 3.1.3 基于Netron库的PyTorch 2.0模型可视化 32
3.2 自定义神经网络框架的基本设计 34
- 3.2.1 神经网络框架的抽象实现 34
- 3.2.2 自定义神经网络框架的具体实现 35
3.3 本章小结 43

第4章一学就会的深度学习基础算法详解 44

4.1 反向传播神经网络的前身历史 44
4.2 反向传播神经网络两个基础算法详解 47
- 4.2.1 最小二乘法详解 48
- 4.2.2 梯度下降算法 50
- 4.2.3 最小二乘法的梯度下降算法及其Python实现 52
4.3 反馈神经网络反向传播算法介绍 58
- 4.3.1 深度学习基础 58
- 4.3.2 链式求导法则 59
- 4.3.3 反馈神经网络的原理与公式推导 60
- 4.3.4 反馈神经网络原理的激活函数 64
- 4.3.5 反馈神经网络原理的Python实现 66
4.4 本章小结 70

第5章基于PyTorch卷积层的MNIST分类实战 71

5.1 卷积运算的基本概念 71
- 5.1.1 基本卷积运算示例 72
- 5.1.2 PyTorch中的卷积函数实现详解 73
- 5.1.3 池化运算 75
- 5.1.4 Softmax激活函数 77
- 5.1.5 卷积神经网络的原理 78
5.2 实战：基于卷积的MNIST手写体分类 80
- 5.2.1 数据的准备 80
- 5.2.2 模型的设计 81
- 5.2.3 基于卷积的MNIST分类模型 82
5.3 PyTorch的深度可分离膨胀卷积详解 84
- 5.3.1 深度可分离卷积的定义 84
- 5.3.2 深度的定义以及不同计算层待训练参数的比较 86
- 5.3.3 膨胀卷积详解 87
- 5.3.4 实战：基于深度可分离膨胀卷积的MNIST手写体识别 87
5.4 本章小结 90

第6章可视化的PyTorch数据处理与模型展示 91

6.1 用于自定义数据集的torch.utils.data工具箱使用详解 92
- 6.1.1 使用torch.utils.data. Dataset封装自定义数据集 92
- 6.1.2 改变数据类型的Dataset类中的transform的使用 93
- 6.1.3 批量输出数据的DataLoader类详解 98
6.2 实战：基于tensorboardX的训练可视化展示 100
- 6.2.1 可视化组件tensorboardX的简介与安装 100
- 6.2.2 tensorboardX可视化组件的使用 100
- 6.2.3 tensorboardX对模型训练过程的展示 103
6.3 本章小结 105

第7章 ResNet实战 106

7.1 ResNet基础原理与程序设计基础 106
- 7.1.1 ResNet诞生的背景 107
- 7.1.2 PyTorch 2.0中的模块工具 109
- 7.1.3 ResNet残差模块的实现 110
- 7.1.4 ResNet网络的实现 112
7.2 ResNet实战：CIFAR-10数据集分类 114
- 7.2.1 CIFAR-10数据集简介 114
- 7.2.2 基于ResNet的CIFAR-10数据集分类 117
7.3 本章小结 118

第8章有趣的词嵌入 120

8.1 文本数据处理 120
- 8.1.1 Ag_news数据集介绍和数据清洗 120
- 8.1.2 停用词的使用 123
- 8.1.3 词向量训练模型Word2Vec使用介绍 125
- 8.1.4 文本主题的提取：基于TF-IDF 128
- 8.1.5 文本主题的提取：基于TextRank 132
8.2 更多的词嵌入方法—FastText和预训练词向量 134
- 8.2.1 FastText的原理与基础算法 135
- 8.2.2 FastText训练及其与PyTorch 2.0的协同使用 136
- 8.2.3 使用其他预训练参数来生成PyTorch 2.0词嵌入矩阵（中文） 140
8.3 针对文本的卷积神经网络模型简介—字符卷积 141
- 8.3.1 字符（非单词）文本的处理 141
- 8.3.2 卷积神经网络文本分类模型的实现—Conv1d（一维卷积） 148
8.4 针对文本的卷积神经网络模型简介—词卷积 151
- 8.4.1 单词的文本处理 151
- 8.4.2 卷积神经网络文本分类模型的实现—Conv2d（二维卷积） 153
8.5 使用卷积对文本分类的补充内容 155
- 8.5.1 汉字的文本处理 155
- 8.5.2 其他细节 157
8.6 本章小结 158

第9章基于循环神经网络的中文情感分类实战 160

9.1 实战：循环神经网络与情感分类 160
9.2 循环神经网络理论讲解 165
- 9.2.1 什么是GRU 165
- 9.2.2 单向不行，那就双向 167
9.3 本章小结 168

第10章从零开始学习自然语言处理的编码器 169

10.1 编码器的核心—注意力模型 170
- 10.1.1 输入层—初始词向量层和位置编码器层 170
- 10.1.2 自注意力层 172
- 10.1.3 ticks和Layer Normalization 177
- 10.1.4 多头注意力 178
10.2 编码器的实现 180
- 10.2.1 前馈层的实现 181
- 10.2.2 编码器的实现 182
10.3 实战编码器：拼音汉字转化模型 184
- 10.3.1 汉字拼音数据集处理 185
- 10.3.2 汉字拼音转化模型的确定 187
- 10.3.3 模型训练部分的编写 190
10.4 本章小结 191

第11章站在巨人肩膀上的预训练模型BERT 193

11.1 预训练模型BERT 193
- 11.1.1 BERT的基本架构与应用 194
- 11.1.2 BERT预训练任务与微调 195
11.2 实战BERT：中文文本分类 198
- 11.2.1 使用Hugging Face获取BERT预训练模型 198
- 11.2.2 BERT实战文本分类 200
11.3 更多的预训练模型 203
11.4 本章小结 205

第12章从1开始自然语言处理的解码器 206

12.1 解码器的核心—注意力模型 206
- 12.1.1 解码器的输入和交互注意力层的掩码 207
- 12.1.2 为什么通过掩码操作能够减少干扰 212
- 12.1.3 解码器的输出（移位训练方法） 213
- 12.1.4 解码器的实现 214
12.2 解码器实战—拼音汉字翻译模型 215
- 12.2.1 数据集的获取与处理 216
- 12.2.2 翻译模型 218
- 12.2.3 拼音汉字模型的训练 229
- 12.2.4 拼音汉字模型的使用 230
12.3 本章小结 231

第13章基于PyTorch 2.0的强化学习实战 232

13.1 基于强化学习的火箭回收实战 232
- 13.1.1 火箭回收基本运行环境介绍 233
- 13.1.2 火箭回收参数介绍 234
- 13.1.3 基于强化学习的火箭回收实战 234
- 13.1.4 强化学习的基本内容 239
13.2 强化学习的基本算法—PPO算法 243
- 13.2.1 PPO算法简介 243
- 13.2.2 函数使用说明 244
- 13.2.3 一学就会的TD-error理论介绍 245
- 13.2.4 基于TD-error的结果修正 247
- 13.2.5 对于奖励的倒序构成的说明 248
13.3 本章小结 249

第14章 ChatGPT前身—只具有解码器的GPT-2模型 250

14.1 GPT-2模型简介 250
- 14.1.1 GPT-2模型的输入和输出结构—自回归性 251
- 14.1.2 GPT-2模型的PyTorch实现 252
- 14.1.3 GPT-2模型输入输出格式的实现 257
14.2 Hugging Face GPT-2模型源码模型详解 259
- 14.2.1 GPT2LMHeadModel类和GPT2Model类详解 259
- 14.2.2 Block类详解 270
- 14.2.3 Attention类详解 274
- 14.2.4 MLP类详解 281
14.3 Hugging Face GPT-2模型的使用与自定义微调 282
- 14.3.1 模型的使用与自定义数据集的微调 282
- 14.3.2 基于预训练模型的评论描述微调 285
14.4 自定义模型的输出 286
- 14.4.1 GPT输出的结构 286
- 14.4.2 创造性参数temperature与采样个数topK 288
14.5 本章小结 290

第15章实战训练自己的ChatGPT 291

15.1 什么是ChatGPT 291
15.2 RLHF模型简介 293
- 15.2.1 RLHF技术分解 293
- 15.2.2 RLHF中的具体实现—PPO算法 296
15.3 基于RLHF实战的ChatGPT正向评论的生成 297
- 15.3.1 RLHF模型进化的总体讲解 297
- 15.3.2 ChatGPT评分模块简介 298
- 15.3.3 带有评分函数的ChatGPT模型的构建 300
- 15.3.4 RLHF中的PPO算法—KL散度 301
- 15.3.5 RLHF中的PPO算法—损失函数 303
15.4 本章小结 304

第16章开源大模型ChatGLM使用详解 305

16.1 为什么要使用大模型 305
- 16.1.1 大模型与普通模型的区别 306
- 16.1.2 一个神奇的现象—大模型的涌现能力 307
16.2 ChatGLM使用详解 307
- 16.2.1 ChatGLM简介及应用前景 308
- 16.2.2 下载ChatGLM 309
- 16.2.3 ChatGLM的使用与Prompt介绍 310
16.3 本章小结 311

第17章开源大模型ChatGLM 高级定制化应用实战 312

17.1 医疗问答GLMQABot搭建实战—基于ChatGLM搭建专业客服问答机器人 312
- 17.1.1 基于ChatGLM搭建专业领域问答机器人的思路 313
- 17.1.2 基于真实医疗问答的数据准备 314
- 17.1.3 文本相关性（相似度）的比较算法 315
- 17.1.4 提示语句Prompt的构建 316
- 17.1.5 基于单个文档的GLMQABot的搭建 316
17.2 金融信息抽取实战—基于知识链的ChatGLM本地化知识库检索与智能答案生成 318
- 17.2.1 基于ChatGLM搭建智能答案生成机器人的思路 319
- 17.2.2 获取专业（范畴内）文档与编码存储 320
- 17.2.3 查询文本编码的相关性比较与排序 322
- 17.2.4 基于知识链的ChatGLM本地化知识库检索与智能答案生成 325
17.3 基于ChatGLM的一些补充内容 327
- 17.3.1 语言的艺术—Prompt的前世今生 328
- 17.3.2 清华大学推荐的ChatGLM微调方法 329
- 17.3.2 一种新的基于ChatGLM的文本检索方案 330
17.4 本章小结 331

第18章对训练成本上亿美元的ChatGLM进行高级微调 332

18.1 ChatGLM模型的本地化处理 332
- 18.1.1 下载ChatGLM源码与合并存档 332
- 18.1.2 修正自定义的本地化模型 335
- 18.1.3 构建GLM模型的输入输出示例 337
18.2 高级微调方法1—基于加速库Accelerator的全量数据微调 339
- 18.2.1 数据的准备—将文本内容转化成三元组的知识图谱 339
- 18.2.2 加速的秘密—Accelerate模型加速工具详解 342
- 18.2.3 更快的速度—使用INT8（INT4）量化模型加速训练 345
18.3 高级微调方法2—基于LoRA的模型微调 348
- 18.3.1 对ChatGLM进行微调的方法—LoRA 348
- 18.3.2 自定义LoRA的使用方法 349
- 18.3.3 基于自定义LoRA的模型训练 350
- 18.3.4 基于自定义LoRA的模型推断 352
- 18.3.5 基于基本原理的LoRA实现 355
18.4 高级微调方法3—基于Huggingface的PEFT模型微调 357
- 18.4.1 PEFT技术详解 358
- 18.4.2 PEFT的使用与参数设计 359
- 18.4.3 Huggingface专用PEFT的使用 360
18.5 本章小结 362

LangChain入门指南：构建高可复用、可扩展的LLM应用程序

内容简介 · · · · · ·

这本书专门为那些对自然语言处理技术感兴趣的读者提供了系统的LLM应用开发指南。全书分为11章，从LLM基础知识开始，通过LangChain这个开源框架为读者解读整个LLM应用开发流程。第1~2章概述LLM技术的发展背景和LangChain框架的设计理念。从第3章开始，分章深入介绍LangChain的6大模块，包括模型I/O、数据增强、链、记忆等，通过大量代码示例让读者了解其原理和用法。第9章通过构建PDF问答程序，帮助读者将之前学习的知识应用于实践。第10章则介绍集成，可拓宽LangChain的用途。第11章为初学者简要解析LLM的基础理论，如Transformer模型等。

《LangChain入门指南：构建高可复用、可扩展的LLM应用程序》以LangChain这个让人熟悉的框架为主线，引导读者一步一步掌握LLM应用开发流程，适合对大语言模型感兴趣的开发者、AI应用程序开发者阅读。

作者简介 · · · · · ·

李特丽，LangChain中文网联合创始人，优秀的软件工程师。曾翻译LangChain、OpenAi、Milvus等AI开发三件套的中文文档，帮助中国开发者快速上手AI开发。
康轶文，LangChain中文网创始人，2005年从个人站长做起，成为第一代SEO“大神”；2012年转型移动互联网营销，成为中国Apple Ads代理商，获得苹果千万美元授信；2022年转型月付制AI数字员工全托管服务，是一位经验丰富的数字员工和人工智能应用专家。

目录 · · · · · ·

第1 章 LangChain：开启大语言模型时代的钥匙
- 1.1 大语言模型概述
  - 1.1.1 什么是大语言模型
  - 1.1.2 大语言模型的发展
  - 1.1.3 大语言模型的应用场景
  - 1.1.4 大语言模型的基础知识
- 1.2 LangChain 与大语言模型
第2 章 LangChain 入门指南
- 2.1 初识LangChain
  - 2.1.1 为什么需要LangChain
  - 2.1.2 LLM 应用开发的最后1 公里
  - 2.1.3 LangChain 的2 个关键词
  - 2.1.4 LangChain 的3 个场景
  - 2.1.5 LangChain 的6 大模块
- 2.2 LangChain 的开发流程
  - 2.2.1 开发密钥指南
  - 2.2.2 编写一个取名程序
  - 2.2.3 创建你的第一个聊天机器人
- 2.3 LangChain 表达式
第3 章模型I/O
- 3.1 什么是模型I/O
- 3.2 模型I/O 功能之模型包装器
  - 3.2.1 模型包装器分类
  - 3.2.2 LLM 模型包装器
  - 3.2.3 聊天模型包装器
- 3.3 模型I/O 功能之提示词模板
  - 3.3.1 什么是提示词模板
  - 3.3.2 提示词模板的输入和输出
  - 3.3.3 使用提示词模板构造提示词
  - 3.3.4 少样本提示词模板
  - 3.3.5 多功能提示词模板
- 3.4 模型I/O 功能之输出解析器
  - 3.4.1 输出解析器的功能
  - 3.4.2 输出解析器的使用
  - 3.4.3 Pydantic JSON 输出解析器
  - 3.4.4 结构化输出解析器
第4 章数据增强模块
- 4.1 数据增强模块的相关概念
  - 4.1.1 LEDVR 工作流
  - 4.1.2 数据类型
- 4.2 加载器
- 4.3 嵌入模型包装器
  - 4.3.1 嵌入模型包装器的使用
  - 4.3.2 嵌入模型包装器的类型
- 4.4 文档转换器
- 4.5 向量存储库
  - 4.5.1 向量存储库的使用
  - 4.5.2 向量存储库的搜索方法
- 4.6 检索器
  - 4.6.1 检索器的使用
  - 4.6.2 检索器的类型
第5 章链
- 5.1 为什么叫链
  - 5.1.1 链的定义
  - 5.1.2 链的使用
  - 5.1.3 基础链类型
  - 5.1.4 工具链类型
- 5.2 细说基础链
  - 5.2.1 LLM 链
  - 5.2.2 路由器链
  - 5.2.3 顺序链
- 5.3 四大合并文档链
  - 5.3.1 Stuff 链
  - 5.3.2 Refine 链
  - 5.3.3 MapReduce 链
  - 5.3.4 重排链
- 5.4 揭秘链的复杂性
  - 5.4.1 复杂链的“套娃”式设计
  - 5.4.2 LEDVR 工作流的终点：“上链”
第6 章记忆模块
- 6.1 记忆模块概述
  - 6.1.1 记忆组件的定义
  - 6.1.2 记忆组件、链组件和Agent 组件的关系
  - 6.1.3 设置第一个记忆组件
  - 6.1.4 内置记忆组件
  - 6.1.5 自定义记忆组件
- 6.2 记忆增强检索能力的实践
  - 6.2.1 获取外部数据
  - 6.2.2 加入记忆组件
- 6.3 记忆增强Agent 能力的实践
- 6.4 内置记忆组件的对比
  - 6.4.1 总结记忆组件
  - 6.4.2 会话记忆组件和会话窗口记忆组件的对比
  - 6.4.3 知识图谱记忆组件和实体记忆组件的比较
第7 章 Agent 模块
- 7.1 Agent 模块概述
  - 7.1.1 Agent 组件的定义
  - 7.1.2 Agent 组件的运行机制
  - 7.1.3 Agent 组件入门示例
  - 7.1.4 Agent 组件的类型
- 7.2 Agent 组件的应用
  - 7.2.1 Agent 组件的多功能性
  - 7.2.2 自定义Agent 组件
  - 7.2.3 ReAct Agent 的实践
- 7.3 工具组件和工具包组件
  - 7.3.1 工具组件的类型
  - 7.3.2 工具包组件的类型
- 7.4 Agent 组件的功能增强
  - 7.4.1 Agent 组件的记忆功能增强
  - 7.4.2 Agent 组件的检索能力增强
第8 章回调处理器
- 8.1 什么是回调处理器
  - 8.1.1 回调处理器的工作流程
  - 8.1.2 回调处理器的使用
  - 8.1.3 自定义链组件中的回调
- 8.2 内置回调处理器
- 8.3 自定义回调处理器
第9 章使用LangChain 构建应用程序
- 9.1 PDF 问答程序
  - 9.1.1 程序流程
  - 9.1.2 处理PDF 文档
  - 9.1.3 创建问答链
- 9.2 对话式表单
  - 9.2.1 OpenAI 函数的标记链
  - 9.2.2 标记链的使用
  - 9.2.3 创建提示词模板
  - 9.2.4 数据更新和检查
- 9.3 使用LangChain 实现BabyAGI
  - 9.3.1 BabyAGI 介绍
  - 9.3.2 环境与工具
  - 9.3.3 向量存储
  - 9.3.4 构建任务链
  - 9.3.5 创建BabyAGI
  - 9.3.6 运行BabyAGI
第10 章集成
- 10.1 集成的背景与LLM 集成
- 10.2 LLM 集成指南
  - 10.2.1 Azure OpenAI 集成
  - 10.2.2 Hugging Face Hub 集成
- 10.3 聊天模型集成指南
  - 10.3.1 Anthropic 聊天模型集成
  - 10.3.2 PaLM 2 聊天模型集成
  - 10.3.3 OpenAI 聊天模型集成
- 10.4 向量库集成指南
  - 10.4.1 Chroma 集成
  - 10.4.2 Pinecone 集成
  - 10.4.3 Milvus 集成
- 10.5 嵌入模型集成指南
  - 10.5.1 HuggingFaceEmbeddings 嵌入集成
  - 10.5.2 LlamaCppEmbeddings 嵌入集成
  - 10.5.3 Cohere 嵌入集成
- 10.6 Agent toolkits 集成指南
  - 10.6.1 CSV Agent 的集成
  - 10.6.2 Pandas Dataframe Agent 的集成
  - 10.6.3 PowerBI Dataset Agent 的集成
- 10.7 Retrievers 集成指南
  - 10.7.1 WikipediaRetriever 集成
  - 10.7.2 ArxivRetriever 集成
  - 10.7.3 Azure Cognitive Search 集成
第11 章 LLM 应用开发必学知识
- 11.1 LLM 的核心知识
  - 11.1.1 文本嵌入
  - 11.1.2 点积相似性和余弦相似性
  - 11.1.3 注意力机制
- 11.2 Transformer 模型
- 11.3 语义搜索
  - 11.3.1 语义搜索的工作原理
  - 11.3.2 RAG 的工作原理
- 11.4 NLP 与机器学习基础
  - 11.4.1 LLM 应用开发中的传统机器学习方法
  - 11.4.2 NLP 文本预处理
  - 11.4.3 构建分类器
附录A LangChain 框架中的主要类
附录B OpenAI 平台和模型介绍
附录C Claude 2 模型介绍
附录D Cohere 模型介绍
附录E PaLM 2 模型介绍
附录F Pinecone 向量数据库介绍
附录G Milvus 向量数据库介绍

深度学习框架PyTorch：入门与实践

内容简介

《深度学习框架PyTorch：入门与实践》从多维数组Tensor开始，循序渐进地带领读者了解PyTorch各方面的基础知识。结合基础知识和前沿研究，带领读者从零开始完成几个经典有趣的深度学习小项目，包括GAN生成动漫头像、AI滤镜、AI写诗等。《深度学习框架PyTorch：入门与实践》没有简单机械地介绍各个函数接口的使用，而是尝试分门别类、循序渐进地向读者介绍PyTorch的知识，希望读者对PyTorch有一个完整的认识。

《深度学习框架PyTorch：入门与实践》内容由浅入深，无论是深度学习的初学者，还是第一次接触PyTorch的研究人员，都能在学习本书的过程中快速掌握PyTorch。即使是有一定PyTorch使用经验的用户，也能够从本书中获得对PyTorch不一样的理解。

作者简介

陈云
Python程序员、Linux爱好者和PyTorch源码贡献者。主要研究方向包括计算机视觉和机器学习。“2017知乎看山杯机器学习挑战赛”一等奖，“2017天池医疗AI大赛”第八名。热衷于推广PyTorch，并有丰富的使用经验，活跃于PyTorch论坛和知乎相关板块。

PyTorch简介
1. PyTorch的诞生
2. 常见的深度学习框架简介
  1. Theano
  2. TensorFlow
  3. Keras
  4. Caffe/Caffe2
  5. MXNet
  6. CNTK
  7. 其他框架
3. 属于动态图的未来
4. 为什么选择PyTorch
5. 星火燎原
6. fast.ai 放弃Keras+TensorFlow选择PyTorch
快速入门
1. 安装与配置
  1. 安装PyTorch
  2. 学习环境配置
2. PyTorch入门第一步
  1. Tensor
  2. Autograd：自动微分
  3. 神经网络
  4. 小试牛刀：CIFAR-10分类
Tensor和autograd
1. Tensor
  1. 基础操作
  2. Tensor和Numpy
  3. 内部结构
  4. 其他有关Tensor的话题
  5. 小试牛刀：线性回归
2. autograd
  1. Variable
  2. 计算图
  3. 扩展autograd
  4. 小试牛刀：用Variable实现线性回归
神经网络工具箱nn
1. nn.Module
2. 常用的神经网络层
  1. 图像相关层
  2. 激活函数
  3. 循环神经网络层
  4. 损失函数
3. 优化器
4. nn.functional
5. 初始化策略
6. nn.Module深入分析
7. nn和autograd的关系
8. 小试牛刀：用50行代码搭建ResNet
PyTorch中常用的工具
1. 数据处理
2. 计算机视觉工具包：torchvision
3. 可视化工具
  1. Tensorboard
  2. visdom
4. 使用GPU加速：cuda
5. 持久化
PyTorch实战指南
1. 编程实战：猫和狗二分类
  1. 比赛介绍
  2. 文件组织架构
  3. 关于__init__.py
  4. 数据加载
  5. 模型定义
  6. 工具函数
  7. 配置文件
  8. main.py
  9. 使用
  10. 争议
2. PyTorch Debug 指南
  1. ipdb 介绍
  2. 在PyTorch中Debug
AI插画师：生成对抗网络
1. GAN的原理简介
2. 用GAN生成动漫头像
3. 实验结果分析
AI艺术家：神经网络风格迁移
1. 风格迁移原理介绍
2. 用PyTorch实现风格迁移
3. 实验结果分析
AI诗人：用RNN写诗
1. 自然语言处理的基础知识
  1. 词向量
  2. RNN
2. CharRNN
3. 用PyTorch实现CharRNN
4. 实验结果分析
Image Caption：让神经网络看图讲故事
1. 图像描述介绍
2. 数据
  1. 数据介绍
  2. 图像数据处理
  3. 数据加载
3. 模型与训练
4. 实验结果分析
展望与未来
1. PyTorch的局限与发展
2. 使用建议

从零构建大模型算法、训练与微调

内容简介

《从零构建大模型:算法、训练与微调》是一本系统且实用的大模型构建指南，旨在引领读者从基础知识起步，逐步深入探索大模型的算法原理、训练方法及微调技术。《从零构建大模型:算法、训练与微调》共12章，涵盖了Transformer模型的基础理论，如Seq2Seq模型、分词、嵌入层和自注意力机制等关键概念；并深入剖析了GPT模型的核心实现与文本生成过程，以及BERT模型的预训练和微调技术。同时，也对ViT（视觉Transformer）模型的架构、训练方法，以及高阶微调策略如Adapter Tuning和P-Tuning进行了详尽讲解。此外，还系统地介绍了数据处理、数据增强、模型性能优化（包括混合精度训练和分布式训练）、对比学习、对抗训练、自适应优化器、动态学习率调度，以及模型蒸馏与剪枝技术等多个方面。最后，通过应用案例，展示了模型训练和微调的完整流程，助力读者将理论知识转化为实践技能。全书注重理论与实践的结合，适合希望系统掌握大模型构建、训练和优化的研发人员、高校学生，也适合对自然语言处理、计算机视觉等领域的大模型开发有兴趣的读者。还可作为培训机构和高校相关课程的教学用书。

作者简介

梁楠，博士，毕业于北京航空航天大学，高级职称，长期从事模式识别、机器学习、统计理论的研究与应用，负责或参与科研项目多项，专注于人工智能、大语言模型的应用与开发，对深度学习、数据分析与预测等有独到见解。

引言 1
一、大模型技术的发展历史 1
- 1. 基于规则和统计学习的早期阶段 1
- 2. 神经网络与深度学习的崛起 2
- 3. Transformer的诞生与自注意力机制的崛起 2
- 4. 预训练模型的兴起：BERT、GPT和T5 2
- 5. 超大规模模型与多模态应用 3
二、开发环境配置基础 3
- 1. 硬件配置要求 3
- 2. 软件依赖与环境搭建 4
- 3. 常见问题与解决方案 5
第 1 章 Transformer模型基础 6
- 1.1 Seq2Seq模型 6
  - 1.1.1 编码器－解码器工作原理 7
  - 1.1.2 Seq2Seq结构实现 7
- 1.2 分词与嵌入层 11
  - 1.2.1 分词器：将文本转换为嵌入向量 11
  - 1.2.2 PyTorch实现嵌入层（将分词后的结果输入模型） 11
- 1.3 自注意力与多头注意力机制 15
  - 1.3.1 自注意力机制计算过程（QKV矩阵生成和点积运算） 15
  - 1.3.2 多头注意力机制与Transformer 18
- 1.4 残差连接与层归一化 22
  - 1.4.1 残差连接层的实现 22
  - 1.4.2 层归一化与训练稳定性 25
- 1.5 位置编码器 28
  - 1.5.1 位置编码的计算与实现 28
  - 1.5.2 位置编码在无序文本数据中的作用 30
- 1.6 本章小结 35
- 1.7 思考题 35
第 2 章 GPT模型文本生成核心原理与实现 37
- 2.1 GPT-2核心模块 37
  - 2.1.1 层堆叠 37
  - 2.1.2 GPT-2中的注意力机制 41
- 2.2 GPT模型的文本生成过程 44
  - 2.2.1 详解GPT-2文本生成过程 44
  - 2.2.2 Greedy Search和Beam Search算法的实现与对比 47
- 2.3 模型效果评估与调优 51
  - 2.3.1 模型常见评估方法 51
  - 2.3.2 基于困惑度的评估过程 56
- 2.4 本章小结 60
- 2.5 思考题 60
第 3 章 BERT模型核心实现与预训练 62
- 3.1 BERT模型的核心实现 62
  - 3.1.1 编码器堆叠 62
  - 3.1.2 BERT的自注意力机制与掩码任务 67
- 3.2 预训练任务：掩码语言模型（MLM） 71
  - 3.2.1 MLM任务实现过程 71
  - 3.2.2 如何对输入数据进行随机遮掩并预测 72
- 3.3 BERT模型的微调与分类任务应用 77
- 3.4 本章小结 81
- 3.5 思考题 81
第 4 章 ViT模型 83
- 4.1 图像分块与嵌入 83
- 4.2 ViT模型的核心架构实现 89
  - 4.2.1 ViT模型的基础结构 89
  - 4.2.2 自注意力和多头注意力在图像处理中的应用 91
- 4.3 训练与评估ViT模型 96
- 4.4 ViT模型与注意力严格量化分析 100
- 4.5 本章小结 105
- 4.6 思考题 105
第 5 章高阶微调策略：Adapter Tuning与P-Tuning 107
- 5.1 Adapter Tuning的实现 107
- 5.2 LoRA Tuning实现 111
- 5.3 Prompt Tuning与P-Tuning的应用 114
  - 5.3.1 Prompt Tuning 114
  - 5.3.2 P-Tuning 117
  - 5.3.3 Prompt Tuning和P-Tuning组合微调 120
  - 5.3.4 长文本情感分类模型的微调与验证 122
- 5.4 本章小结 125
- 5.5 思考题 125
第 6 章数据处理与数据增强 127
- 6.1 数据预处理与清洗 127
  - 6.1.1 文本数据预处理 127
  - 6.1.2 文本数据清洗 130
- 6.2 文本数据增强 133
  - 6.2.1 同义词替换 133
  - 6.2.2 随机插入 135
  - 6.2.3 其他类型的文本数据增强方法 137
- 6.3 分词与嵌入层的应用 139
  - 6.3.1 深度理解分词技术 140
  - 6.3.2 嵌入向量的生成与优化 142
  - 6.3.3 文本预处理与数据增强综合案例 144
- 6.4 本章小结 146
- 6.5 思考题 147
第 7 章模型性能优化：混合精度训练与分布式训练 148
- 7.1 混合精度训练的实现 148
- 7.2 多GPU并行与分布式训练的实现 150
  - 7.2.1 分布式训练流程与常规配置方案 150
  - 7.2.2 Data Parallel方案 152
  - 7.2.3 Model Parallel方案 154
- 7.3 梯度累积的实现 157
  - 7.3.1 梯度累积初步实现 157
  - 7.3.2 小批量训练中的梯度累积 159
  - 7.3.3 梯度累积处理文本分类任务 161
- 7.4 本章小结 164
- 7.5 思考题 165
第 8 章对比学习与对抗训练 166
- 8.1 对比学习 166
  - 8.1.1 构建正负样本对及损失函数 166
  - 8.1.2 SimCLR的实现与初步应用 171
- 8.2 基于对比学习的预训练与微调 174
  - 8.2.1 通过对比学习进行自监督预训练 175
  - 8.2.2 对比学习在分类、聚类等任务中的表现 180
- 8.3 生成式对抗网络的实现与优化 183
- 8.4 对抗训练在大模型中的应用 188
- 8.5 本章小结 192
- 8.6 思考题 192
第 9 章自适应优化器与动态学习率调度 194
- 9.1 AdamW优化器与LAMB优化器的实现 194
  - 9.1.1 AdamW优化器 194
  - 9.1.2 LAMB优化器 197
- 9.2 基于梯度累积的优化技巧 200
  - 9.2.1 大批量内存受限环境 200
  - 9.2.2 梯度累积的应用场景和参数调整对训练效果的影响 203
- 9.3 动态学习率调度 205
  - 9.3.1 线性衰减 205
  - 9.3.2 余弦退火 207
- 9.4 Warmup与循环学习率调度 209
  - 9.4.1 Warmup策略实现 209
  - 9.4.2 循环学习率调度 211
  - 9.4.3 其他几种常见的动态学习调度器 214
- 9.5 本章小结 217
- 9.6 思考题 218
第 10 章模型蒸馏与剪枝 219
- 10.1 知识蒸馏：教师－学生模型 219
  - 10.1.1 知识蒸馏核心过程 219
  - 10.1.2 教师－学生模型 221
  - 10.1.3 蒸馏损失 224
- 10.2 知识蒸馏在文本模型中的应用 226
  - 10.2.1 知识蒸馏在文本分类模型中的应用 226
  - 10.2.2 模型蒸馏效率分析 229
  - 10.2.3 文本情感分析任务中的知识蒸馏效率对比 231
- 10.3 模型剪枝技术 234
  - 10.3.1 权重剪枝 234
  - 10.3.2 结构化剪枝 237
  - 10.3.3 在嵌入式设备上部署手写数字识别模型 240
  - 10.3.4 BERT模型的多头注意力剪枝 243
- 10.4 本章小结 247
- 10.5 思考题 248
第 11 章模型训练实战 249
- 11.1 数据预处理与Tokenization细节 249
  - 11.1.1 大规模文本数据清洗 249
  - 11.1.2 常用分词器的使用 252
- 11.2 大规模预训练模型的设置与启动 255
- 11.3 预训练过程中的监控与中间结果保存 258
- 11.4 训练中断与恢复机制 262
- 11.5 综合案例：IMDB文本分类训练全流程 265
  - 11.5.1 数据预处理与Tokenization 265
  - 11.5.2 多GPU与分布式训练设置 266
  - 11.5.3 训练过程中的监控与中间结果保存 266
  - 11.5.4 训练中断与恢复 267
  - 11.5.5 测试模型性能 268
- 11.6 本章小结 269
- 11.7 思考题 270
第 12 章模型微调实战 271
- 12.1 微调数据集的选择与准备 271
  - 12.1.1 数据集准备与清洗 271
  - 12.1.2 数据集分割 272
  - 12.1.3 数据增强 272
- 12.2 层级冻结与部分解冻策略 274
- 12.3 模型参数调整与优化技巧 276
- 12.4 微调后的模型评估与推理优化 278
- 12.5 综合微调应用案例 280
- 12.6 本章小结 283
- 12.7 思考题 283

Python深度学习实战：75个有关神经网络建模、强化学习与迁移

内容简介

本书以自上而下和自下而上的方法来展示针对不同领域实际问题的深度学习解决方案，包括图像识别、自然语言处理、时间序列预测和机器人操纵等。还讨论了采用诸如TensorFlow、PyTorch、Keras和CNTK等流行的深度学习开源框架用于实际问题的解决方案及其优缺点。本书内容包括：用于深度学习的编程环境、GPU计算和云端解决方案；前馈神经网络与卷积神经网络；循环与递归神经网络；强化学习与生成对抗网络；深度学习用于计算机视觉、自然语言处理、语音识别、视频分析、时间序列预测、结构化数据分析以及游戏智能体（Agents）和机器人操控等。后讨论了深度学习的超参数选择和神经网络的内在结构以及预训练模型的使用技巧等。

作者简介

Indra den Bakker是一位经验丰富的深度学习工程师和培训师。他是23insights平台的创始人，这是NVIDIA所属孵化项目计划的一部分，这是一个机器学习构建解决方案的初创型计划，可以改变世界上重要的行业。在开放课程平台Udacity，他指导了在深度学习和相关领域攻读微学位（Nanodegree）的学生，他还负责审查学生的实习项目。Indra拥有计算智能背景，并在创建23insights平台之前作为IPG Mediabrands的品牌代理以及Screen6的数据科学家若干年。

译者序
原书前言
第1章编程环境、GPU计算、云解决方案和深度学习框架 1
- 1.1 简介 1
- 1.2 搭建一个深度学习环境 2
- 1.3 在AWS上启动实例 2
- 1.4 在GCP上启动实例 3
- 1.5 安装CUDA和cuDNN 4
- 1.6 安装Anaconda和库文件 6
- 1.7 连接服务器上的JupyterNotebooks 7
- 1.8 用 TensorFlow构建进的即用模型 8
- 1.9 直观地用Keras建立网络 10
- 1.10 使用PyTorch的RNN动态计算图 12
- 1.11 用CNTK实现高性能模型 14
- 1.12 使用MXNet构建高效的模型 15
- 1.13 使用简单、高效的Gluon编码定义网络 17
第2章前馈神经网络 19
- 2.1 简介 19
- 2.2 理解感知器 19
- 2.3 实现一个单层神经网络 23
- 2.4 构建一个多层神经网络 27
- 2.5 开始使用激活函数 30
- 2.6 关于隐层和隐层神经元的实验 35
- 2.7 实现一个自动编码器 38
- 2.8 调整损失函数 41
- 2.9 测试不同的优化器 44
- 2.10 使用正则化技术提高泛化能力 47
- 2.11 添加Dropout以防止过拟合 51
第3章卷积神经网络 56
- 3.1 简介 56
- 3.2 开始使用滤波器和参数共享 56
- 3.3 应用层合并技术 60
- 3.4 使用批量标准化进行优化 62
- 3.5 理解填充和步长 66
- 3.6 试验不同类型的初始化 72
- 3.7 实现卷积自动编码器 76
- 3.8 将一维CNN应用于文本 79
第4章递归神经网络 81
- 4.1 简介 81
- 4.2 实现一个简单的RNN 82
- 4.3 添加LSTM 84
- 4.4 使用GRU 86
- 4.5 实现双向RNN 89
- 4.6 字符级文本生成 91
第5章强化学习 95
- 5.1 简介 95
- 5.2 实现策略梯度 95
- 5.3 实现深度Q学习算法 102
第6章生成对抗网络 109
- 6.1 简介 109
- 6.2 了解GAN 109
- 6.3 实现DCGAN 112
- 6.4 使用SRGAN来提高图像分辨率 117
第7章计算机视觉 125
- 7.1 简介 125
- 7.2 利用计算机视觉技术增广图像 125
- 7.3 图像中的目标分类 130
- 7.4 目标在图像中的本地化 134
- 7.5 实时检测框架 139
- 7.6 用U-net将图像分类 139
- 7.7 语义分割与场景理解 143
- 7.8 寻找人脸面部关键点 147
- 7.9 人脸识别 151
- 7.10 将样式转换为图像 157
第8章自然语言处理 162
- 8.1 简介 162
- 8.2 情绪分析 162
- 8.3 句子翻译 165
- 8.4 文本摘要 169
第9章语音识别和视频分析 174
- 9.1 简介 174
- 9.2 从零开始实现语音识别流程 174
- 9.3 使用语音识别技术辨别讲话人 177
- 9.4 使用深度学习理解视频 181
第10章时间序列和结构化数据 185
- 10.1 简介 185
- 10.2 使用神经网络预测股票价格 185
- 10.3 预测共享单车需求 189
- 10.4 使用浅层神经网络进行二元分类 192
第11章游戏智能体和机器人 194
- 11.1 简介 194
- 11.2 通过端到端学习来驾驶汽车 194
- 11.3 通过深度强化学习来玩游戏 199
- 11.4 用GA优化超参数 205
第12章超参数选择、调优和神经网络学习 211
- 12.1 简介 211
- 12.2 用TensorBoard和Keras可视化训练过程 211
- 12.3 使用批量和小批量工作 215
- 12.4 使用网格搜索调整参数 219
- 12.5 学习率和学习率调度 221
- 12.6 比较优化器 224
- 12.7 确定网络的深度 227
- 12.8 添加Dropout以防止过拟合 227
- 12.9 通过数据增广使模型更加鲁棒 232
- 12.10 利用TTA来提高精度 234
第13章网络内部构造 235
- 13.1 简介 235
- 13.2 用TensorBoard可视化训练过程 235
- 13.3 用TensorBoard可视化网络结构 239
- 13.4 分析网络权重等 239
- 13.5 冻结层 244
- 13.6 存储网络结构并训练权重 246
第14章预训练模型 250
- 14.1 简介 250
- 14.2 使用GoogLeNet/Inception进行大规模视觉识别 250
- 14.3 用ResNet提取瓶颈特征 252
- 14.4 对新类别使用预训练的VGG模型 253
- 14.5 用Xception细调 256

PyTorch教程：21个项目玩转PyTorch实战

PyTorch 是基于 Torch 库的开源机器学习库，它主要由 Meta（原 Facebook）的人工智能研究实验室开发，在自然语言处理和计算机视觉领域都具有广泛的应用。本书介绍了简单且经典的入门项目，方便快速上手，如 MNIST数字识别，读者在完成项目的过程中可以了解数据集、模型和训练等基础概念。本书还介绍了一些实用且经典的模型，如 R-CNN 模型，通过这个模型的学习，读者可以对目标检测任务有一个基本的认识，对于基本的网络结构原理有一定的了解。另外，本书对于当前比较热门的生成对抗网络和强化学习也有一定的介绍，方便读者拓宽视野，掌握前沿方向。本书适合人工智能、机器学习、深度学习方面的人员阅读，也适合其他 IT 方面从业者，另外，还可以作为相关专业的教材。

动手学PyTorch建模与应用：从深度学习到大模型

内容简介 · · · · · ·

《动手学PyTorch建模与应用:从深度学习到大模型》是一本从零基础上手深度学习和大模型的PyTorch实战指南。《动手学PyTorch建模与应用:从深度学习到大模型》共11章，第1章主要介绍深度学习的概念、应用场景及开发环境搭建。第2章详细介绍PyTorch数学基础，包括函数、微分、数理统计、矩阵等基础知识及其案例。第3章介绍数据预处理及常用工具，包括NumPy、Pandas、Matplotlib、数据清洗、特征工程以及深度学习解决问题的一般步骤等。第4章介绍PyTorch基础知识，包括张量的创建、激活函数、损失函数、优化器等。第5章介绍PyTorch深度神经网络，包括神经网络概述、卷积神经网络、循环神经网络等。第6章介绍PyTorch数据建模，包括回归分析、聚类分析、主成分分析、模型评估与调优等。第7～10章介绍PyTorch图像建模、文本建模、音频建模和模型可视化。第11章介绍大语言模型的原理、主要的大语言模型及模型本地化部署、预训练与微调技术。本书还精心设计了50个动手案例和上机练习题，并对所有代码进行了详尽注释和说明，同时提供数据集和配书资源文件，以帮助读者更好地使用本书。《动手学PyTorch建模与应用:从深度学习到大模型》讲解深入浅出，注重动手实操，特别适合想学习AI技术或想进入该领域的初学者，对深度学习感兴趣的新手、在校学生和从业者阅读，也很适合作为培训机构和高校相关专业的教学用书。

作者简介 · · · · · ·

王国平，毕业于上海海洋大学，硕士，从业10余年，主要从事数据可视化、数据挖掘和大数据分析与研究等工作。精通数据挖掘技术与相关软件工具，包括Tableau、SPSS、PyTorch、Power Bl等，已出版《IBM SPSS Modeler数据与文本挖掘实战》《Microsoft Power Bl数据可视化与数据分析》《Tableau数据可视化从入门到精通》《零基础入门Python数据分析与机器学习》等图书。

目录 · · · · · ·

第 1 章深度学习和PyTorch概述 1

走进深度学习的世界 1
1. 深度学习的发展历史 1
2. 深度学习框架PyTorch 3
3. 深度学习的应用领域 4
搭建开发环境 5
1. 安装Python 3.12 5
2. 安装代码开发工具Jupyter Lab 9
3. 安装PyTorch 2.2 10
PyTorch的应用场景 14
上机练习题 14

第 2 章 PyTorch数学基础 17

PyTorch中的函数 17
1. 函数的基础知识 17
2. PyTorch中的主要函数 20
微分基础 22
1. 微分及其公式 22
2. PyTorch自动微分 24
数理统计基础 29
1. 数理统计及其指标 29
2. PyTorch统计函数 34
矩阵基础 45
1. 矩阵及其运算 45
2. PyTorch矩阵运算 47
动手练习：拟合余弦函数曲线 54
上机练习题 58

第 3 章数据预处理及常用工具 62

NumPy 62
1. 安装和导入NumPy 62
2. NumPy的数据结构ndarray 63
3. NumPy的基本使用 63
Matplotlib 65
1. 安装和导入Matplotlib 65
2. Matplotlib的使用示例 66
数据清洗 70
1. 数据清洗的作用 70
2. 用Pandas进行数据清洗 71
特征工程 76
1. 特征工程概述 76
2. 使用Scikit-learn进行数据预处理 78
3. 使用Pandas实现特征工程 81
深度学习解决问题的一般步骤 82
动手练习：每日最高温度预测 84
上机练习题 90

第 4 章 PyTorch基础知识 95

张量及其创建 95
1. 张量及其数据类型 95
2. 使用数组直接创建张量 96
3. 使用概率分布创建张量 98
激活函数 99
1. 激活函数及其必要性 99
2. Sigmoid激活函数 100
3. Tanh激活函数 101
4. ReLU激活函数 102
5. Leaky ReLU激活函数 103
6. 其他类型的激活函数 104
损失函数 105
1. 损失函数及其选取 106
2. L1范数损失函数 106
3. 均方误差损失函数 107
4. 交叉熵损失函数 108
5. 余弦相似度损失 109
6. 其他损失函数 109
优化器 110
1. 梯度及梯度下降算法 111
2. 随机梯度下降算法 112
3. 标准动量优化算法 112
4. AdaGrad算法 113
5. RMSProp算法 113
6. Adam算法 114
动手练习：PyTorch优化器比较 114
上机练习题 119

第 5 章 PyTorch深度神经网络 124

神经网络概述 124
1. 神经元模型 124
2. 多层感知机 126
3. 前馈神经网络 128
卷积神经网络 129
1. 卷积神经网络的历史 129
2. 卷积神经网络的结构 130
3. 卷积神经网络的类型 131
循环神经网络 134
1. 简单的循环神经网络 134
2. 长短期记忆网络 136
3. 门控循环单元 138
动手练习：股票成交量趋势预测 139
上机练习题 148

第 6 章 PyTorch数据建模 152

回归分析及案例 152
1. 回归分析简介 152
2. 回归分析建模 153
3. 动手练习：住房价格回归预测 155
聚类分析及案例 160
1. 聚类分析简介 160
2. 聚类分析建模 160
3. 动手练习：植物花卉特征聚类 162
主成分分析及案例 165
1. 主成分分析简介 166
2. 主成分分析建模 166
3. 动手练习：地区竞争力指标降维 167
模型评估与调优 173
1. 模型评估方法 173
2. 模型调优方法 176
3. 动手练习：PyTorch实现交叉验证 178
上机练习题 187

第 7 章 PyTorch图像建模 190

图像建模概述 190
1. 图像分类技术 190
2. 图像识别技术 191
3. 图像分割技术 192
动手练习：创建图像自动分类器 193
1. 加载数据集 193
2. 搭建网络模型 194
3. 训练网络模型 195
4. 应用网络模型 196
动手练习：搭建图像自动识别模型 198
1. 加载数据集 198
2. 搭建与训练网络 200
3. 预测图像数据 202
4. 图像识别模型的判断 202
动手练习：搭建图像自动分割模型 204
1. 加载数据集 205
2. 搭建网络模型 206
3. 训练网络模型 209
4. 应用网络模型 210
上机练习题 212

第 8 章 PyTorch文本建模 220

自然语言处理的几个模型 220
1. Word2Vec模型 220
2. Seq2Seq模型 221
3. Attention模型 222
动手练习：Word2Vec提取相似文本 223
1. 加载数据集 223
2. 搭建网络模型 227
3. 训练网络模型 228
4. 应用网络模型 230
动手练习：Seq2Seq实现机器翻译 231
1. 加载数据集 231
2. 搭建网络模型 237
3. 训练网络模型 240
4. 应用网络模型 242
动手练习：Attention模型实现文本自动分类 244
1. 加载数据集 244
2. 搭建网络模型 246
3. 训练网络模型 247
4. 应用网络模型 251
上机练习题 251

第 9 章 PyTorch音频建模 258

音频处理技术及应用 258
1. 音频处理技术 258
2. 音视频摘要技术及其应用 259
3. 音频识别及应用 260
4. 音频监控及应用 261
5. 场景感知及应用 261
梅尔频率倒谱系数音频特征 262
1. 梅尔频率倒谱系数简介及参数的提取过程 262
2. 音频预处理 263
3. 快速傅里叶变换 264
4. 能量谱处理 264
5. 离散余弦转换 265
PyTorch音频建模技术 266
1. 加载音频数据源 266
2. 波形变换的类型 267
3. 绘制波形频谱图 268
4. 波形Mu-Law编码 270
5. 变换前后波形的比较 272
动手练习：音频相似度分析 273
上机练习题 276

第 10 章 PyTorch模型可视化 278

Visdom 278
1. Visdom简介 278
2. Visdom可视化操作 280
3. 动手练习：识别手写数字 296
TensorBoard 301
1. TensorBoard简介 301
2. TensorBoard基础操作 303
3. 动手练习：可视化模型参数 312
Pytorchviz 314
1. Pytorchviz简介 314
2. 动手练习：Pytorchviz建模可视化 314
Netron 317
1. Netron简介 317
2. 动手练习：Netron建模可视化 317
上机练习题 321

第 11 章从深度学习到大语言模型 323

大语言模型的原理 323
1. 大语言模型简介 323
2. Transformer架构 324
3. 注意力机制 327
主要的大语言模型 331
1. ChatGPT及其API调用 331
2. 文心一言及其插件开发 334
3. ChatGLM及其本地部署 338
模型预训练与微调 350
1. 大模型预训练 350
2. 大模型微调技术 353
上机练习题 361

参考文献 363

含有"深度学习"标签的书籍

内容简介

作者简介

目录

内容简介

作者简介

目录

目 录

第1章 新时代的曙光—人工智能与大模型 1

第2章 PyTorch 2.0深度学习环境搭建 8

第3章 从零开始学习PyTorch 2.0 27

第4章 一学就会的深度学习基础算法详解 44

第5章 基于PyTorch卷积层的MNIST分类实战 71

第6章 可视化的PyTorch数据处理与模型展示 91

第7章 ResNet实战 106

第8章 有趣的词嵌入 120

第9章 基于循环神经网络的中文情感分类实战 160

第10章 从零开始学习自然语言处理的编码器 169

第11章 站在巨人肩膀上的预训练模型BERT 193

第12章 从1开始自然语言处理的解码器 206

第13章 基于PyTorch 2.0的强化学习实战 232

第14章 ChatGPT前身—只具有解码器的GPT-2模型 250

第15章 实战训练自己的ChatGPT 291

第16章 开源大模型ChatGLM使用详解 305

第17章 开源大模型ChatGLM 高级定制化应用实战 312

第18章 对训练成本上亿美元的ChatGLM进行高级微调 332

内容简介 · · · · · ·

作者简介 · · · · · ·

目录 · · · · · ·

内容简介

作者简介

目录

内容简介

作者简介

目录

内容简介

作者简介

目录

内容简介 · · · · · ·

作者简介 · · · · · ·

目录 · · · · · ·

第 1 章 深度学习和PyTorch概述 1

第 2 章 PyTorch数学基础 17

第 3 章 数据预处理及常用工具 62

第 4 章 PyTorch基础知识 95

第 5 章 PyTorch深度神经网络 124

第 6 章 PyTorch数据建模 152

第 7 章 PyTorch图像建模 190

第 8 章 PyTorch文本建模 220

第 9 章 PyTorch音频建模 258

第 10 章 PyTorch模型可视化 278

第 11 章 从深度学习到大语言模型 323

目录

第1章新时代的曙光—人工智能与大模型 1

第3章从零开始学习PyTorch 2.0 27

第4章一学就会的深度学习基础算法详解 44

第5章基于PyTorch卷积层的MNIST分类实战 71

第6章可视化的PyTorch数据处理与模型展示 91

第8章有趣的词嵌入 120

第9章基于循环神经网络的中文情感分类实战 160

第10章从零开始学习自然语言处理的编码器 169

第11章站在巨人肩膀上的预训练模型BERT 193

第12章从1开始自然语言处理的解码器 206

第13章基于PyTorch 2.0的强化学习实战 232

第15章实战训练自己的ChatGPT 291

第16章开源大模型ChatGLM使用详解 305

第17章开源大模型ChatGLM 高级定制化应用实战 312

第18章对训练成本上亿美元的ChatGLM进行高级微调 332

第 1 章深度学习和PyTorch概述 1

第 3 章数据预处理及常用工具 62

第 11 章从深度学习到大语言模型 323