动手学PyTorch建模与应用:从深度学习到大模型
王国平著,2024年版 [文件格式: PDF - 41MB]内容简介 · · · · · ·
《动手学PyTorch建模与应用:从深度学习到大模型》是一本从零基础上手深度学习和大模型的PyTorch实战指南。《动手学PyTorch建模与应用:从深度学习到大模型》共11章,第1章主要介绍深度学习的概念、应用场景及开发环境搭建。第2章详细介绍PyTorch数学基础,包括函数、微分、数理统计、矩阵等基础知识及其案例。第3章介绍数据预处理及常用工具,包括NumPy、Pandas、Matplotlib、数据清洗、特征工程以及深度学习解决问题的一般步骤等。第4章介绍PyTorch基础知识,包括张量的创建、激活函数、损失函数、优化器等。第5章介绍PyTorch深度神经网络,包括神经网络概述、卷积神经网络、循环神经网络等。第6章介绍PyTorch数据建模,包括回归分析、聚类分析、主成分分析、模型评估与调优等。第7~10章介绍PyTorch图像建模、文本建模、音频建模和模型可视化。第11章介绍大语言模型的原理、主要的大语言模型及模型本地化部署、预训练与微调技术。本书还精心设计了50个动手案例和上机练习题,并对所有代码进行了详尽注释和说明,同时提供数据集和配书资源文件,以帮助读者更好地使用本书。 《动手学PyTorch建模与应用:从深度学习到大模型》讲解深入浅出,注重动手实操,特别适合想学习AI技术或想进入该领域的初学者,对深度学习感兴趣的新手、在校学生和从业者阅读,也很适合作为培训机构和高校相关专业的教学用书。
作者简介 · · · · · ·
王国平,毕业于上海海洋大学,硕士,从业10余年,主要从事数据可视化、数据挖掘和大数据分析与研究等工作。精通数据挖掘技术与相关软件工具,包括Tableau、SPSS、PyTorch、Power Bl等,已出版《IBM SPSS Modeler数据与文本挖掘实战》《Microsoft Power Bl数据可视化与数据分析》《Tableau数据可视化从入门到精通》《零基础入门Python数据分析与机器学习》等图书。
目录 · · · · · ·
第 1 章 深度学习和PyTorch概述 1
- 走进深度学习的世界 1
- 深度学习的发展历史 1
- 深度学习框架PyTorch 3
- 深度学习的应用领域 4
- 搭建开发环境 5
- 安装Python 3.12 5
- 安装代码开发工具Jupyter Lab 9
- 安装PyTorch 2.2 10
- PyTorch的应用场景 14
- 上机练习题 14
第 2 章 PyTorch数学基础 17
- PyTorch中的函数 17
- 函数的基础知识 17
- PyTorch中的主要函数 20
- 微分基础 22
- 微分及其公式 22
- PyTorch自动微分 24
- 数理统计基础 29
- 数理统计及其指标 29
- PyTorch统计函数 34
- 矩阵基础 45
- 矩阵及其运算 45
- PyTorch矩阵运算 47
- 动手练习:拟合余弦函数曲线 54
- 上机练习题 58
第 3 章 数据预处理及常用工具 62
- NumPy 62
- 安装和导入NumPy 62
- NumPy的数据结构ndarray 63
- NumPy的基本使用 63
- Matplotlib 65
- 安装和导入Matplotlib 65
- Matplotlib的使用示例 66
- 数据清洗 70
- 数据清洗的作用 70
- 用Pandas进行数据清洗 71
- 特征工程 76
- 特征工程概述 76
- 使用Scikit-learn进行数据预处理 78
- 使用Pandas实现特征工程 81
- 深度学习解决问题的一般步骤 82
- 动手练习:每日最高温度预测 84
- 上机练习题 90
第 4 章 PyTorch基础知识 95
- 张量及其创建 95
- 张量及其数据类型 95
- 使用数组直接创建张量 96
- 使用概率分布创建张量 98
- 激活函数 99
- 激活函数及其必要性 99
- Sigmoid激活函数 100
- Tanh激活函数 101
- ReLU激活函数 102
- Leaky ReLU激活函数 103
- 其他类型的激活函数 104
- 损失函数 105
- 损失函数及其选取 106
- L1范数损失函数 106
- 均方误差损失函数 107
- 交叉熵损失函数 108
- 余弦相似度损失 109
- 其他损失函数 109
- 优化器 110
- 梯度及梯度下降算法 111
- 随机梯度下降算法 112
- 标准动量优化算法 112
- AdaGrad算法 113
- RMSProp算法 113
- Adam算法 114
- 动手练习:PyTorch优化器比较 114
- 上机练习题 119
第 5 章 PyTorch深度神经网络 124
- 神经网络概述 124
- 神经元模型 124
- 多层感知机 126
- 前馈神经网络 128
- 卷积神经网络 129
- 卷积神经网络的历史 129
- 卷积神经网络的结构 130
- 卷积神经网络的类型 131
- 循环神经网络 134
- 简单的循环神经网络 134
- 长短期记忆网络 136
- 门控循环单元 138
- 动手练习:股票成交量趋势预测 139
- 上机练习题 148
第 6 章 PyTorch数据建模 152
- 回归分析及案例 152
- 回归分析简介 152
- 回归分析建模 153
- 动手练习:住房价格回归预测 155
- 聚类分析及案例 160
- 聚类分析简介 160
- 聚类分析建模 160
- 动手练习:植物花卉特征聚类 162
- 主成分分析及案例 165
- 主成分分析简介 166
- 主成分分析建模 166
- 动手练习:地区竞争力指标降维 167
- 模型评估与调优 173
- 模型评估方法 173
- 模型调优方法 176
- 动手练习:PyTorch实现交叉验证 178
- 上机练习题 187
第 7 章 PyTorch图像建模 190
- 图像建模概述 190
- 图像分类技术 190
- 图像识别技术 191
- 图像分割技术 192
- 动手练习:创建图像自动分类器 193
- 加载数据集 193
- 搭建网络模型 194
- 训练网络模型 195
- 应用网络模型 196
- 动手练习:搭建图像自动识别模型 198
- 加载数据集 198
- 搭建与训练网络 200
- 预测图像数据 202
- 图像识别模型的判断 202
- 动手练习:搭建图像自动分割模型 204
- 加载数据集 205
- 搭建网络模型 206
- 训练网络模型 209
- 应用网络模型 210
- 上机练习题 212
第 8 章 PyTorch文本建模 220
- 自然语言处理的几个模型 220
- Word2Vec模型 220
- Seq2Seq模型 221
- Attention模型 222
- 动手练习:Word2Vec提取相似文本 223
- 加载数据集 223
- 搭建网络模型 227
- 训练网络模型 228
- 应用网络模型 230
- 动手练习:Seq2Seq实现机器翻译 231
- 加载数据集 231
- 搭建网络模型 237
- 训练网络模型 240
- 应用网络模型 242
- 动手练习:Attention模型实现文本自动分类 244
- 加载数据集 244
- 搭建网络模型 246
- 训练网络模型 247
- 应用网络模型 251
- 上机练习题 251
第 9 章 PyTorch音频建模 258
- 音频处理技术及应用 258
- 音频处理技术 258
- 音视频摘要技术及其应用 259
- 音频识别及应用 260
- 音频监控及应用 261
- 场景感知及应用 261
- 梅尔频率倒谱系数音频特征 262
- 梅尔频率倒谱系数简介及参数的提取过程 262
- 音频预处理 263
- 快速傅里叶变换 264
- 能量谱处理 264
- 离散余弦转换 265
- PyTorch音频建模技术 266
- 加载音频数据源 266
- 波形变换的类型 267
- 绘制波形频谱图 268
- 波形Mu-Law编码 270
- 变换前后波形的比较 272
- 动手练习:音频相似度分析 273
- 上机练习题 276
第 10 章 PyTorch模型可视化 278
- Visdom 278
- Visdom简介 278
- Visdom可视化操作 280
- 动手练习:识别手写数字 296
- TensorBoard 301
- TensorBoard简介 301
- TensorBoard基础操作 303
- 动手练习:可视化模型参数 312
- Pytorchviz 314
- Pytorchviz简介 314
- 动手练习:Pytorchviz建模可视化 314
- Netron 317
- Netron简介 317
- 动手练习:Netron建模可视化 317
- 上机练习题 321
第 11 章 从深度学习到大语言模型 323
- 大语言模型的原理 323
- 大语言模型简介 323
- Transformer架构 324
- 注意力机制 327
- 主要的大语言模型 331
- ChatGPT及其API调用 331
- 文心一言及其插件开发 334
- ChatGLM及其本地部署 338
- 模型预训练与微调 350
- 大模型预训练 350
- 大模型微调技术 353
- 上机练习题 361
参考文献 363