清华大学出版社出版的书籍

"清华大学出版社"出版的书籍

《UNIX网络编程》(第1卷)(套接口API第3版)第1版和第2版由已故UNIX网络专家W. Richard Stevens博士独自编写。《UNIX网络编程》(第1卷)(套接口API第3版)是3版，由世界著名网络专家Bill Fenner和Andrew M. Rudoff执笔，根据近几年网络技术的发展，对上一版进行全面修订，增添了IPv6的更新过的信息、SCTP协议和密钥管理套接口的内容，删除了X/Open传输接口的内容。

《UNIX网络编程》(第1卷)(套接口API第3版)内容详尽且具权威性，几乎每章都提供精选的习题，是计算机和网络专业高年级本科生和研究生的首选教材，《UNIX网络编程》(第1卷)(套接口API第3版)也可作为网络研究和开发人员的自学教材和参考书。

从零开始大模型开发与微调：基于PyTorch与ChatGLM

内容简介

大模型是深度学习自然语言处理皇冠上的一颗明珠，也是当前AI和NLP研究与产业中最重要的方向之一。本书使用PyTorch 2.0作为学习大模型的基本框架，以ChatGLM为例详细讲解大模型的基本理论、算法、程序实现、应用实战以及微调技术，为读者揭示大模型开发技术。本书配套示例源代码、PPT课件。

《从零开始大模型开发与微调：基于PyTorch与ChatGLM》共18章，内容包括人工智能与大模型、PyTorch 2.0深度学习环境搭建、从零开始学习PyTorch 2.0、深度学习基础算法详解、基于PyTorch卷积层的MNIST分类实战、PyTorch数据处理与模型展示、ResNet实战、有趣的词嵌入、基于PyTorch循环神经网络的中文情感分类实战、自然语言处理的编码器、预训练模型BERT、自然语言处理的解码器、强化学习实战、只具有解码器的GPT-2模型、实战训练自己的ChatGPT、开源大模型ChatGLM使用详解、ChatGLM高级定制化应用实战、对ChatGLM进行高级微调。

《从零开始大模型开发与微调：基于PyTorch与ChatGLM》适合PyTorch深度学习初学者、大模型开发初学者、大模型开发人员学习，也适合高等院校人工智能、智能科学与技术、数据科学与大数据技术、计算机科学与技术等专业的师生作为教学参考书。

作者简介

王晓华，高校计算机专业讲师，研究方向为云计算、大数据与人工智能。著有《PyTorch 2.0深度学习从零开始学》《Python机器学习与可视化分析实战》《谷歌JAX深度学习从零开始学》《Spark 3.0大数据分析与挖掘：基于机器学习》《TensorFlow深度学习应用实践》《OpenCV+TensorFlow深度学习与计算机视觉实战》《TensorFlow知识图谱实战》《TensorFlow人脸识别实战》《TensorFlow语音识别实战》《TensorFlow+Keras自然语言处理实战》《TensorFlow 2.0卷积神经网络实战》《Keras实战：基于TensorFlow2.2的深度学习实践》《TensorFlow 2.0深度学习从零开始学》《深度学习的数学原理与实现》。

1.1 人工智能：思维与实践的融合 1
- 1.1.1 人工智能的历史与未来 2
- 1.1.2 深度学习与人工智能 2
- 1.1.3 选择PyTorch 2.0实战框架 3
1.2 大模型开启人工智能的新时代 4
- 1.2.1 大模型带来的变革 4
- 1.2.2 最强的中文大模型—清华大学ChatGLM介绍 5
- 1.2.3 近在咫尺的未来—大模型的应用前景 6
1.3 本章小结 7

第2章 PyTorch 2.0深度学习环境搭建 8

2.1 环境搭建1：安装Python 8
- 2.1.1 Miniconda的下载与安装 8
- 2.1.2 PyCharm的下载与安装 11
- 2.1.3 Python代码小练习：计算Softmax函数 14
2.2 环境搭建2：安装PyTorch 2.0 15
- 2.2.1 Nvidia 10/20/30/40系列显卡选择的GPU版本 15
- 2.2.2 PyTorch 2.0 GPU Nvidia运行库的安装 15
- 2.2.3 PyTorch 2.0小练习：Hello PyTorch 18
2.3 生成式模型实战：古诗词的生成 18
2.4 图像降噪：手把手实战第一个深度学习模型 19
- 2.4.1 MNIST数据集的准备 19
- 2.4.2 MNIST数据集的特征和标签介绍 21
- 2.4.3 模型的准备和介绍 22
- 2.4.4 对目标的逼近—模型的损失函数与优化函数 24
- 2.4.5 基于深度学习的模型训练 24
2.5 本章小结 26

第3章从零开始学习PyTorch 2.0 27

3.1 实战MNIST手写体识别 27
- 3.1.1 数据图像的获取与标签的说明 27
- 3.1.2 实战基于PyTorch 2.0的手写体识别模型 29
- 3.1.3 基于Netron库的PyTorch 2.0模型可视化 32
3.2 自定义神经网络框架的基本设计 34
- 3.2.1 神经网络框架的抽象实现 34
- 3.2.2 自定义神经网络框架的具体实现 35
3.3 本章小结 43

第4章一学就会的深度学习基础算法详解 44

4.1 反向传播神经网络的前身历史 44
4.2 反向传播神经网络两个基础算法详解 47
- 4.2.1 最小二乘法详解 48
- 4.2.2 梯度下降算法 50
- 4.2.3 最小二乘法的梯度下降算法及其Python实现 52
4.3 反馈神经网络反向传播算法介绍 58
- 4.3.1 深度学习基础 58
- 4.3.2 链式求导法则 59
- 4.3.3 反馈神经网络的原理与公式推导 60
- 4.3.4 反馈神经网络原理的激活函数 64
- 4.3.5 反馈神经网络原理的Python实现 66
4.4 本章小结 70

第5章基于PyTorch卷积层的MNIST分类实战 71

5.1 卷积运算的基本概念 71
- 5.1.1 基本卷积运算示例 72
- 5.1.2 PyTorch中的卷积函数实现详解 73
- 5.1.3 池化运算 75
- 5.1.4 Softmax激活函数 77
- 5.1.5 卷积神经网络的原理 78
5.2 实战：基于卷积的MNIST手写体分类 80
- 5.2.1 数据的准备 80
- 5.2.2 模型的设计 81
- 5.2.3 基于卷积的MNIST分类模型 82
5.3 PyTorch的深度可分离膨胀卷积详解 84
- 5.3.1 深度可分离卷积的定义 84
- 5.3.2 深度的定义以及不同计算层待训练参数的比较 86
- 5.3.3 膨胀卷积详解 87
- 5.3.4 实战：基于深度可分离膨胀卷积的MNIST手写体识别 87
5.4 本章小结 90

第6章可视化的PyTorch数据处理与模型展示 91

6.1 用于自定义数据集的torch.utils.data工具箱使用详解 92
- 6.1.1 使用torch.utils.data. Dataset封装自定义数据集 92
- 6.1.2 改变数据类型的Dataset类中的transform的使用 93
- 6.1.3 批量输出数据的DataLoader类详解 98
6.2 实战：基于tensorboardX的训练可视化展示 100
- 6.2.1 可视化组件tensorboardX的简介与安装 100
- 6.2.2 tensorboardX可视化组件的使用 100
- 6.2.3 tensorboardX对模型训练过程的展示 103
6.3 本章小结 105

第7章 ResNet实战 106

7.1 ResNet基础原理与程序设计基础 106
- 7.1.1 ResNet诞生的背景 107
- 7.1.2 PyTorch 2.0中的模块工具 109
- 7.1.3 ResNet残差模块的实现 110
- 7.1.4 ResNet网络的实现 112
7.2 ResNet实战：CIFAR-10数据集分类 114
- 7.2.1 CIFAR-10数据集简介 114
- 7.2.2 基于ResNet的CIFAR-10数据集分类 117
7.3 本章小结 118

第8章有趣的词嵌入 120

8.1 文本数据处理 120
- 8.1.1 Ag_news数据集介绍和数据清洗 120
- 8.1.2 停用词的使用 123
- 8.1.3 词向量训练模型Word2Vec使用介绍 125
- 8.1.4 文本主题的提取：基于TF-IDF 128
- 8.1.5 文本主题的提取：基于TextRank 132
8.2 更多的词嵌入方法—FastText和预训练词向量 134
- 8.2.1 FastText的原理与基础算法 135
- 8.2.2 FastText训练及其与PyTorch 2.0的协同使用 136
- 8.2.3 使用其他预训练参数来生成PyTorch 2.0词嵌入矩阵（中文） 140
8.3 针对文本的卷积神经网络模型简介—字符卷积 141
- 8.3.1 字符（非单词）文本的处理 141
- 8.3.2 卷积神经网络文本分类模型的实现—Conv1d（一维卷积） 148
8.4 针对文本的卷积神经网络模型简介—词卷积 151
- 8.4.1 单词的文本处理 151
- 8.4.2 卷积神经网络文本分类模型的实现—Conv2d（二维卷积） 153
8.5 使用卷积对文本分类的补充内容 155
- 8.5.1 汉字的文本处理 155
- 8.5.2 其他细节 157
8.6 本章小结 158

第9章基于循环神经网络的中文情感分类实战 160

9.1 实战：循环神经网络与情感分类 160
9.2 循环神经网络理论讲解 165
- 9.2.1 什么是GRU 165
- 9.2.2 单向不行，那就双向 167
9.3 本章小结 168

第10章从零开始学习自然语言处理的编码器 169

10.1 编码器的核心—注意力模型 170
- 10.1.1 输入层—初始词向量层和位置编码器层 170
- 10.1.2 自注意力层 172
- 10.1.3 ticks和Layer Normalization 177
- 10.1.4 多头注意力 178
10.2 编码器的实现 180
- 10.2.1 前馈层的实现 181
- 10.2.2 编码器的实现 182
10.3 实战编码器：拼音汉字转化模型 184
- 10.3.1 汉字拼音数据集处理 185
- 10.3.2 汉字拼音转化模型的确定 187
- 10.3.3 模型训练部分的编写 190
10.4 本章小结 191

第11章站在巨人肩膀上的预训练模型BERT 193

11.1 预训练模型BERT 193
- 11.1.1 BERT的基本架构与应用 194
- 11.1.2 BERT预训练任务与微调 195
11.2 实战BERT：中文文本分类 198
- 11.2.1 使用Hugging Face获取BERT预训练模型 198
- 11.2.2 BERT实战文本分类 200
11.3 更多的预训练模型 203
11.4 本章小结 205

第12章从1开始自然语言处理的解码器 206

12.1 解码器的核心—注意力模型 206
- 12.1.1 解码器的输入和交互注意力层的掩码 207
- 12.1.2 为什么通过掩码操作能够减少干扰 212
- 12.1.3 解码器的输出（移位训练方法） 213
- 12.1.4 解码器的实现 214
12.2 解码器实战—拼音汉字翻译模型 215
- 12.2.1 数据集的获取与处理 216
- 12.2.2 翻译模型 218
- 12.2.3 拼音汉字模型的训练 229
- 12.2.4 拼音汉字模型的使用 230
12.3 本章小结 231

第13章基于PyTorch 2.0的强化学习实战 232

13.1 基于强化学习的火箭回收实战 232
- 13.1.1 火箭回收基本运行环境介绍 233
- 13.1.2 火箭回收参数介绍 234
- 13.1.3 基于强化学习的火箭回收实战 234
- 13.1.4 强化学习的基本内容 239
13.2 强化学习的基本算法—PPO算法 243
- 13.2.1 PPO算法简介 243
- 13.2.2 函数使用说明 244
- 13.2.3 一学就会的TD-error理论介绍 245
- 13.2.4 基于TD-error的结果修正 247
- 13.2.5 对于奖励的倒序构成的说明 248
13.3 本章小结 249

第14章 ChatGPT前身—只具有解码器的GPT-2模型 250

14.1 GPT-2模型简介 250
- 14.1.1 GPT-2模型的输入和输出结构—自回归性 251
- 14.1.2 GPT-2模型的PyTorch实现 252
- 14.1.3 GPT-2模型输入输出格式的实现 257
14.2 Hugging Face GPT-2模型源码模型详解 259
- 14.2.1 GPT2LMHeadModel类和GPT2Model类详解 259
- 14.2.2 Block类详解 270
- 14.2.3 Attention类详解 274
- 14.2.4 MLP类详解 281
14.3 Hugging Face GPT-2模型的使用与自定义微调 282
- 14.3.1 模型的使用与自定义数据集的微调 282
- 14.3.2 基于预训练模型的评论描述微调 285
14.4 自定义模型的输出 286
- 14.4.1 GPT输出的结构 286
- 14.4.2 创造性参数temperature与采样个数topK 288
14.5 本章小结 290

第15章实战训练自己的ChatGPT 291

15.1 什么是ChatGPT 291
15.2 RLHF模型简介 293
- 15.2.1 RLHF技术分解 293
- 15.2.2 RLHF中的具体实现—PPO算法 296
15.3 基于RLHF实战的ChatGPT正向评论的生成 297
- 15.3.1 RLHF模型进化的总体讲解 297
- 15.3.2 ChatGPT评分模块简介 298
- 15.3.3 带有评分函数的ChatGPT模型的构建 300
- 15.3.4 RLHF中的PPO算法—KL散度 301
- 15.3.5 RLHF中的PPO算法—损失函数 303
15.4 本章小结 304

第16章开源大模型ChatGLM使用详解 305

16.1 为什么要使用大模型 305
- 16.1.1 大模型与普通模型的区别 306
- 16.1.2 一个神奇的现象—大模型的涌现能力 307
16.2 ChatGLM使用详解 307
- 16.2.1 ChatGLM简介及应用前景 308
- 16.2.2 下载ChatGLM 309
- 16.2.3 ChatGLM的使用与Prompt介绍 310
16.3 本章小结 311

第17章开源大模型ChatGLM 高级定制化应用实战 312

17.1 医疗问答GLMQABot搭建实战—基于ChatGLM搭建专业客服问答机器人 312
- 17.1.1 基于ChatGLM搭建专业领域问答机器人的思路 313
- 17.1.2 基于真实医疗问答的数据准备 314
- 17.1.3 文本相关性（相似度）的比较算法 315
- 17.1.4 提示语句Prompt的构建 316
- 17.1.5 基于单个文档的GLMQABot的搭建 316
17.2 金融信息抽取实战—基于知识链的ChatGLM本地化知识库检索与智能答案生成 318
- 17.2.1 基于ChatGLM搭建智能答案生成机器人的思路 319
- 17.2.2 获取专业（范畴内）文档与编码存储 320
- 17.2.3 查询文本编码的相关性比较与排序 322
- 17.2.4 基于知识链的ChatGLM本地化知识库检索与智能答案生成 325
17.3 基于ChatGLM的一些补充内容 327
- 17.3.1 语言的艺术—Prompt的前世今生 328
- 17.3.2 清华大学推荐的ChatGLM微调方法 329
- 17.3.2 一种新的基于ChatGLM的文本检索方案 330
17.4 本章小结 331

第18章对训练成本上亿美元的ChatGLM进行高级微调 332

18.1 ChatGLM模型的本地化处理 332
- 18.1.1 下载ChatGLM源码与合并存档 332
- 18.1.2 修正自定义的本地化模型 335
- 18.1.3 构建GLM模型的输入输出示例 337
18.2 高级微调方法1—基于加速库Accelerator的全量数据微调 339
- 18.2.1 数据的准备—将文本内容转化成三元组的知识图谱 339
- 18.2.2 加速的秘密—Accelerate模型加速工具详解 342
- 18.2.3 更快的速度—使用INT8（INT4）量化模型加速训练 345
18.3 高级微调方法2—基于LoRA的模型微调 348
- 18.3.1 对ChatGLM进行微调的方法—LoRA 348
- 18.3.2 自定义LoRA的使用方法 349
- 18.3.3 基于自定义LoRA的模型训练 350
- 18.3.4 基于自定义LoRA的模型推断 352
- 18.3.5 基于基本原理的LoRA实现 355
18.4 高级微调方法3—基于Huggingface的PEFT模型微调 357
- 18.4.1 PEFT技术详解 358
- 18.4.2 PEFT的使用与参数设计 359
- 18.4.3 Huggingface专用PEFT的使用 360
18.5 本章小结 362

我看与他观：在镜像自我与他性间探问

你是凝视者，又是被凝视者。图像或镜像中的世界是那么真实，几乎伸手可触，你却融不进去。它是完全疏离于你的一种存在，和你完全相反，却又貌似于你，或貌似于你的生活环境。尽管如此，如同镜子一样，我们又只有通过它，照出自己的样子，了解自己的处境，认知自我和他者的关系。

《我看与他观--在镜像自我与他性间探问》(作者邓启耀)以摄影的方式，透过人类学的视角，从分别作为主体(我看人)、客体(人看我)乃至相互映照(看人，亦看我)的层面，对人们的生活状态加以勾勒。这里不仅展现出社会文化的变迁，还有在变迁的过程中，作为视觉文化传播者的不同个体，不断进行自身探视的反省。

算法设计

算法设计，ISBN：9787302143352，作者：（美）克林伯格（Kleinberg，J.），（）塔多斯（Tardos，E.）著，张立昂，屈婉玲译

算法设计与分析基础(第3版)

作者基于丰富的教学经验，开发了一套全新的算法分类方法。该分类法站在通用问题求解策略的高度，对现有大多数算法准确分类，从而引领读者沿着一条清晰、一致、连贯的思路来探索算法设计与分析这一迷人领域。

本书作为第3版，相对前版调整了多个章节的内容和顺序，同时增加了一些算法，并扩展了算法的应用，使得具体算法和通用算法设计技术的对应更加清晰有序；各章累计增加了70道习题，其中包括一些有趣的谜题和面试问题。

本书十分适合用作算法设计和分析的基础教材，也适合任何有兴趣探究算法奥秘的读者使用，只要读者具备数据结构和离散数学的知识即可。

算法竞赛入门经典（第2版）

《算法竞赛入门经典（第2版）》是一本算法竞赛的入门与提高教材，把C/C++语言、算法和解题有机地结合在一起，淡化理论，注重学习方法和实践技巧。全书内容分为12 章，包括程序设计入门、循环结构程序设计、数组和字符串、函数和递归、C++与STL入门、数据结构基础、暴力求解法、高效算法设计、动态规划初步、数学概念与方法、图论模型与算法、高级专题等内容，覆盖了算法竞赛入门和提高所需的主要知识点，并含有大量例题和习题。书中的代码规范、简洁、易懂，不仅能帮助读者理解算法原理，还能教会读者很多实用的编程技巧；书中包含的各种开发、测试和调试技巧也是传统的语言、算法类书籍中难以见到的。

《算法竞赛入门经典（第2版）》可作为全国青少年信息学奥林匹克联赛（NOIP）复赛教材、全国青少年信息学奥林匹克竞赛（NOI）和ACM国际大学生程序设计竞赛（ACM/ICPC）的训练资料，也可作为IT工程师与科研人员的参考用书。

算法竞赛入门经典（第一版）

《算法竞赛入门经典》是一本算法竞赛的入门教材，把C/C++语言、算法和解题有机地结合在了一起，淡化理论，注重学习方法和实践技巧。全书内容分为11章，包括程序设计入门、循环结构程序设计、数组和字符串、函数和递归、基础题目选解、数据结构基础、暴力求解法、高效算法设计、动态规划初步、数学概念与方法、图论模型与算法，覆盖了算法竞赛入门所需的主要知识点，并附有大量习题。书中的代码规范、简洁、易懂，不仅能帮助读者理解算法原理，还能教会读者很多实用的编程技巧。另外，书中包含的各种开发、测试和调试技巧也是在传统的语言、算法类书籍中难以见到的。

《算法竞赛入门经典》可作为全国青少年信息学奥林匹克联赛（NOIP）的复赛教材及ACM国际大学。

算法艺术与信息学竞赛

《算法艺术与信息学竞赛》较为系统和全面地介绍了算法学最基本的知识。这些知识和技巧既是高等院校“算法与数据结构”课程的主要内容，也是国际青少年信息学奥林匹克（IOI）竞赛和ACM/ICPC国际大学生程序设计竞赛中所需要的。书中分析了相当数量的问题。

本书共3章。第1章介绍算法与数据结构；第2章介绍数学知识和方法；第3章介绍计算机几何。全书内容丰富，分析透彻，启发性强，既适合读者自学，也适合于课堂讲授。

本书适用于各个层次的信息学爱好者、参赛选手、辅导老师和高等院校计算机专业的师生。本书既是信息学入门和提高的好帮手，也是一本内容丰富、新颖的资料集。

计算机网络

《计算机网络（第4版）》全书按照网络协议模型（物理层、数据链路层、介质访问控制子层、网络层、传输层和应用层），自下而上系统地介绍了计算机网络的基本原理，并给出了大量实例。在讲述各网络层的同时，还融合进了近年来迅速发展起来的各种网络技术，如Internet、SONET、A DSL、CDMA、WLAN和蓝牙等。另外，针对当前计算机网络的发展现状以及计算机安全的重要性，本书用了一整章的篇幅对计算机安全进行了深入讨论。

Python+Spark 2.0+Hadoop机器学习与大数据实战

本书从浅显易懂的“大数据和机器学习”原理说明入手，讲述大数据和机器学习的基本概念，如分类、分析、训练、建模、预测、机器学习（推荐引擎）、机器学习（二元分类）、机器学习（多元分类）、机器学习（回归分析）和数据可视化应用等。书中不仅加入了新近的大数据技术，还丰富了“机器学习”内容。为降低读者学习大数据技术的门槛，书中提供了丰富的上机实践操作和范例程序详解，展示了如何在单机Windows系统上通过Virtual Box虚拟机安装多机Linux虚拟机，如何建立Hadoop集群，再建立Spark开发环境。书中介绍搭建的上机实践平台并不限制于单台实体计算机。对于有条件的公司和学校，参照书中介绍的搭建过程，同样可以实现将自己的平台搭建在多台实体计算机上，以便更加接近于大数据和机器学习真实的运行环境。本书非常适合于学习大数据基础知识的初学者阅读，更适合正在学习大数据理论和技术的人员作为上机实践用的教材。

数据挖掘与机器学习——WEKA应用技术与实践

暂无简介

深入浅出Python机器学习

机器学习正在迅速改变我们的世界。我们几乎每天都会读到机器学习如何改变日常的生活。如果你在淘宝或者京东这样的电子商务网站购买商品，或者在爱奇艺或是腾讯视频这样的视频网站观看节目，甚至只是进行一次百度搜索，就已经触碰到了机器学习的应用。使用这些服务的用户会产生数据，这些数据会被收集，在进行预处理之后用来训练模型，而模型会通过这些数据来提供更好的用户体验。此外，目前还有很多使用机器学习技术的产品或服务即将在我们的生活当中普及，如能够解放双手的无人驾驶汽车、聪明伶俐的智能家居产品、善解人意的导购机器人等。可以说要想深入机器学习的应用开发当中，现在就是一个非常理想的时机。

本书内容涵盖了有监督学习、无监督学习、模型优化、自然语言处理等机器学习领域所必须掌握的知识，从内容结构上非常注重知识的实用性和可操作性。全书采用由浅入深、循序渐进的讲授方式，完全遵循和尊重初学者对机器学习知识的认知规律。本书适合有一定程序设计语言和算法基础的读者学习使用。

幸福的能力

《幸福的能力》内容简介：幸福在哪里？人人都在向外寻找着幸福，却不知幸福力的源头就在自己的心中。当我们具备乐观、坚定、慈善和幸运的软实力，懂得如何调适内心世界，幸福感就会如泉水般涌来，就能体验到长久的快乐和持续的幸福。西哲亚里士多德曾说：“幸福是人生的目的和意义，是人类存在的最终目标和终点。”幸福靠自己，拥有幸福的能力，会让你走进明媚阳光，远离萧瑟寒秋，助你解开郁闷迷茫的症结，踏上人生舞动的鼓点；你会成为自己心灵健康的指导师，并和《幸福的能力》的作者一样将幸福“传染”给更多的人。

海报：

信息系统项目管理师教程（第3版）

本书是全国计算机技术与软件专业技术资格（水平）考试办公室组织编写的考试指定用书，本书根据2017年出版的《信息系统项目管理师考试大纲（第2版）》编写，对信息系统项目管理师岗位所要求的主要知识及应用技术进行了阐述。

本书内容包括：信息化和信息化系统、信息系统项目管理基础、项目立项管理、项目整体管理、项目范围管理、项目进度管理、项目成本管理、项目质量管理、项目人力资源管理、项目沟通管理和干系人管理、项目风险管理、项目采购管理、项目合同管理、信息文档管理与配置管理、知识管理、项目变更管理、战略管理、组织级项目管理、流程管理、项目集管理、项目组合管理、信息系统安全管理、信息系统综合测试与管理、项目管理成熟度模型、量化的项目管理、知识产权与标准规范、管理科学基础知识、项目管理过程实践和案例分析等。

本书是信息系统项目管理师考试应试者必读教材，也可作为信息化教育的培训与辅导用书，还可作为高等院校相关专业的教学与参考用书。

数据库管理系统原理与设计

《数据库管理系统原理与设计》(第3版)由于内容全面，实践性强，已经成为了数据库课程的首选教材。全书分为数据库基础，应用程序开发、存储与索引、查询评估、事务管理、数据库设计与调整、高级主题等七大部分，对数据库的设计与使用、数据库管理系统基本原理与实现技术，以及数据库研究的新进展做了详细论述。《数据库管理系统原理与设计》以一个网上书店的完整设计为例，介绍了数据库系统的具体实现过程。第3版保留了前两版的传统优点，并且加入了许多关于数据库最新研究和发展的内容，每章后面精选的复习题和练习使《数据库管理系统原理与设计》更加吸引人，可读性更强。

Python机器学习及实践

本书面向所有对机器学习与数据挖掘的实践及竞赛感兴趣的读者，从零开始，以Python编程语言为基础，在不涉及大量数学模型与复杂编程知识的前提下，逐步带领读者熟悉并且掌握当下最流行的机器学习、数据挖掘与自然语言处理工具，如Scikitlearn、NLTK、Pandas、gensim、XGBoost、Google Tensorflow等。全书共分4章。第1章简介篇，介绍机器学习概念与Python编程知识；第2章基础篇，讲述如何使用Scikitlearn作为基础机器学习工具；第3章进阶篇，涉及怎样借助高级技术或者模型进一步提升既有机器学习系统的性能；第4章竞赛篇，以Kaggle平台为对象，帮助读者一步步使用本书介绍过的模型和技巧，完成三项具有代表性的竞赛任务。

人工智能

《人工智能：一种现代的方法（第3版）》是最权威、最经典的人工智能教材，已被全世界100多个国家的1200多所大学用作教材。

《人工智能：一种现代的方法（第3版）》的最新版全面而系统地介绍了人工智能的理论和实践，阐述了人工智能领域的核心内容，并深入介绍了各个主要的研究方向。全书分为七大部分：第1部分“人工智能”，第II部分“问题求解”，第III部分“知识、推理与规划”，第IV部分“不确定知识与推理”，第V部分“学习”，第VI部分“通信、感知与行动”，第VII部分“结论”。《人工智能：一种现代的方法（第3版）》既详细介绍了人工智能的基本概念、思想和算法，还描述了其各个研究方向最前沿的进展，同时收集整理了详实的历史文献与事件。另外，本书的配套网址为教师和学生提供了大量教学和学习资料。

本书适合于不同层次和领域的研究人员及学生，是高等院校本科生和研究生人工智能课的首选教材，也是相关领域的科研与工程技术人员的重要参考书。

分布式系统原理与范型

本书是著名作者Tanenbaum关于分布式系统的最新力作，是分布式系统的权威教材。本书分成了两大部分。第2～9章讨论的是分布式系统的的原理、概念和技术，包括通信、进程、命名、同步化、一致性和复制、容错性以及安全性等，而分布式应用的开发方法（即范型）在第10～13章中进行了讨论。但是，与前一版不同的是，我们没有在讨论范型的章节中完整地介绍每个案例研究，而是通过一个有代表性的案例来解释原理。这种介绍方法使得我们不仅精简了素材，而且可以使得读者在阅读和学习时更愉快些。全书结构清晰，内容全面经典，系统性与先进性并茂。

本书适用对象广泛，不仅可以作为学习分布式计算机的本科生和研究生的教材，对于从事分布式计算研究和工程应用的科技人员和工程技术人员来说，本书也是一本优秀的读物。

深度学习、优化与识别

《深度学习、优化与识别》的特色

深度学习是计算机科学与人工智能的重要组成部分。全书16章，分为理论与实践应用两部分，同时介绍5种深度学习主流平台的特性与应用，最后给出了深度学习的前沿进展介绍，另附带47种相关网络模型的实现代码。本书具有以下的特点：

一、内容系统全面

全书16章，覆盖了深度学习当前出现的诸多经典框架或模型，分为两个部分。第一部分系统地从数据、模型、优化目标函数和求解等四个方面论述了深度学习的理论及算法，如卷积神经网络、深度生成模型等；第二部分基于5种主流的深度学习平台给出了深度网络在自然图像、卫星遥感影像等领域的应用，如分类、变化检测、目标检测与识别等任务。另外给出了深度学习发展的脉络图及最新研究进展，提供可基于5种平台实现的47中深度网络代码，以便有兴趣的读者进一步钻研探索。

二、叙述立场客观

作为深度学习的入门教材，尽可能不带偏见地对材料进行分析、加工以及客观介绍。本书理论部分均从模型产生的本源来介绍，并给出各个经典模型之间内在的相互联系。本书实践应用部分对相关任务做了详尽的分析，并给出深度学习应用实践的经验总结。

三、设计装帧精美

该书设计人性化，文字、公式、数学符号混排格式美观精致，特别是，全书采用全彩印制，软精装装帧。封面设计清新却不脱俗、学术化，足可以看出出版社和作者的用心。

内容简介

书籍

计算机书籍

深度神经网络是近年来受到广泛关注的研究方向，它已成为人工智能2.0的主要组成部分。本书系统地论述了深度神经网络基本理论、算法及应用。全书共16章，分为两个部分；第一部分（第1章～10章）系统论述了理论及算法，包括深度前馈神经网络、深度卷积神经网络、深度堆栈神经网络、深度递归神经网络、深度生成网络、深度融合网络等；第二部分（第11～15章）论述了常用的深度学习平台，以及在高光谱图像、自然图像、SAR与极化SAR影像等领域的应用；第16章为总结与展望，给出了深度学习发展的历史图、前沿方向及最新进展。每章都附有相关阅读材料及仿真代码，以便有兴趣的读者进一步钻研探索。

本书可为高等院校计算机科学、电子科学与技术、信息科学、控制科学与工程、人工智能等领域的研究人员提供参考，以及作为相关专业本科生及研究生教学参考书，同时可供深度学习及其应用感兴趣的研究人员和工程技术人员参考。

Python机器学习及实践

分布式系统原理与范型

推荐系统与深度学习

本书的内容设置由浅入深，从传统的推荐算法过渡到近年兴起的深度学习技术。不管是初学者，还是有一定经验的从业人员，相信都能从本书的不同章节中有所收获。区别于其他推荐算法书籍，本书引入了已被实践证明效果较好的深度学习推荐技术，包括Word2Vec、Wide & Deep、DeepFM、GAN 等技术应用，并给出了相关的实践代码；除了在算法层面讲解推荐系统的实现，还从工程层面详细阐述推荐系统如何搭建.

量子计算机

暂无简介

Python机器学习——数据分析与评分卡建模（微课版）

本书在 Python 数据分析与建模方面,既是本人门书,也是一本提高书,它提炼总结了作者从Python 小白到 Python 建模工程师的历程。如果读者有志于数据分析、建模领域,那么它一定会带给读者惊喜。书中代码具有很高的可移植性,可供读者直接使用。
全书共分为8章,从Python的环境搭建到基本语法结构,从趣味应用到分析与建模,最后以社交网络分析结束。
适用于银行业或互联网金融行业中的风控人员，金本书附有教学视频、源代码、课件等配套资源融行业中的数据分析师(或想转行数据分析师的学习者),以及正在学习机器学习的从业人员。

人工智能在信用债投资领域的应用：Python语言实践

内容简介

本书共分三部分，第一部分主要讲述机器学习、深度学习和人工智能的基本方法，并给出了使用基于TensorFlow后台的Keras库做深度学习的实践案例；第二部分主要讲述做信用债投资面临的困难，并给出了实用的解决方案；第三部分主要讲述解决做信用债投资的困难的实用方法，并给出了全部的Python源代码。本书适合在银行、证券、保险、基金等金融机构从事对公信贷和债券投资等工作的相关从业者阅读。

作者简介

金融风险管理师（FRM）；哈尔滨工业大学自动化专业工学学士，中国科学院模式识别与智能系统专业工学硕士，香港中文大学商学院金融MBA；先后工作于穆迪、平安证券、安信证券，主要从事信用债投资研究及信用风险的计量和管理工作；2015年初被评为“深圳市高层次人才”，享受高层次人才补贴。

从零构建大模型算法、训练与微调

内容简介

《从零构建大模型:算法、训练与微调》是一本系统且实用的大模型构建指南，旨在引领读者从基础知识起步，逐步深入探索大模型的算法原理、训练方法及微调技术。《从零构建大模型:算法、训练与微调》共12章，涵盖了Transformer模型的基础理论，如Seq2Seq模型、分词、嵌入层和自注意力机制等关键概念；并深入剖析了GPT模型的核心实现与文本生成过程，以及BERT模型的预训练和微调技术。同时，也对ViT（视觉Transformer）模型的架构、训练方法，以及高阶微调策略如Adapter Tuning和P-Tuning进行了详尽讲解。此外，还系统地介绍了数据处理、数据增强、模型性能优化（包括混合精度训练和分布式训练）、对比学习、对抗训练、自适应优化器、动态学习率调度，以及模型蒸馏与剪枝技术等多个方面。最后，通过应用案例，展示了模型训练和微调的完整流程，助力读者将理论知识转化为实践技能。全书注重理论与实践的结合，适合希望系统掌握大模型构建、训练和优化的研发人员、高校学生，也适合对自然语言处理、计算机视觉等领域的大模型开发有兴趣的读者。还可作为培训机构和高校相关课程的教学用书。

作者简介

梁楠，博士，毕业于北京航空航天大学，高级职称，长期从事模式识别、机器学习、统计理论的研究与应用，负责或参与科研项目多项，专注于人工智能、大语言模型的应用与开发，对深度学习、数据分析与预测等有独到见解。

引言 1
一、大模型技术的发展历史 1
- 1. 基于规则和统计学习的早期阶段 1
- 2. 神经网络与深度学习的崛起 2
- 3. Transformer的诞生与自注意力机制的崛起 2
- 4. 预训练模型的兴起：BERT、GPT和T5 2
- 5. 超大规模模型与多模态应用 3
二、开发环境配置基础 3
- 1. 硬件配置要求 3
- 2. 软件依赖与环境搭建 4
- 3. 常见问题与解决方案 5
第 1 章 Transformer模型基础 6
- 1.1 Seq2Seq模型 6
  - 1.1.1 编码器－解码器工作原理 7
  - 1.1.2 Seq2Seq结构实现 7
- 1.2 分词与嵌入层 11
  - 1.2.1 分词器：将文本转换为嵌入向量 11
  - 1.2.2 PyTorch实现嵌入层（将分词后的结果输入模型） 11
- 1.3 自注意力与多头注意力机制 15
  - 1.3.1 自注意力机制计算过程（QKV矩阵生成和点积运算） 15
  - 1.3.2 多头注意力机制与Transformer 18
- 1.4 残差连接与层归一化 22
  - 1.4.1 残差连接层的实现 22
  - 1.4.2 层归一化与训练稳定性 25
- 1.5 位置编码器 28
  - 1.5.1 位置编码的计算与实现 28
  - 1.5.2 位置编码在无序文本数据中的作用 30
- 1.6 本章小结 35
- 1.7 思考题 35
第 2 章 GPT模型文本生成核心原理与实现 37
- 2.1 GPT-2核心模块 37
  - 2.1.1 层堆叠 37
  - 2.1.2 GPT-2中的注意力机制 41
- 2.2 GPT模型的文本生成过程 44
  - 2.2.1 详解GPT-2文本生成过程 44
  - 2.2.2 Greedy Search和Beam Search算法的实现与对比 47
- 2.3 模型效果评估与调优 51
  - 2.3.1 模型常见评估方法 51
  - 2.3.2 基于困惑度的评估过程 56
- 2.4 本章小结 60
- 2.5 思考题 60
第 3 章 BERT模型核心实现与预训练 62
- 3.1 BERT模型的核心实现 62
  - 3.1.1 编码器堆叠 62
  - 3.1.2 BERT的自注意力机制与掩码任务 67
- 3.2 预训练任务：掩码语言模型（MLM） 71
  - 3.2.1 MLM任务实现过程 71
  - 3.2.2 如何对输入数据进行随机遮掩并预测 72
- 3.3 BERT模型的微调与分类任务应用 77
- 3.4 本章小结 81
- 3.5 思考题 81
第 4 章 ViT模型 83
- 4.1 图像分块与嵌入 83
- 4.2 ViT模型的核心架构实现 89
  - 4.2.1 ViT模型的基础结构 89
  - 4.2.2 自注意力和多头注意力在图像处理中的应用 91
- 4.3 训练与评估ViT模型 96
- 4.4 ViT模型与注意力严格量化分析 100
- 4.5 本章小结 105
- 4.6 思考题 105
第 5 章高阶微调策略：Adapter Tuning与P-Tuning 107
- 5.1 Adapter Tuning的实现 107
- 5.2 LoRA Tuning实现 111
- 5.3 Prompt Tuning与P-Tuning的应用 114
  - 5.3.1 Prompt Tuning 114
  - 5.3.2 P-Tuning 117
  - 5.3.3 Prompt Tuning和P-Tuning组合微调 120
  - 5.3.4 长文本情感分类模型的微调与验证 122
- 5.4 本章小结 125
- 5.5 思考题 125
第 6 章数据处理与数据增强 127
- 6.1 数据预处理与清洗 127
  - 6.1.1 文本数据预处理 127
  - 6.1.2 文本数据清洗 130
- 6.2 文本数据增强 133
  - 6.2.1 同义词替换 133
  - 6.2.2 随机插入 135
  - 6.2.3 其他类型的文本数据增强方法 137
- 6.3 分词与嵌入层的应用 139
  - 6.3.1 深度理解分词技术 140
  - 6.3.2 嵌入向量的生成与优化 142
  - 6.3.3 文本预处理与数据增强综合案例 144
- 6.4 本章小结 146
- 6.5 思考题 147
第 7 章模型性能优化：混合精度训练与分布式训练 148
- 7.1 混合精度训练的实现 148
- 7.2 多GPU并行与分布式训练的实现 150
  - 7.2.1 分布式训练流程与常规配置方案 150
  - 7.2.2 Data Parallel方案 152
  - 7.2.3 Model Parallel方案 154
- 7.3 梯度累积的实现 157
  - 7.3.1 梯度累积初步实现 157
  - 7.3.2 小批量训练中的梯度累积 159
  - 7.3.3 梯度累积处理文本分类任务 161
- 7.4 本章小结 164
- 7.5 思考题 165
第 8 章对比学习与对抗训练 166
- 8.1 对比学习 166
  - 8.1.1 构建正负样本对及损失函数 166
  - 8.1.2 SimCLR的实现与初步应用 171
- 8.2 基于对比学习的预训练与微调 174
  - 8.2.1 通过对比学习进行自监督预训练 175
  - 8.2.2 对比学习在分类、聚类等任务中的表现 180
- 8.3 生成式对抗网络的实现与优化 183
- 8.4 对抗训练在大模型中的应用 188
- 8.5 本章小结 192
- 8.6 思考题 192
第 9 章自适应优化器与动态学习率调度 194
- 9.1 AdamW优化器与LAMB优化器的实现 194
  - 9.1.1 AdamW优化器 194
  - 9.1.2 LAMB优化器 197
- 9.2 基于梯度累积的优化技巧 200
  - 9.2.1 大批量内存受限环境 200
  - 9.2.2 梯度累积的应用场景和参数调整对训练效果的影响 203
- 9.3 动态学习率调度 205
  - 9.3.1 线性衰减 205
  - 9.3.2 余弦退火 207
- 9.4 Warmup与循环学习率调度 209
  - 9.4.1 Warmup策略实现 209
  - 9.4.2 循环学习率调度 211
  - 9.4.3 其他几种常见的动态学习调度器 214
- 9.5 本章小结 217
- 9.6 思考题 218
第 10 章模型蒸馏与剪枝 219
- 10.1 知识蒸馏：教师－学生模型 219
  - 10.1.1 知识蒸馏核心过程 219
  - 10.1.2 教师－学生模型 221
  - 10.1.3 蒸馏损失 224
- 10.2 知识蒸馏在文本模型中的应用 226
  - 10.2.1 知识蒸馏在文本分类模型中的应用 226
  - 10.2.2 模型蒸馏效率分析 229
  - 10.2.3 文本情感分析任务中的知识蒸馏效率对比 231
- 10.3 模型剪枝技术 234
  - 10.3.1 权重剪枝 234
  - 10.3.2 结构化剪枝 237
  - 10.3.3 在嵌入式设备上部署手写数字识别模型 240
  - 10.3.4 BERT模型的多头注意力剪枝 243
- 10.4 本章小结 247
- 10.5 思考题 248
第 11 章模型训练实战 249
- 11.1 数据预处理与Tokenization细节 249
  - 11.1.1 大规模文本数据清洗 249
  - 11.1.2 常用分词器的使用 252
- 11.2 大规模预训练模型的设置与启动 255
- 11.3 预训练过程中的监控与中间结果保存 258
- 11.4 训练中断与恢复机制 262
- 11.5 综合案例：IMDB文本分类训练全流程 265
  - 11.5.1 数据预处理与Tokenization 265
  - 11.5.2 多GPU与分布式训练设置 266
  - 11.5.3 训练过程中的监控与中间结果保存 266
  - 11.5.4 训练中断与恢复 267
  - 11.5.5 测试模型性能 268
- 11.6 本章小结 269
- 11.7 思考题 270
第 12 章模型微调实战 271
- 12.1 微调数据集的选择与准备 271
  - 12.1.1 数据集准备与清洗 271
  - 12.1.2 数据集分割 272
  - 12.1.3 数据增强 272
- 12.2 层级冻结与部分解冻策略 274
- 12.3 模型参数调整与优化技巧 276
- 12.4 微调后的模型评估与推理优化 278
- 12.5 综合微调应用案例 280
- 12.6 本章小结 283
- 12.7 思考题 283

动手学PyTorch建模与应用：从深度学习到大模型

内容简介 · · · · · ·

《动手学PyTorch建模与应用:从深度学习到大模型》是一本从零基础上手深度学习和大模型的PyTorch实战指南。《动手学PyTorch建模与应用:从深度学习到大模型》共11章，第1章主要介绍深度学习的概念、应用场景及开发环境搭建。第2章详细介绍PyTorch数学基础，包括函数、微分、数理统计、矩阵等基础知识及其案例。第3章介绍数据预处理及常用工具，包括NumPy、Pandas、Matplotlib、数据清洗、特征工程以及深度学习解决问题的一般步骤等。第4章介绍PyTorch基础知识，包括张量的创建、激活函数、损失函数、优化器等。第5章介绍PyTorch深度神经网络，包括神经网络概述、卷积神经网络、循环神经网络等。第6章介绍PyTorch数据建模，包括回归分析、聚类分析、主成分分析、模型评估与调优等。第7～10章介绍PyTorch图像建模、文本建模、音频建模和模型可视化。第11章介绍大语言模型的原理、主要的大语言模型及模型本地化部署、预训练与微调技术。本书还精心设计了50个动手案例和上机练习题，并对所有代码进行了详尽注释和说明，同时提供数据集和配书资源文件，以帮助读者更好地使用本书。《动手学PyTorch建模与应用:从深度学习到大模型》讲解深入浅出，注重动手实操，特别适合想学习AI技术或想进入该领域的初学者，对深度学习感兴趣的新手、在校学生和从业者阅读，也很适合作为培训机构和高校相关专业的教学用书。

作者简介 · · · · · ·

王国平，毕业于上海海洋大学，硕士，从业10余年，主要从事数据可视化、数据挖掘和大数据分析与研究等工作。精通数据挖掘技术与相关软件工具，包括Tableau、SPSS、PyTorch、Power Bl等，已出版《IBM SPSS Modeler数据与文本挖掘实战》《Microsoft Power Bl数据可视化与数据分析》《Tableau数据可视化从入门到精通》《零基础入门Python数据分析与机器学习》等图书。

目录 · · · · · ·

第 1 章深度学习和PyTorch概述 1

走进深度学习的世界 1
1. 深度学习的发展历史 1
2. 深度学习框架PyTorch 3
3. 深度学习的应用领域 4
搭建开发环境 5
1. 安装Python 3.12 5
2. 安装代码开发工具Jupyter Lab 9
3. 安装PyTorch 2.2 10
PyTorch的应用场景 14
上机练习题 14

第 2 章 PyTorch数学基础 17

PyTorch中的函数 17
1. 函数的基础知识 17
2. PyTorch中的主要函数 20
微分基础 22
1. 微分及其公式 22
2. PyTorch自动微分 24
数理统计基础 29
1. 数理统计及其指标 29
2. PyTorch统计函数 34
矩阵基础 45
1. 矩阵及其运算 45
2. PyTorch矩阵运算 47
动手练习：拟合余弦函数曲线 54
上机练习题 58

第 3 章数据预处理及常用工具 62

NumPy 62
1. 安装和导入NumPy 62
2. NumPy的数据结构ndarray 63
3. NumPy的基本使用 63
Matplotlib 65
1. 安装和导入Matplotlib 65
2. Matplotlib的使用示例 66
数据清洗 70
1. 数据清洗的作用 70
2. 用Pandas进行数据清洗 71
特征工程 76
1. 特征工程概述 76
2. 使用Scikit-learn进行数据预处理 78
3. 使用Pandas实现特征工程 81
深度学习解决问题的一般步骤 82
动手练习：每日最高温度预测 84
上机练习题 90

第 4 章 PyTorch基础知识 95

张量及其创建 95
1. 张量及其数据类型 95
2. 使用数组直接创建张量 96
3. 使用概率分布创建张量 98
激活函数 99
1. 激活函数及其必要性 99
2. Sigmoid激活函数 100
3. Tanh激活函数 101
4. ReLU激活函数 102
5. Leaky ReLU激活函数 103
6. 其他类型的激活函数 104
损失函数 105
1. 损失函数及其选取 106
2. L1范数损失函数 106
3. 均方误差损失函数 107
4. 交叉熵损失函数 108
5. 余弦相似度损失 109
6. 其他损失函数 109
优化器 110
1. 梯度及梯度下降算法 111
2. 随机梯度下降算法 112
3. 标准动量优化算法 112
4. AdaGrad算法 113
5. RMSProp算法 113
6. Adam算法 114
动手练习：PyTorch优化器比较 114
上机练习题 119

第 5 章 PyTorch深度神经网络 124

神经网络概述 124
1. 神经元模型 124
2. 多层感知机 126
3. 前馈神经网络 128
卷积神经网络 129
1. 卷积神经网络的历史 129
2. 卷积神经网络的结构 130
3. 卷积神经网络的类型 131
循环神经网络 134
1. 简单的循环神经网络 134
2. 长短期记忆网络 136
3. 门控循环单元 138
动手练习：股票成交量趋势预测 139
上机练习题 148

第 6 章 PyTorch数据建模 152

回归分析及案例 152
1. 回归分析简介 152
2. 回归分析建模 153
3. 动手练习：住房价格回归预测 155
聚类分析及案例 160
1. 聚类分析简介 160
2. 聚类分析建模 160
3. 动手练习：植物花卉特征聚类 162
主成分分析及案例 165
1. 主成分分析简介 166
2. 主成分分析建模 166
3. 动手练习：地区竞争力指标降维 167
模型评估与调优 173
1. 模型评估方法 173
2. 模型调优方法 176
3. 动手练习：PyTorch实现交叉验证 178
上机练习题 187

第 7 章 PyTorch图像建模 190

图像建模概述 190
1. 图像分类技术 190
2. 图像识别技术 191
3. 图像分割技术 192
动手练习：创建图像自动分类器 193
1. 加载数据集 193
2. 搭建网络模型 194
3. 训练网络模型 195
4. 应用网络模型 196
动手练习：搭建图像自动识别模型 198
1. 加载数据集 198
2. 搭建与训练网络 200
3. 预测图像数据 202
4. 图像识别模型的判断 202
动手练习：搭建图像自动分割模型 204
1. 加载数据集 205
2. 搭建网络模型 206
3. 训练网络模型 209
4. 应用网络模型 210
上机练习题 212

第 8 章 PyTorch文本建模 220

自然语言处理的几个模型 220
1. Word2Vec模型 220
2. Seq2Seq模型 221
3. Attention模型 222
动手练习：Word2Vec提取相似文本 223
1. 加载数据集 223
2. 搭建网络模型 227
3. 训练网络模型 228
4. 应用网络模型 230
动手练习：Seq2Seq实现机器翻译 231
1. 加载数据集 231
2. 搭建网络模型 237
3. 训练网络模型 240
4. 应用网络模型 242
动手练习：Attention模型实现文本自动分类 244
1. 加载数据集 244
2. 搭建网络模型 246
3. 训练网络模型 247
4. 应用网络模型 251
上机练习题 251

第 9 章 PyTorch音频建模 258

音频处理技术及应用 258
1. 音频处理技术 258
2. 音视频摘要技术及其应用 259
3. 音频识别及应用 260
4. 音频监控及应用 261
5. 场景感知及应用 261
梅尔频率倒谱系数音频特征 262
1. 梅尔频率倒谱系数简介及参数的提取过程 262
2. 音频预处理 263
3. 快速傅里叶变换 264
4. 能量谱处理 264
5. 离散余弦转换 265
PyTorch音频建模技术 266
1. 加载音频数据源 266
2. 波形变换的类型 267
3. 绘制波形频谱图 268
4. 波形Mu-Law编码 270
5. 变换前后波形的比较 272
动手练习：音频相似度分析 273
上机练习题 276

第 10 章 PyTorch模型可视化 278

Visdom 278
1. Visdom简介 278
2. Visdom可视化操作 280
3. 动手练习：识别手写数字 296
TensorBoard 301
1. TensorBoard简介 301
2. TensorBoard基础操作 303
3. 动手练习：可视化模型参数 312
Pytorchviz 314
1. Pytorchviz简介 314
2. 动手练习：Pytorchviz建模可视化 314
Netron 317
1. Netron简介 317
2. 动手练习：Netron建模可视化 317
上机练习题 321

第 11 章从深度学习到大语言模型 323

大语言模型的原理 323
1. 大语言模型简介 323
2. Transformer架构 324
3. 注意力机制 327
主要的大语言模型 331
1. ChatGPT及其API调用 331
2. 文心一言及其插件开发 334
3. ChatGLM及其本地部署 338
模型预训练与微调 350
1. 大模型预训练 350
2. 大模型微调技术 353
上机练习题 361

参考文献 363

Python项目案例开发从入门到实战——爬虫、游戏和机器学习（从入门到实战·微课视频）

本书以Python 3.7为编程环境，从基本的程序设计思想入手，逐步展开Python语言教学，是一本面向广大编程学习者的程序设计类图书。全书分为基础篇、图像处理和可视化篇、爬虫技术开发篇、人工智能开发篇和游戏开发提高篇。基础篇（第1~7章）主要讲解Python的基础语法知识、控制语句、函数、文件、面向对象编程基础、Tkinter图形界面设计、网络编程和多线程、Python数据库应用等知识，并以游戏案例作为各章的阶段性任务。图像处理和可视化篇(第8～9章)通过“人物拼图游戏”“学生成绩分布柱状图展示”案例学习Python图像处理和可视化功能。爬虫技术开发篇(第10～13章)应用爬虫技术开发“小小翻译器”“校园网搜索引擎”“爬取百度图片”和使用爬虫模拟登录技术的案例，讲解Python爬虫的关键技术。人工智能开发篇(第14～16章)主要讲解基于朴素贝叶斯算法的文本分类、基于卷积神经网络的手写体识别和基于OpenCV实现人脸识别三个案例。游戏开发提高篇（第17章）借助第三方Pygame库开发大家耳熟能详的Flappy Bird（又称笨鸟先飞）游戏。通过本书，读者将学会Python编程技术和技巧，掌握第三方库的使用，了解程序设计的所有相关内容。本书不仅列出了完整的代码，同时对所有的源代码进行了非常详细的解释，做到通俗易懂，图文并茂。
本书适用于Python语言学习者、程序设计人员和游戏编程爱好者。

深度学习技术：图像处理入门

本书从机器学习、图像处理的基本概念入手，逐步阐述深度学习图像处理技术的基本原理以及简单的实现。继而以几个实战案例来介绍如何使用深度学习方法，在数据分析竞赛中取得较高的排名。#后，通过一个实战案例，介绍如何将模型放入 iOS 程序，制作相应的人工智能手机App。

本书适用于对深度学习有兴趣、希望入门这一领域的理工科大学生、研究生，以及希望了解该领域基本原理的软件开发人员。此外，本书所有案例均提供了云环境上的代码，便于读者复现结果，并进行深入学习。

机器学习与应用

暂无简介

机器学习算法实践：推荐系统的协同过滤理论及其应用

个性化推荐能够根据用户的历史行为显式或者隐式地挖掘用户潜在的兴趣和需求，并为其推送个性化信息，因此受到研究者的追捧及工业界的青睐，其研究具有重大的学术价值及商业应用价值，已广泛应用于大型电子商务平台、社交平台、新闻客户端以及其他各类旅游和娱乐类网站中。

本书内容丰富，较全面地介绍了基于协同过滤的推荐系统存在的问题、解决方法和评估策略，主要内容涉及协同过滤推荐算法中的时序技术、矩阵分解技术和社交网络信任技术等知识。

本书可供从事推荐系统、人工智能、机器学习、模式识别和信息检索等领域的科研人员及研究生阅读、参考。

机器学习经典算法实践

暂无简介

机器学习基础

本书全面系统地介绍了机器学习的基本概念、预备知识、主要思想、研究进展、基础技术、应用技巧，并围绕当前机器学习领域的热点问题展开讨论。全书共11章，主要内容包括决策树、神经网络、支持向量机、遗传算法、回归、聚类分析等。

本书可作为高等院校计算机、软件工程、智能科学与技术等专业研究生和高年级本科生的教材，同时对于从事人工智能、数据挖掘、模式识别等相关技术人员也具有较高的参考价值。

AlphaGo如何战胜人类围棋大师——智能硬件TensorFlow实践

暂无简介

群体智能与计算智能优化的盲均衡算法

暂无简介

AI人工智能

AI人工智能发展简史+技术案例+商业应用

TensorFlow深度学习应用实践

本书总的指导思想是在掌握深度学习的基本知识和特性的基础上，培养使用TensorFlow进行实际编程以解决图像处理相关问题的能力。全书力求深入浅出，通过通俗易懂的语言和详细的程序分析，介绍TensorFlow的基本用法、高级模型设计和对应的程序编写。本书共22章，内容包括Python类库的安装和使用、TensorFlow基本数据结构和使用、TensorFlow数据集的创建与读取、人工神经网络、反馈神经网络、全卷积神经网络的理论基础、深度学习模型的创建、模型的特性、算法、ResNet、Slim、GAN等。本书强调理论联系实际，重点介绍TensorFlow编程解决图像识别的应用，提供了大量数据集，并以代码的形式实现了深度学习模型，以供读者参考。本书既可作为学习人工神经网络、深度学习、TensorFlow程序设计以及图像处理等相关内容的程序设计人员培训和自学用书，也可作为高等院校和培训机构相关专业的教材。

进化算法在生物多序列比对中的应用

本书全面系统地介绍了进化算法在生物多序列比对中的应用，根据内容的分类，分为“多序列比对基础篇”“多序列比对模拟篇”和“多序列比对参数篇”三个模块。首先介绍生物多序列比对的基础知识，包括多序列比对的基本概念、原理、方法、常用数据库、常用工具和应用等内容，并介绍进化算法和最优化理论的基础知识，以及遗传算法、粒子群优化算法和量子粒子群优化算法的优化过程及收敛性分析，为进行多序列比对的模拟提供理论基础;然后详细介绍各进化算法模拟多序列比对的过程与结果: 最后对于多序列比对最重要的目标函数参数进行建模与分析。本书具有系统性强、可读性强、可操作性强等特点。

基于机器学习的遥感影像分类方法研究

机器学习是人工智能的一个重要领域，源自于统计模型拟合。机器学习通过采用推理及样本学习等方式从数据中获得相应的理论，尤其适合解决“噪声”模式及大规模数据集等问题。《基于机器学习的遥感影像分类方法研究》是作者刘颖几年来科研成果的总结。全书共7章，围绕遥感图像分类这一主线，深入研究监督学习、半监督学习、集成学习三大主流机器学习算法，构建完整的遥感图像分类体系。在理论研究的基础上，结合实例，详细介绍了改进机器学习算法及其在遥感分类处理中的应用情况。

《基于机器学习的遥感影像分类方法研究》内容充实、结构清晰、实例丰富，适合从事计算机及相关学科的师生，以及相关科研院所的科研人员阅读。

人工智能与信息感知

暂无简介

计算智能

《计算智能》对计算智能领域的主要算法进行介绍，重点讨论各种算法的思想来源、流程结构、发展改进、参数设置和相关应用，内容包括绪论以及神经网络、模糊逻辑、遗传算法、蚁群优化算法、粒子群优化算法、免疫算法、分布估计算法、Memetic算法、模拟退火算法和禁忌搜索算法等计算智能领域的典型算法。《计算智能》通俗易懂，图文并茂，深入浅出，没有其他算法书中大量公式、定理、证明等难懂的内容，而是通过大量的图表示例对各个算法进行说明和介绍。《计算智能》不但提供了算法实现的流程图和伪代码，而且通过具体的应用举例对算法的使用方法和使用过程进行说明，同时提供了大量经典而重要的参考资料，为读者进一步深入学习和理解算法提供方便。《计算智能》适合作为相关专业本科生和研究生的选修课教材，特别适合作为入门教材以满足算法初学者了解和学习计算智能算法的入门需求，同时还能够作为广大算法研究者和工程技术人员进一步学习的参考书和工具书。

PHP7实践指南：O2O网站与App后台开发

暂无简介

JavaScript完全参考手册(第3版)

由专家级开发人员撰写的《JavaScript 完全参考手册（第3版）》介绍多项成熟技术和最佳实践，指导你设计、调试及发布性能卓越的网站和应用程序。《JavaScript 完全参考手册（第3版）》在上一版的基础上做了全面扩展和更新，融入了最新JavaScript功能、工具和编程方法。

《JavaScript 完全参考手册（第3版）》呈现大量范例、示例代码和实用开发建议，内容涵盖JavaScript核心知识乃至现代Web浏览器支持的各种标准API和新API。无论你想深入了解JavaScript弱类型等基础知识，还是想透彻理解闭包等高级主题，或要执行表单验证或Ajax调用等常见任务，这本内容丰富、讲解深刻的经典书籍都将让你如愿以偿。

计算机科学技术百科全书（第三版）

《全书》根据计算机学科的内在联系、相关程度与性质特点，划分为“计算机科学理论”、“计算机组织与体系结构”、“计算机软件”、“计算机硬件”、“计算机应用技术”和“人工智能”6大分支，按4级框架，共设置1293个条目200多万字。由于中文信息处理是我国及全球汉字通用地区计算机应用中的重要技术，特在“计算机应用技术”分支中，设置有关中文信息处理条目80余条，以供读者查阅。《全书》按照不同层次与内容涉及范围，将条目释文分为大、中、小3类。在释文中有一定释义的常用名词术语还择要列作“主题词”者共约1031个，与条目一起编入内容索引中，以利查阅。《全书》“总论”全面总览了计算机科学技术的内涵与对人类社会发展的巨大作用与深远意义，以引导读者全面、科学地认识计算机科学技术。

组合最优化 : 算法和复杂性

本书前七章介绍线性规划与对偶性理论；第八章介绍分析算法复杂性的技巧；第九至第十二章描述关于流、匹配和支撑树的现代快速算法及其一般拟阵形式；第十三、十四章讨论整数规划；第十五、十六章讲述了其他书较少述及的NP-完备性问题；最后三章介绍一些困难问题的实用方法。每章均有习题、注释及参考资料。

Java 9编程参考官方大全（第10版）

暂无简介

Java 7编程高级进阶

本书包含了众多专家级编程技术，学习这些技术可以让你的Java水平上升至一个新的台阶。借助真实环境下的代码示例与详尽介绍，《Java 7编程高级进阶》展示了如何充分利用Java SE 7的强大特性，讲述了如何设计多线程与网络应用程序，集成结构化的异常处理，使用Java类库以及开发基于Swing的GUI与applet。另外，继承、泛型与各种实用类也在书中进行了介绍。

数据库云平台理论与实践

《数据库云平台理论与实践》作为计算机、网络工程、信息管理院校研究生的高端教材，适合具有一定计算机基础知识的读者学习，也可作为数据分析师、系统架构师的数据库、云技术培训教材，以及各企事业组织实施信息化建设、流程再造、大数据的生态系统构建和信息化基础知识训练的参考书。

Java中文文本信息处理

全书以零基础的读者自学完成一个中文分词系统作为目标。从Java基础语法开始，然后到文本处理相关的数据结构和算法，*后实现文本切分和词性标注。本书是少有的介绍业界热门的Java开发中文分词的书籍。本书选取相关领域的经典内容深入理解和挖掘，也综合了实践性强的创新想法。适用于对软件开发感兴趣的青少年或者大学生。

本站基于Calibre构建，感谢开源界的力量。所有资源搜集于互联网，如有侵权请邮件联系。

Github | Docker | Project