"机器学习”标签的书籍

含有"机器学习"标签的书籍

内容简介

《基于大模型的RAG应用开发与优化——构建企业级LLM应用》是一本全面介绍基于大语言模型的RAG应用开发的专业图书。本书共分为3篇：预备篇、基础篇和高级篇。预备篇旨在帮助你建立起对大模型与RAG的基本认识，并引导你搭建起RAG应用开发的基础环境；基础篇聚焦于经典RAG应用开发的核心要素与阶段，介绍关键模块的开发过程，剖析相关的技术原理，为后面的深入学习打下坚实的基础；高级篇聚焦于RAG应用开发的高阶模块与技巧，特别是在企业级RAG应用开发中的优化策略与技术实现，并探索了一些新型的RAG工作流与范式，旨在帮助你了解最新的RAG应用技术发展，掌握RAG应用的全方位开发能力。《基于大模型的RAG应用开发与优化——构建企业级LLM应用》适合对大模型及RAG技术感兴趣的开发者、研究人员、产品经理及希望了解并掌握RAG应用开发能力的人阅读。无论你是进入AI领域的初学者，还是已经有一定基础的进阶者，都能从本书中找到适合自己的内容。

作者简介

严灿平
毕业于南京理工大学计算机系，南京大学工商管理硕士。先后就职于联创（后与亚信科技合并）担任软件工程师与设计师，甲骨文中国（Oracle）担任中国区企业架构部首席架构师，上海慧问信息科技有限公司担任合伙人兼技术总监。现为独立IT咨询顾问，公众号“AI大模型应用实践”主理人。拥有超过20年的企业软件从业经验，专注于企业软件架构设计、互联网时代传统行业的IT转型、人工智能与大数据技术在企业应用的创新等。曾担任多项大型企业级软件系统核心架构师与咨询师，参与包括中国移动、中国电信等通信行业客户的核心业务运营支撑系统建设、智慧城市与政务行业互联网转型的IT咨询与规划。精通多种计算机软件开发技术与IT架构方法论，对移动互联网、大数据、人工智能在企业领域应用有深入的研究与实施经验。

预备篇
- 第1章了解大模型与RAG 3
  - 1.1 初识大模型 3
    - 1.1.1　大模型时代：生成式AI应用的爆发 3
    - 1.1.2　大模型应用的持续进化 4
    - 1.1.3　大模型是无所不能的吗 7
  - 1.2　了解RAG 11
    - 1.2.1　为什么需要RAG 11
    - 1.2.2　一个简单的RAG场景 12
  - 1.3　RAG应用的技术架构 14
    - 1.3.1　RAG应用的经典架构与流程 14
    - 1.3.2　RAG应用面临的挑战 17
    - 1.3.3　RAG应用架构的演进 18
  - 1.4　关于RAG的两个话题 20
    - 1.4.1　RAG与微调的选择 21
    - 1.4.2　RAG与具有理解超长上下文能力的大模型 24
- 第2章 RAG应用开发环境搭建 27
  - 2.1 开发RAG应用的两种方式 27
    - 2.1.1 使用低代码开发平台 27
    - 2.1.2 使用大模型应用开发框架 29
  - 2.2 RAG应用开发环境准备 33
    - 2.2.1 硬件环境建议 33
    - 2.2.2 基础大模型 34
    - 2.2.3 嵌入模型 41
    - 2.2.4 Python虚拟运行环境 44
    - 2.2.5 Python IDE与开发插件 45
    - 2.2.6 向量库 47
    - 2.2.7 LlamaIndex框架 51
  - 2.3 关于本书开发环境的约定 51
基　础　篇
- 第3章初识RAG应用开发 55
  - 3.1 开发一个最简单的RAG应用 55
    - 3.1.1 使用原生代码开发 56
    - 3.1.2 使用LlamaIndex框架开发 64
    - 3.1.3 使用LangChain框架开发 68
  - 3.2 如何跟踪与调试RAG应用 70
    - 3.2.1 借助LlamaDebugHandler 70
    - 3.2.2 借助第三方的跟踪与调试平台 73
  - 3.3 准备：基于LlamaIndex框架的RAG应用开发核心组件 77
- 第4章模型与Prompt 78
  - 4.1 大模型 78
    - 4.1.1 大模型在RAG应用中的作用 79
    - 4.1.2 大模型组件的统一接口 80
    - 4.1.3 大模型组件的单独使用 82
    - 4.1.4 大模型组件的集成使用 83
    - 4.1.5 了解与设置大模型的参数 84
    - 4.1.6 自定义大模型组件 85
    - 4.1.7 使用LangChain框架中的大模型组件 87
  - 4.2 Prompt 87
    - 4.2.1 使用Prompt模板 87
    - 4.2.2 更改默认的Prompt模板 88
    - 4.2.3 更改Prompt模板的变量 91
  - 4.3 嵌入模型 92
    - 4.3.1 嵌入模型在RAG应用中的作用 92
    - 4.3.2 嵌入模型组件的接口 93
    - 4.3.3 嵌入模型组件的单独使用 95
    - 4.3.4 嵌入模型组件的集成使用 97
    - 4.3.5 了解与设置嵌入模型的参数 97
    - 4.3.6 自定义嵌入模型组件 98
- 第5章数据加载与分割 100
  - 5.1 理解两个概念：Document与Node 100
    - 5.1.1 什么是Document与Node 100
    - 5.1.2 深入理解Document与Node 102
    - 5.1.3 深入理解Node对象的元数据 103
    - 5.1.4 生成Document对象 106
    - 5.1.5 生成Node对象 107
    - 5.1.6 元数据的生成与抽取 111
    - 5.1.7 初步了解IndexNode类型 115
  - 5.2 数据加载 116
    - 5.2.1 从本地目录中加载 117
    - 5.2.2 从网络中加载数据 123
  - 5.3 数据分割 129
    - 5.3.1 如何使用数据分割器 129
    - 5.3.2 常见的数据分割器 131
  - 5.4 数据摄取管道 145
    - 5.4.1 什么是数据摄取管道 145
    - 5.4.2 用于数据摄取管道的转换器 147
    - 5.4.3 自定义转换器 149
    - 5.4.4 使用数据摄取管道 150
  - 5.5 完整认识数据加载阶段 155
- 第6章数据嵌入与索引 156
  - 6.1 理解嵌入与向量 156
    - 6.1.1 直接用模型生成向量 157
    - 6.1.2 借助转换器生成向量 157
  - 6.2 向量存储 158
    - 6.2.1 简单向量存储 159
    - 6.2.2 第三方向量存储 161
  - 6.3 向量存储索引 164
    - 6.3.1 用向量存储构造向量存储索引对象 165
    - 6.3.2 用Node列表构造向量存储索引对象 166
    - 6.3.3 用文档直接构造向量存储索引对象 169
    - 6.3.4 深入理解向量存储索引对象 172
  - 6.4 更多索引类型 175
    - 6.4.1 文档摘要索引 175
    - 6.4.2 对象索引 177
    - 6.4.3 知识图谱索引 180
    - 6.4.4 树索引 186
    - 6.4.5 关键词表索引 187
- 第7章检索、响应生成与RAG引擎 190
  - 7.1 检索器 191
    - 7.1.1 快速构造检索器 191
    - 7.1.2 理解检索模式与检索参数 192
    - 7.1.3 初步认识递归检索 197
  - 7.2 响应生成器 199
    - 7.2.1 构造响应生成器 200
    - 7.2.2 响应生成模式 201
    - 7.2.3 响应生成器的参数 210
    - 7.2.4 实现自定义的响应生成器 212
  - 7.3 RAG引擎：查询引擎 214
    - 7.3.1 构造内置类型的查询引擎的两种方法 214
    - 7.3.2 深入理解查询引擎的内部结构和运行原理 217
    - 7.3.3 自定义查询引擎 218
  - 7.4 RAG引擎：对话引擎 221
    - 7.4.1 对话引擎的两种构造方法 221
    - 7.4.2 深入理解对话引擎的内部运行和运行原理 224
    - 7.4.3 理解不同的对话模式 227
  - 7.5 结构化输出 239
    - 7.5.1 使用output_cls参数 240
    - 7.5.2 使用输出解析器 241
高级篇
- 第8章 RAG引擎高级开发 247
  - 8.1 检索前查询转换 247
    - 8.1.1 简单查询转换 248
    - 8.1.2 HyDE查询转换 249
    - 8.1.3 多步查询转换 251
    - 8.1.4 子问题查询转换 254
  - 8.2 检索后处理器 259
    - 8.2.1 使用节点后处理器 259
    - 8.2.2 实现自定义的节点后处理器 260
    - 8.2.3 常见的预定义的节点后处理器 261
    - 8.2.4 Rerank节点后处理器 266
  - 8.3 语义路由 272
    - 8.3.1 了解语义路由 272
    - 8.3.2 带有路由功能的查询引擎 274
    - 8.3.3 带有路由功能的检索器 276
    - 8.3.4 使用独立的选择器 277
    - 8.3.5 可多选的路由查询引擎 278
  - 8.4 SQL查询引擎 280
    - 8.4.1 使用NLSQLTableQueryEngine组件 281
    - 8.4.2 基于实时表检索的查询引擎 283
    - 8.4.3 使用SQL检索器 285
  - 8.5 多模态文档处理 286
    - 8.5.1 多模态文档处理架构 286
    - 8.5.2 使用LlamaParse解析文档 288
    - 8.5.3 多模态文档中的表格处理 294
    - 8.5.4 多模态大模型的基础应用 297
    - 8.5.5 多模态文档中的图片处理 303
  - 8.6 查询管道：编排基于Graph的RAG工作流 308
    - 8.6.1 理解查询管道 309
    - 8.6.2 查询管道支持的两种使用方式 310
    - 8.6.3 深入理解查询管道的内部原理 313
    - 8.6.4 实现并插入自定义的查询组件 315
- 第9章开发Data Agent 321
  - 9.1 初步认识Data Agent 322
  - 9.2 构造与使用Agent的工具 323
    - 9.2.1 深入了解工具类型 324
    - 9.2.2 函数工具 325
    - 9.2.3 查询引擎工具 326
    - 9.2.4 检索工具 327
    - 9.2.5 查询计划工具 328
    - 9.2.6 按需加载工具 330
  - 9.3 基于函数调用功能直接开发Agent 331
  - 9.4 用框架组件开发Agent 335
    - 9.4.1 使用OpenAIAgent 335
    - 9.4.2 使用ReActAgent 336
    - 9.4.3 使用底层API开发Agent 338
    - 9.4.4 开发带有工具检索功能的Agent 340
    - 9.4.5 开发带有上下文检索功能的Agent 341
  - 9.5 更细粒度地控制Agent的运行 343
    - 9.5.1 分步可控地运行Agent 344
    - 9.5.2 在Agent运行中增加人类交互 346
- 第10章评估RAG应用 349
  - 10.1 为什么RAG应用需要评估 349
  - 10.2 RAG应用的评估依据与指标 350
  - 10.3 RAG应用的评估流程与方法 351
  - 10.4 评估检索质量 352
    - 10.4.1 生成检索评估数据集 352
    - 10.4.2 运行评估检索过程的程序 354
  - 10.5 评估响应质量 356
    - 10.5.1 生成响应评估数据集 356
    - 10.5.2 单次响应评估 358
    - 10.5.3 批量响应评估 360
  - 10.6 基于自定义标准的评估 362
- 第11章企业级RAG应用的常见优化策略 364
  - 11.1 选择合适的知识块大小 364
    - 11.1.1 为什么知识块大小很重要 364
    - 11.1.2 评估知识块大小 365
  - 11.2 分离检索阶段的知识块与生成阶段的知识块 369
    - 11.2.1 为什么需要分离 369
    - 11.2.2 常见的分离策略及实现 369
  - 11.3 优化对大文档集知识库的检索 378
    - 11.3.1 元数据过滤 + 向量检索 378
    - 11.3.2 摘要检索+ 内容检索 383
    - 11.3.3 多文档Agentic RAG 390
  - 11.4 使用高级检索方法 397
    - 11.4.1 融合检索 398
    - 11.4.2 递归检索 406
- 第12章构建端到端的企业级RAG应用 429
  - 12.1 对生产型RAG应用的主要考量 429
  - 12.2 端到端的企业级RAG应用架构 430
    - 12.2.1 数据存储层 431
    - 12.2.2 AI模型层 432
    - 12.2.3 RAG工作流与API模块 432
    - 12.2.4 前端应用模块 433
    - 12.2.5 后台管理模块 434
  - 12.3 端到端的全栈RAG应用案例 436
    - 12.3.1 简单的全栈RAG查询应用 436
    - 12.3.2 基于多文档Agent的端到端对话应用 455
- 第13章新型RAG范式原理与实现 478
  - 13.1 自纠错RAG：C-RAG 478
    - 13.1.1 C-RAG诞生的动机 478
    - 13.1.2 C-RAG的原理 479
    - 13.1.3 C-RAG的实现 480
  - 13.2 自省式RAG：Self-RAG 485
    - 13.2.1 Self-RAG诞生的动机 485
    - 13.2.2 Self-RAG的原理 486
    - 13.2.3 Self-RAG的实现 493
    - 13.2.4 Self-RAG的优化 506
  - 13.3 检索树RAG：RAPTOR 507
    - 13.3.1 RAPTOR诞生的动机 507
    - 13.3.2 RAPTOR的原理 508
    - 13.3.3 RAPTOR的实现 510

Python机器学习——数据分析与评分卡建模（微课版）

本书在 Python 数据分析与建模方面,既是本人门书,也是一本提高书,它提炼总结了作者从Python 小白到 Python 建模工程师的历程。如果读者有志于数据分析、建模领域,那么它一定会带给读者惊喜。书中代码具有很高的可移植性,可供读者直接使用。
全书共分为8章,从Python的环境搭建到基本语法结构,从趣味应用到分析与建模,最后以社交网络分析结束。
适用于银行业或互联网金融行业中的风控人员，金本书附有教学视频、源代码、课件等配套资源融行业中的数据分析师(或想转行数据分析师的学习者),以及正在学习机器学习的从业人员。

人工智能在信用债投资领域的应用：Python语言实践

内容简介

本书共分三部分，第一部分主要讲述机器学习、深度学习和人工智能的基本方法，并给出了使用基于TensorFlow后台的Keras库做深度学习的实践案例；第二部分主要讲述做信用债投资面临的困难，并给出了实用的解决方案；第三部分主要讲述解决做信用债投资的困难的实用方法，并给出了全部的Python源代码。本书适合在银行、证券、保险、基金等金融机构从事对公信贷和债券投资等工作的相关从业者阅读。

作者简介

金融风险管理师（FRM）；哈尔滨工业大学自动化专业工学学士，中国科学院模式识别与智能系统专业工学硕士，香港中文大学商学院金融MBA；先后工作于穆迪、平安证券、安信证券，主要从事信用债投资研究及信用风险的计量和管理工作；2015年初被评为“深圳市高层次人才”，享受高层次人才补贴。

从零构建大模型算法、训练与微调

内容简介

《从零构建大模型:算法、训练与微调》是一本系统且实用的大模型构建指南，旨在引领读者从基础知识起步，逐步深入探索大模型的算法原理、训练方法及微调技术。《从零构建大模型:算法、训练与微调》共12章，涵盖了Transformer模型的基础理论，如Seq2Seq模型、分词、嵌入层和自注意力机制等关键概念；并深入剖析了GPT模型的核心实现与文本生成过程，以及BERT模型的预训练和微调技术。同时，也对ViT（视觉Transformer）模型的架构、训练方法，以及高阶微调策略如Adapter Tuning和P-Tuning进行了详尽讲解。此外，还系统地介绍了数据处理、数据增强、模型性能优化（包括混合精度训练和分布式训练）、对比学习、对抗训练、自适应优化器、动态学习率调度，以及模型蒸馏与剪枝技术等多个方面。最后，通过应用案例，展示了模型训练和微调的完整流程，助力读者将理论知识转化为实践技能。全书注重理论与实践的结合，适合希望系统掌握大模型构建、训练和优化的研发人员、高校学生，也适合对自然语言处理、计算机视觉等领域的大模型开发有兴趣的读者。还可作为培训机构和高校相关课程的教学用书。

作者简介

梁楠，博士，毕业于北京航空航天大学，高级职称，长期从事模式识别、机器学习、统计理论的研究与应用，负责或参与科研项目多项，专注于人工智能、大语言模型的应用与开发，对深度学习、数据分析与预测等有独到见解。

引言 1
一、大模型技术的发展历史 1
- 1. 基于规则和统计学习的早期阶段 1
- 2. 神经网络与深度学习的崛起 2
- 3. Transformer的诞生与自注意力机制的崛起 2
- 4. 预训练模型的兴起：BERT、GPT和T5 2
- 5. 超大规模模型与多模态应用 3
二、开发环境配置基础 3
- 1. 硬件配置要求 3
- 2. 软件依赖与环境搭建 4
- 3. 常见问题与解决方案 5
第 1 章 Transformer模型基础 6
- 1.1 Seq2Seq模型 6
  - 1.1.1 编码器－解码器工作原理 7
  - 1.1.2 Seq2Seq结构实现 7
- 1.2 分词与嵌入层 11
  - 1.2.1 分词器：将文本转换为嵌入向量 11
  - 1.2.2 PyTorch实现嵌入层（将分词后的结果输入模型） 11
- 1.3 自注意力与多头注意力机制 15
  - 1.3.1 自注意力机制计算过程（QKV矩阵生成和点积运算） 15
  - 1.3.2 多头注意力机制与Transformer 18
- 1.4 残差连接与层归一化 22
  - 1.4.1 残差连接层的实现 22
  - 1.4.2 层归一化与训练稳定性 25
- 1.5 位置编码器 28
  - 1.5.1 位置编码的计算与实现 28
  - 1.5.2 位置编码在无序文本数据中的作用 30
- 1.6 本章小结 35
- 1.7 思考题 35
第 2 章 GPT模型文本生成核心原理与实现 37
- 2.1 GPT-2核心模块 37
  - 2.1.1 层堆叠 37
  - 2.1.2 GPT-2中的注意力机制 41
- 2.2 GPT模型的文本生成过程 44
  - 2.2.1 详解GPT-2文本生成过程 44
  - 2.2.2 Greedy Search和Beam Search算法的实现与对比 47
- 2.3 模型效果评估与调优 51
  - 2.3.1 模型常见评估方法 51
  - 2.3.2 基于困惑度的评估过程 56
- 2.4 本章小结 60
- 2.5 思考题 60
第 3 章 BERT模型核心实现与预训练 62
- 3.1 BERT模型的核心实现 62
  - 3.1.1 编码器堆叠 62
  - 3.1.2 BERT的自注意力机制与掩码任务 67
- 3.2 预训练任务：掩码语言模型（MLM） 71
  - 3.2.1 MLM任务实现过程 71
  - 3.2.2 如何对输入数据进行随机遮掩并预测 72
- 3.3 BERT模型的微调与分类任务应用 77
- 3.4 本章小结 81
- 3.5 思考题 81
第 4 章 ViT模型 83
- 4.1 图像分块与嵌入 83
- 4.2 ViT模型的核心架构实现 89
  - 4.2.1 ViT模型的基础结构 89
  - 4.2.2 自注意力和多头注意力在图像处理中的应用 91
- 4.3 训练与评估ViT模型 96
- 4.4 ViT模型与注意力严格量化分析 100
- 4.5 本章小结 105
- 4.6 思考题 105
第 5 章高阶微调策略：Adapter Tuning与P-Tuning 107
- 5.1 Adapter Tuning的实现 107
- 5.2 LoRA Tuning实现 111
- 5.3 Prompt Tuning与P-Tuning的应用 114
  - 5.3.1 Prompt Tuning 114
  - 5.3.2 P-Tuning 117
  - 5.3.3 Prompt Tuning和P-Tuning组合微调 120
  - 5.3.4 长文本情感分类模型的微调与验证 122
- 5.4 本章小结 125
- 5.5 思考题 125
第 6 章数据处理与数据增强 127
- 6.1 数据预处理与清洗 127
  - 6.1.1 文本数据预处理 127
  - 6.1.2 文本数据清洗 130
- 6.2 文本数据增强 133
  - 6.2.1 同义词替换 133
  - 6.2.2 随机插入 135
  - 6.2.3 其他类型的文本数据增强方法 137
- 6.3 分词与嵌入层的应用 139
  - 6.3.1 深度理解分词技术 140
  - 6.3.2 嵌入向量的生成与优化 142
  - 6.3.3 文本预处理与数据增强综合案例 144
- 6.4 本章小结 146
- 6.5 思考题 147
第 7 章模型性能优化：混合精度训练与分布式训练 148
- 7.1 混合精度训练的实现 148
- 7.2 多GPU并行与分布式训练的实现 150
  - 7.2.1 分布式训练流程与常规配置方案 150
  - 7.2.2 Data Parallel方案 152
  - 7.2.3 Model Parallel方案 154
- 7.3 梯度累积的实现 157
  - 7.3.1 梯度累积初步实现 157
  - 7.3.2 小批量训练中的梯度累积 159
  - 7.3.3 梯度累积处理文本分类任务 161
- 7.4 本章小结 164
- 7.5 思考题 165
第 8 章对比学习与对抗训练 166
- 8.1 对比学习 166
  - 8.1.1 构建正负样本对及损失函数 166
  - 8.1.2 SimCLR的实现与初步应用 171
- 8.2 基于对比学习的预训练与微调 174
  - 8.2.1 通过对比学习进行自监督预训练 175
  - 8.2.2 对比学习在分类、聚类等任务中的表现 180
- 8.3 生成式对抗网络的实现与优化 183
- 8.4 对抗训练在大模型中的应用 188
- 8.5 本章小结 192
- 8.6 思考题 192
第 9 章自适应优化器与动态学习率调度 194
- 9.1 AdamW优化器与LAMB优化器的实现 194
  - 9.1.1 AdamW优化器 194
  - 9.1.2 LAMB优化器 197
- 9.2 基于梯度累积的优化技巧 200
  - 9.2.1 大批量内存受限环境 200
  - 9.2.2 梯度累积的应用场景和参数调整对训练效果的影响 203
- 9.3 动态学习率调度 205
  - 9.3.1 线性衰减 205
  - 9.3.2 余弦退火 207
- 9.4 Warmup与循环学习率调度 209
  - 9.4.1 Warmup策略实现 209
  - 9.4.2 循环学习率调度 211
  - 9.4.3 其他几种常见的动态学习调度器 214
- 9.5 本章小结 217
- 9.6 思考题 218
第 10 章模型蒸馏与剪枝 219
- 10.1 知识蒸馏：教师－学生模型 219
  - 10.1.1 知识蒸馏核心过程 219
  - 10.1.2 教师－学生模型 221
  - 10.1.3 蒸馏损失 224
- 10.2 知识蒸馏在文本模型中的应用 226
  - 10.2.1 知识蒸馏在文本分类模型中的应用 226
  - 10.2.2 模型蒸馏效率分析 229
  - 10.2.3 文本情感分析任务中的知识蒸馏效率对比 231
- 10.3 模型剪枝技术 234
  - 10.3.1 权重剪枝 234
  - 10.3.2 结构化剪枝 237
  - 10.3.3 在嵌入式设备上部署手写数字识别模型 240
  - 10.3.4 BERT模型的多头注意力剪枝 243
- 10.4 本章小结 247
- 10.5 思考题 248
第 11 章模型训练实战 249
- 11.1 数据预处理与Tokenization细节 249
  - 11.1.1 大规模文本数据清洗 249
  - 11.1.2 常用分词器的使用 252
- 11.2 大规模预训练模型的设置与启动 255
- 11.3 预训练过程中的监控与中间结果保存 258
- 11.4 训练中断与恢复机制 262
- 11.5 综合案例：IMDB文本分类训练全流程 265
  - 11.5.1 数据预处理与Tokenization 265
  - 11.5.2 多GPU与分布式训练设置 266
  - 11.5.3 训练过程中的监控与中间结果保存 266
  - 11.5.4 训练中断与恢复 267
  - 11.5.5 测试模型性能 268
- 11.6 本章小结 269
- 11.7 思考题 270
第 12 章模型微调实战 271
- 12.1 微调数据集的选择与准备 271
  - 12.1.1 数据集准备与清洗 271
  - 12.1.2 数据集分割 272
  - 12.1.3 数据增强 272
- 12.2 层级冻结与部分解冻策略 274
- 12.3 模型参数调整与优化技巧 276
- 12.4 微调后的模型评估与推理优化 278
- 12.5 综合微调应用案例 280
- 12.6 本章小结 283
- 12.7 思考题 283

本站基于Calibre构建，感谢开源界的力量。所有资源搜集于互联网，如有侵权请邮件联系。

Github | Docker | Project

含有"机器学习"标签的书籍

内容简介

作者简介

目录

内容简介

作者简介

内容简介

作者简介

目录