含有"数学"标签的书籍

数据结构与算法分析

本书是《Data Structures and Algorithm Analysis in C》一书第2版的简体中译本。原书曾被评为20世纪顶尖的30部计算机著作之一,作者Mark Allen Weiss在数据结构和算法分析方面卓有建树,他的数据结构和算法分析的著作尤其畅销,并受到广泛好评.已被世界500余所大学用作教材。

在本书中,作者更加精炼并强化了他对算法和数据结构方面创新的处理方法。通过C程序的实现,着重阐述了抽象数据类型的概念,并对算法的效率、性能和运行时间进行了分析。

全书特点如下:

●专用一章来讨论算法设计技巧,包括贪婪算法、分治算法、动态规划、随机化算法以及回溯算法

●介绍了当前流行的论题和新的数据结构,如斐波那契堆、斜堆、二项队列、跳跃表和伸展树

●安排一章专门讨论摊还分析,考查书中介绍的一些高级数据结构

●新开辟一章讨论高级数据结构以及它们的实现,其中包括红黑树、自顶向下伸展树。treap树、k-d树、配对堆以及其他相关内容

●合并了堆排序平均情况分析的一些新结果

本书是国外数据结构与算法分析方面的标准教材,介绍了数据结构(大量数据的组织方法)以及算法分析(算法运行时间的估算)。本书的编写目标是同时讲授好的程序设计和算法分析技巧,使读者可以开发出具有最高效率的程序。 本书可作为高级数据结构课程或研究生一年级算法分析课程的教材,使用本书需具有一些中级程序设计知识,还需要离散数学的一些背景知识。

神经网络与机器学习(原书第3版)

神经网络是计算智能和机器学习的重要分支,在诸多领域都取得了很大的成功。在众多神经网络著作中,影响最为广泛的是Simon Haykin的《神经网络原理》(第3版更名为《神经网络与机器学习》)。在本书中,作者结合近年来神经网络和机器学习的最新进展,从理论和实际应用出发,全面、系统地介绍了神经网络的基本模型、方法和技术,并将神经网络和机器学习有机地结合在一起。

本书不但注重对数学分析方法和理论的探讨,而且也非常关注神经网络在模式识别、信号处理以及控制系统等实际工程问题的应用。本书的可读性非常强,作者举重若轻地对神经网络的基本模型和主要学习理论进行了深入探讨和分析,通过大量的试验报告、例题和习题来帮助读者更好地学习神经网络。

本版在前一版的基础上进行了广泛修订,提供了神经网络和机器学习这两个越来越重要的学科的最新分析。

本书特色:

1. 基于随机梯度下降的在线学习算法;小规模和大规模学习问题。

2. 核方法,包括支持向量机和表达定理。

3. 信息论学习模型,包括连接、独立分量分析(ICA)、一致独立分量分析和信息瓶颈。

4. 随机动态规划,包括逼近和神经动态规划。

5. 逐次状态估计算法,包括卡尔曼和粒子滤波器。

6. 利用逐次状态估计算法训练递归神经网络。

7. 富有洞察力的面向计算机的试验。

算法霸权

数据科学家凯西•奥尼尔认为,我们应该警惕不断渗透和深入我们生活的数学模型——它们的存在,很有可能威胁到我们的社会结构。

我们生活在一个依赖“算法”的时代,它对我们生活的影响越来越大,我们去哪里上学,我是不是应该贷款买车,我们应该花多少钱来买健康保险,这些都不是由人来决定的,而是由大数据模型来决定的。从理论上来说,这一模型应该让社会更加公平,每一个人的衡量标准都是一样的,偏见是不存在的。

但是,正如凯西•奥尼尔书里所揭示的那样,事实并非如此。我们今天所使用的这些数学模型是不透明的、未经调节的、极富争议的,有的甚至还是错误的。最糟糕的是,数学模型和大数据算法加剧了偏见与不公。例如,一个贫困学生想申请贷款交付学费,但是银行大数据算法根据他居住地的邮政编码判断将钱带给他存在风险,因此,拒绝给他提供贷款。他因此失去了受教育的机会,而这个机会可能帮助他摆脱贫困。大数据算法做的常常只是锦上添花的事儿,有时甚至是落井下石。

通过个案追踪,凯西•奥尼尔揭示了大数据是如何影响我们将来的,它不仅影响着个人,也影响着整个社会。这些数据评价着我们的老师、学生,筛选着我们的简历,审核着我们的贷款资格,衡量着员工的工作态度,监视着投票者,监控着我们的健康。

凯西•奥尼尔呼吁数据模型的创造者们要对算法负责,政策的制定者及执行者们在使用这一威力极大的“武器”前应该更加慎重。最后,作者指出,大数据几乎掌控着我们的生活,我们应该增加对它的了解。这本书相当的重要,它让我们有能力去问一些十分尖锐的问题,帮助我们了解事实的真相,提出需要改变的地方,探索更好的生活。

【编辑推荐】

 案例丰富,内容兼具深度与话题性

未来20年,算法和大数据将席卷世界,接管我们的生活、社会和经济。我们生活中的很多方面都将落入自动化的数据分析之下。确保算法和大数据的公平性将是一项重大的任务,数据伦理的价值和意义将不断凸显出来。在作者看来,大数据犹如一个黑盒,规模、伤害和隐秘共存,她在书中引用了大量发生在美国当下的、基于大数据和算法的、改变个人生活的案例,并对影响这些城市生活经验的算法做了特别的观察和研究。作者认为,数据和算法的关系就像枪械和军火,数据没有价值观,是中立的,但来自人类行为的输入,难免隐含偏向,而算法创造的数据又对人类行为产生反作用,从而导致更多的不公。凯西在书中指出:算法模型一旦运转,执法行为就会增多,产生的新数据又会进一步证明加强执法的必要性。形象地说,就是哪里“前科”越多,哪里就越受算法“关照”,最终形成一个失真,甚至有害的回馈环路。这个观点也正是近来Facebook干预美国大选,国内很多专家学者热议“今日头条”推送模式的核心所在。

 权威作者的深刻洞见

本书作者是哈佛大学的数学博士,研究方向是数论和代数几何,毕业之后在麻省理工学院执教,并在互联网公司做过很长时间的数据科学家,如今致力于教育和媒体行业的数据知识普及工作,因此,这并不是一本传统意义上唱衰大数据的书,相反,作者希望让更多的人通过了解大数据、了解算法,反思模型,以及通过政府和相关机构的合理监管,不断改善各类设计评价体系,让更多的人受益,维护社会的公平与民主。

【英文版获奖情况】

《纽约时报》(New York Times)年度书籍

《波士顿环球报》年度最佳图书

《连线》杂志年度必读书目之一

《财富》年度最受欢迎的书之一

《柯克斯评论》年度最佳作品

芝加哥公共图书馆年度最佳图书

《自然》网站年度最佳图书

《麻省理工科技评论》年度最佳科技图书

软件可靠性方法

【名人推荐】

我第一次翻开这本书时,立刻被这本书的覆盖范围之广所深深打动,它覆盖了规约和建模、演绎验证、模型检验、进程代数、程序测试、状态与消息序列图。除了对每个方法进行了相当深入的介绍以外,本书还讨论了应当在何时选取何种方法以及在选择这些方法时所必须做出的权衡。书中结合当前工具,使用很多具有挑战性的实例来说明各种技术。我还没看见过其他任何覆盖同样内容的书籍能达到如此的深度。

同时,本书描述了应用形式化方法的过程:从建模和规约开始,然后选择一个合适的验证技术,最后测试程序。这些知识在实践中是十分必要的,但是却很少在软件工程的课本里面出现。我确信这本书将会取得巨大的成功。我向所有对软件可靠性问题感兴趣的读者强烈推荐这本书。

—— Edmund M. Clarke教授

图灵奖获得者,卡内基-梅隆大学

【内容简介】

用于创建可靠软件的形式化方法一直处于不断的开发和改进之中。最近,人们对于形式化方法工具的重要组成有了更深入的理解,从软硬件开发业界逐渐接受可靠性工具这一点就可以体现出来。

本书介绍了各种能解决软件可靠性问题的方法。理想情况下,形式化方法应该用起来直观,学起来简洁、快速,对开发过程的影响微乎其微。本书对各种方法进行了比较,揭示了它们各自的优点和缺点,同时紧扣自动机理论和逻辑这两个主题。在尽可能减少背景知识介绍的前提下,本书向非专家读者描述了多种技术,并且针对软件工程领域的研究人员和专业人士介绍了一些高级技术。

本书主题和特点:

 集中介绍目前常用的重要软件可靠性方法,并将它们互作比较,这些方法包括:演绎验证、自动验证、测试和进程代数

 为具体项目的软件选择过程提供有用信息

 提供了大量的练习、项目和连续性的实例,方便读者学习形式化方法并能够亲手使用这些工具

 介绍了支持形式化方法的数学原理

 对于该领域未来的研究方向,以及开发新方法和改进现有技术提出了有益的见解

数据挖掘:实用机器学习工具与技术(原书第3版)

大数据时代应用机器学习方法解决数据挖掘问题的实用指南。

洞察隐匿于大数据中的结构模式,有效指导数据挖掘实践和商业应用。

weka系统的主要开发者将丰富的研发、商业应用和教学实践的经验和技术融会贯通。

广泛覆盖在数据挖掘实践中采用的算法和机器学习技术,着眼于解决实际问题

避免过分要求理论基础和数学知识,重点在于告诉读者“如何去做”,同时包括许多算法、代码以及具体实例的实现。

将所有的概念都建立在具体实例的基础之上,促使读者首先考虑使用简单的技术。如果简单的技术不足以解决问题,再考虑提升到更为复杂的高级技术。

新版增加了大量近年来最新涌现的数据挖掘算法和诸如Web数据挖掘等新领域的介绍,所介绍的weka系统增加了50%的算法及大量新内容。

本书是机器学习和数据挖掘领域的经典畅销教材,被众多国外名校选为教材。书中详细介绍用于数据挖掘领域的机器学习技术和工具以及实践方法,并且提供了一个公开的数据挖掘工作平台Weka。本书主要内容包括:数据输入/输出、知识表示、数据挖掘技术(决策树、关联规则、基于实例的学习、线性模型、聚类、多实例学习等)以及在实践中的运用。本版对上一版内容进行了全面更新,以反映自第2版出版以来数据挖掘领域的技术变革和新方法,包括数据转换、集成学习、大规模数据集、多实例学习等,以及新版的Weka机器学习软件。

深度学习高手笔记 卷2:经典应用

当前,深度学习模型的规模越来越大,例如谷歌的 BERT模型、OpenAl的GPT系列模型等;深度学习算法在不断优化,例如在计算机视觉领域,图像分类、目标检测等任务应用深度学习算法后,准确率得到了显著提升;深度学习的应用领域在不断拓展,除了在自然语言处理、计算机视觉,语音识别等领域,深度学习在医疗、金融等领域也得到了广泛应用。因此,从事深度学习相关工作需要不断学习和巩固基础知识,提升业务实践能力,持续关注新技术和新方法,并不断拓展知识面。

本书包含深度学习的经典应用场景,从算法原理、公式推导、算法源码、实验结果等方面对各场景的算法进行分析和介绍,重点讨论深度学习算法在目标检测与分割、场景文字检测与识别等方向的发展历程以及各算法的优缺点,并分析各算法是如何针对先前算法的若干问题提出解决方案的。具体内容有:

***深度学习在目标检测与分割领域的前沿算法,包括双阶段检测、单阶段检测、无锚点检测、特征融合、损失函数、语义分割 6个方向的算法;

***深度学习在场景文字检测与识别领域的重要突破,包括场景文字检测、场景文字识别这两个阶段的算法;

***深度学习的其他应用领域的算法,包括图像翻译、图神经网络、二维结构识别、人像抠图图像预训练、多模态预训练 5个方向的算法;

***算法中的数学原理,包括双线性插值、匈牙利算法、Shift-and-Stitch、德劳内三角化、图像梯度、仿射变换矩阵等。

Github | Docker | Project