数学之美第二版pdf影印版

安全无毒小编亲测

数学之美第二版2014年11月由人民邮电出版社出版发现，是一本非常经典的数学教材。数学是上帝描写自然的语言，纯数学使我们能够发现概念和联系这些概念的规律，这些概念和规律给了我们理解自然现象的钥匙。总的来说哪里有数，哪里就有美。小编推荐的这本数学之美第二版上市后深受广大读者欢迎，并荣获国家图书馆第八届文津图书奖。读者说，读了数学之美，才发现大学时学的数学知识，比如马尔科夫链、矩阵计算，甚至余弦函数原来都如此亲切，并且栩栩如生，才发现自然语言和信息处理这么有趣。而今，数学在信息产业中的应用越来越广泛，因此，作者在第二版中增加了一些内容，尤其是针对大数据和机器学习的内容，以便满足人们对当下技术的学习需求。
数学之美第二版

作者介绍：

吴军，博士，毕业于清华大学和美国约翰·霍普金斯大学，是自然语言处理和搜索专家，硅谷风险投资人。获奖畅销书《浪潮之巅》及《数学之美》的作者。
吴军博士是谷歌公司早期员工之一。在谷歌，他和辛格（美国工程院院士，世界搜索专家）、Matt.Cutts（谷歌反作弊官方发言人）等三位同事一起开创了网络搜索反作弊的研究领域，并因此获得谷歌工程奖。2003年，他和谷歌全球架构的总工程师朱会灿博士等共同成立了中日韩文搜索部门。吴军博士是当前谷歌中日韩文搜索算法的主要设计者。在谷歌期间，他还领导了许多研发项目，得到了当时公司首席执行官埃里克?施密特和创始人谢尔盖·布林的高度评价。
2010年—2012年，他加盟腾讯公司，出任负责搜索和搜索广告的副总裁，同时担任国家重大专项“新一代搜索引擎和浏览器”项目的总负责人。2012年回到谷歌，负责开发了被认为是“下一代搜索”的谷歌自动问答系统。同年，他作为创始合伙人共同创立了中关村硅谷风险投资基金（ZPark Venture）。
吴军博士在国内外发表过数十篇论文，曾获得全国人机语音智能接口会议的论文奖和Eurospeech的论文奖。他还获得了十余项美国和国际专利。
吴军博士还担任约翰·霍普金斯大学工学院董事会董事和校国际事务委员会顾问，他也长期担任中国工业和信息化部的专家顾问。同时，他也是数家投资基金、创业公司的董事和顾问。

数学之美第二版目录：

i第一版读者赞誉
iv第二版出版说明
vii第一版序言
x第二版序言
xii第二版前言
第1章文字和语言 vs 数字和信息　1
文字和语言与数学，从产生起原本就有相通性，虽然它们的发展一度分道扬镳，但是最终还是能走到一起。
1信息
2文字和数字
3文字和语言背后的数学
4小结
第2章自然语言处理——从规则到统计15
人类对机器理解自然语言的认识走了一条大弯路。早期的研究集中采用基于规则的方法，虽然解决了一些简单的问题，但是无法从根本上将自然语言理解实用化。直到20多年后，人们开始尝试用基于统计的方法进行自然语言处理，才有了突破性进展和实用的产品。
1机器智能
2从规则到统计
3小结
第3章统计语言模型27
统计语言模型是自然语言处理的基础，并且被广泛应用于机器翻译、语音识别、印刷体或手写体识别、拼写纠错、汉字输入和文献查询。
1用数学的方法描述语言规律
2延伸阅读：统计语言模型的工程诀窍
3小结
第4章谈谈分词41
中文分词是中文信息处理的基础，它同样走过了一段弯路，目前依靠统计语言模型已经基本解决了这个问题。
1中文分词方法的演变
2延伸阅读：如何衡量分词的结果
3小结
第5章隐含马尔可夫模型50
隐含马尔可夫模型最初应用于通信领域，继而推广到语音和语言处理中，成为连接自然语言处理和通信的桥梁。同时，隐含马尔可夫模型也是机器学习的主要工具之一。
1通信模型
2隐含马尔可夫模型
3延伸阅读：隐含马尔可夫模型的训练
4小结
第6章信息的度量和作用60
信息是可以量化度量的。信息熵不仅是对信息的量化度量，也是整个信息论的基础。它对于通信、数据压缩、自然语言处理都有很强的指导意义。
1信息熵
2信息的作用
3互信息
4延伸阅读：相对熵
5小结
第7章贾里尼克和现代语言处理72
作为现代自然语言处理的奠基者，贾里尼克教授成功地将数学原理应用于自然语言处理领域中，他的一生富于传奇色彩。
1早年生活
2从水门事件到莫妮卡·莱温斯基
3一位老人的奇迹
第8章简单之美——布尔代数和搜索引擎82
布尔代数虽然非常简单，却是计算机科学的基础，它不仅把逻辑和数学合二为一，而且给了我们一个全新的视角看待世界，开创了数字化时代。
1布尔代数
2索引
3小结
第9章图论和网络爬虫89
互联网搜索引擎在建立索引前需要用一个程序自动地将所有的网页下载到服务器上，这个程序称为网络爬虫，它的编写是基于离散数学中图论的原理。
1图论
2网络爬虫
3延伸阅读：图论的两点补充说明
4小结
第10章PageRank——Google的民主表决式网页排名技术98
网页排名技术PageRank是早期Google的杀手锏，它的出现使得网页搜索的质量上了一个大的台阶。它背后的原理是图论和线性代数的矩阵运算。
1PageRank算法的原理
2延伸阅读：PageRank的计算方法
3小结
第11章如何确定网页和查询的相关性104
确定网页和查询的相关性是网页搜索的根本问题，其中确定查询中每个关键词的重要性有多高是关键。TF-IDF是目前通用的关键词重要性的度量，其背后的原理是信息论。
1搜索关键词权重的科学度量TF-IDF
2延伸阅读：TF-IDF的信息论依据
3小结
第12章有限状态机和动态规划——地图与本地搜索的核心技术111
地图和本地服务中要用到有限状态机和动态规划技术。这两项技术是机器智能和机器学习的工具，它们的应用非常广泛，还包括语音识别、拼写和语法纠错、拼音输入法、工业控制和生物的序列分析等。
1地址分析和有限状态机
2全球导航和动态规划
3延伸阅读：有限状态传感器
4小结
第13章Google AK-47的设计者——阿米特·辛格博士121
在所有轻武器中最有名的是AK-47冲锋枪，因为它从不卡壳，不易损坏，可在任何环境下使用，可靠性好，杀伤力大并且操作简单。Google的产品就是按照上述原则设计的。
第14章余弦定理和新闻的分类127
计算机虽然读不懂新闻，却可以准确地对新闻进行分类。其数学工具是看似毫不相干的余弦定理。
1新闻的特征向量
2向量距离的度量
3延伸阅读：计算向量余弦的技巧
4小结
第15章矩阵运算和文本处理中的两个分类问题136
无论是词汇的聚类还是文本的分类，都可以通过线性代数中矩阵的奇异值分解来进行。这样一来，自然语言处理的问题就变成了一个数学问题。
1文本和词汇的矩阵
2延伸阅读：奇异值分解的方法和应用场景
3小结
第16章信息指纹及其应用142
世间万物都有一个唯一标识的特征，信息也是如此。每一条信息都有它特定的指纹，通过这个指纹可以区别不同的信息。
1信息指纹
2信息指纹的用途
3延伸阅读：信息指纹的重复性和相似哈希
1密码学的自发时代
2信息论时代的密码学
3小结
第18章闪光的不一定是金子——谈谈搜索引擎反作弊问题和搜索结果的权威性问题162
闪光的不一定是金子，搜索引擎中排名靠前的网页也未必是有用的网页。消除这些作弊网页的原理和通信中过滤噪音的原理相同。这说明信息处理和通信的很多原理是相通的。
1搜索引擎的反作弊
2搜索结果的权威性
3小结
第19章谈谈数学模型的重要性171
正确的数学模型在科学和工程中至关重要，而发现正确模型的途径常常是曲折的。正确的模型在形式上通常是简单的。
第20章不要把鸡蛋放到一个篮子里——谈谈最大熵模型177
最大熵模型是一个完美的数学模型。它可以将各种信息整合到一个统一的模型中，在信息处理和机器学习中有着广泛的应用。它在形式上非常简单、优美，而在实现时需要有精深的数学基础和高超的技巧。
1最大熵原理和最大熵模型
2延伸阅读：最大熵模型的训练
3小结
第21章拼音输入法的数学原理186 汉字的输入过程本身就是人和计算机之间的通信。好的输入法会自觉或不自觉地遵循通信的数学模型。当然要做出最有效的输入法，应当自觉使用信息论做指导。
1输入法与编码
2输入一个汉字需要敲多少个键——谈谈香农第一定理
3拼音转汉字的算法
4延伸阅读：个性化的语言模型
5小结
第22章自然语言处理的教父马库斯和他的优秀弟子们197
将自然语言处理从基于规则的研究方法转到基于统计的研究方法上，宾夕法尼亚大学的教授米奇马库斯功不可没。他创立了今天在学术界广泛使用的LCD语料库，同时培养了一大批精英人物。
1教父马库斯
2从宾夕法尼亚大学走出的精英们
第23章布隆过滤器204
日常生活中，经常要判断一个元素是否在一个集合中。布隆过滤器是计算机工程中解决这个问题最好的数学工具。
1布隆过滤器的原理
2延伸阅读：布隆过滤器的误识别问题
3小结
第24章　马尔可夫链的扩展——贝叶斯网络209
贝叶斯网络是一个加权的有向图，是马尔可夫链的扩展。而从认识论的层面看：贝叶斯网络克服了马尔可夫链那种机械的线性约束，它可以把任何有关联的事件统一到它的框架下面。它在生物统计、图像处理、决策支持系统和博弈论中都有广泛的使用。
1贝叶斯网络
2贝叶斯网络在词分类中的应用
3延伸阅读：贝叶斯网络的训练
4小结
第25章　条件随机场、文法分析及其他217
条件随机场是计算联合概率分布的有效模型，而句法分析似乎是英文课上英语老师教的东西，这两者有什么联系呢？
1文法分析——计算机算法的演变
2条件随机场
3条件随机场在其他领域的应用
4小结
第26章维特比和他的维特比算法227
维特比算法是现代数字通信中使用最频繁的算法，同时也是很多自然语言处理的解码算法。可以毫不夸张地讲，维特比是对我们今天生活的影响力最大的科学家之一，因为如今基于CDMA的3G移动通信标准主要就是他创办的高通公司制定的。
1维特比算法
2CDMA技术——3G移动通信的基础
3小结
第27章上帝的算法——期望最大化算法238
只要有一些训练数据，再定义一个最大化函数，采用EM算法，利用计算机经过若干次迭代，就可以得到所需要的模型。这实在是太美妙了，这也许是我们的造物主刻意安排的。所以我把它称作上帝的算法。
1文本的自收敛分类
2延伸阅读：期望最大化和收敛的必然性
3小结
第28章逻辑回归和搜索广告244
逻辑回归模型是一种将影响概率的不同因素结合在一起的指数模型，它不仅在搜索广告中起着重要的作用，而且被广泛应用于信息处理和生物统计中。
1搜索广告的发展
2逻辑回归模型
3小结
第29章各个击破算法和Google云计算的基础249
Google颇为神秘的云计算中最重要的MapReduce工具，其原理就是计算机算法中常用的“各个击破”算法，它的原理原来这么简单——将复杂的大问题分解成很多小问题分别求解，然后再把小问题的解合并成原始问题的解。由此可见，在生活中大量用到的、真正有用的方法常常都是简单朴实的。
1分治算法的原理
2从分治算法到MapReduce
3小结
第30章Google大脑和人工神经网络254
Google大脑并不是一个什么都能思考的大脑，而是一个很能计算的人工神经网络。因此，与其说Google大脑很聪明，不如说它很能算。不过，换个角度来说，随着计算能力的不断提高，计算量大但简单的数学方法有时能够解决很复杂的问题。
1人工神经网络
2训练人工神经网络
3人工神经网络与贝叶斯网络的关系
4延伸阅读：Google大脑
5小结
第31章大数据的威力——谈谈数据的重要性273
如果说在过去的40年里，主导全球IT产业发展的是摩尔定律，那么在今后的20年里，主导IT行业继续发展的动力则来自于数据。
1数据的重要性
2数据的统计和信息技术
3为什么需要大数据
4小结
附录计算复杂度295
第二版后记299
索引302

精彩书摘：

......
《数学之美（第二版）》:
第二，页面的分析和URL的提取。
在上一节中提到，当一个网页下载完成后，需要从这个网页中提取其中的URL，把它们加入到下载的队列中。这个工作在互联网的早期不难，因为那时的网页都是直接用HTML语言书写的。那些URL都以文本的形式放在网页中，前后都有明显的标识，很容易提取出来。但是现在很多URL的提取就不那么直接了，因为很多网页如今是用一些脚本语言（比如JavaScript）生成的。打开网页的源代码，URL不是直接可见的文本，而是运行这一段脚本后才能得到的结果。因此，网络爬虫的页面分析就变得复杂很多，它要模拟浏览器运行一个网页，才能得到里面隐含的URL。有些网页的脚本写得非常不规范，以至于解析起来非常困难。可是，这些网页还是可以在浏览器中打开，说明浏览器可以解析。因此，需要做浏览器内核的工程师来写网络爬虫中的解析程序，可惜出色的浏览器内核工程师在全世界数量并不多。因此，若你发现一些网页明明存在，但搜索引擎就是没有收录，一个可能的原因是网络爬虫中的解析程序没能成功解析网页中不规范的脚本程序。第三，记录哪些网页已经下载过的小本本— URL表。
……

下载说明：

方法一：
1、下载并解压，得出pdf文件
2、如果打不开本文件，别着急，这时候请务必在3322软件站选择一款阅读器下载哦
3、安装后，再打开解压得出的pdf文件
4、以上都完成后，接下来双击进行阅读就可以啦，朋友们开启你们的阅读之旅吧。
方法二：
1、可以在手机里下载3322软件站中的阅读器和百度网盘
2、接下来直接将pdf传输到百度网盘
3、用阅读器打开即可阅读