确切的来说,《数学之美》并不是一本书,它是谷歌黑板报中的一系列文章,介绍数学在信息检索和自然语言处理中的主导作用和奇妙应用,每一篇文章都不长,但小中见大,从看似高深的高科技中用通俗易懂的案例展示了数学之美,深深的吸引了我。
这一系列文章的作者是google公司的科学家吴军。他毕业于清华大学计算机系(本科)和电子工程系(硕士),并于1993-1996年在清华任讲师。他于1996年起在美国约翰霍普金斯大学攻读博士,并于XX年获得计算机科学博士学位。在清华和约翰霍普金斯大学期间,吴军博士致力于语音识别、自然语言处理,特别是统计语言模型的研究。他曾获得1995年的全国人机语音智能接口会议的最佳论文奖和XX年eurospeech的最佳论文奖。
吴军博士于XX年加入google公司,现任google研究院资深研究员。到google不久,他和三个同事们开创了网络搜索反作弊的研究领域,并因此获得工程奖。XX年,他和两个同事共同成立了中日韩文搜索部门。吴军博士是当前google中日韩文搜索算法的主要设计者。在google其间,他领导了许多研发项目,包括许多与中文相关的产品和自然语言处理的项目,并得到了公司首席执行官埃里克.施密特的高度评价。吴军博士在国内外发表过数十篇论文并获得和申请了近十项美国和国际专利。他于XX年起,当选为约翰霍普金斯大学计算机系董事会董事。
正是他在信息检索与自然语言处理领域中的一系列工作,使他讲述了我所看到的内容-数学之美。
看了数学之美,立即联想到了金庸小说中的武林高人,总是把一套大多数人都会的入门功夫使得威力无比,击溃众多敌者。东西放在那,它的威力如何,并键在于使用者,武术如此,数学同样如此。
于我而言,语音视别是一类高科技,作为非专业人土,深觉高奥。但看完数学之美之后,顿感惊诧,原来如此深奥东西的解决方法自己也学过,并且理工科读过大学的人都学过,那就是统计学中的条件概率p(a/b),即b事件发生条件下a事件发生的概率。
如果s表示一连串特定顺序排列的词w1,w2,…,wn,换句话说,s可以表示某一个由一连串特定顺序排练的词而组成的一个有意义的句子。现在,机器对语言的识别从某种角度来说,就是想知道s在文本中出现的可能性,也就是数学上所说的s的概率用p(s)来表示。利用条件概率的公式,s这个序列出现的概率等于每一个词出现的概率相乘,于是p(s)可展开为:
p(s)=p(w1)p(w2|w1)p(w3|w1w2)…p(wn|w1w2…wn-1)
其中p(w1)表示第一个词w1出现的概率;p(w2|w1)是在已知第一个词的前提下,第二个词出现的概率;以次类推。不难看出,到了词wn,它的出现概率取决于它前面所有词。从计算上来看,各种可能性太多,无法实现。因此我们假定任意一个词wi的出现概率只同它前面的词wi-1有关(即马尔可夫假设),于是问题就变得很简单了。现在,s出现的概率就变为:
p(s)=p(w1)p(w2|w1)p(w3|w2)…p(wi|wi-1)…
(当然,也可以假设一个词又前面n-1个词决定,模型稍微复杂些。)
接下来的问题就是如何估计p(wi|wi-1)。现在有了大量机读文本后,这个问题变得很简单,只要数一数这对词(wi-1,wi)在统计的文本中出现了多少次,以及wi-1本身在同样的文本中前后相邻出现了多少次,然后用两个数一除就可以了,p(wi|wi-1)=p(wi-1,wi)/p(wi-1)。
也许很多人不相信用这么简单的数学模型能解决复杂的语音识别、机器翻译等问题。其实不光是常人,就连很多语言学家都曾质疑过这种方法的有效性,但事实证明,统计语言模型比任何已知的借助某种规则的解决方法都有效。比如在google的中英文自动翻译中,用的最重要的就是这个统计语言模型。去年美国标准局(nist)对所有的机器翻译系统进行了评测,google的系统是不仅是全世界最好的,而且高出所有基于规则的系统很多。
这就是数学的美妙之处了,它把一些复杂的问题变得如此的简单。
看到《数学之美》,在感叹数学的美妙与神奇之处时,自然而然联系到自己专业(地质工程而或岩土工程)中的数学应用。
现在找文献,搜索期刊一大堆基于数学的专业文献,灰色数学的、模糊数学的、非线性的、系统的,等等,这么多的数学的使用,促进了一大批的文章,但这些数学方法的应用究竟是发现了哪些问题?还是解决了实际问题吗?还是仅发了文章,满足了需求?现实是文章好发,用着难用,解决问题还得传统的方法,那么是这些数学方法不行,还是用的太肤浅,根本没发挥其威力来?如果没有发挥出威力来,那怎么用?怎么发挥?
经过收集,小编为您献上读后感数学之美。我们常常会因为书中跌宕起伏的故事情节或者发人深省的哲思被吸引,作者笔下的作品,让我印象深刻。写下心里的感受吧,别让那些闪烁着的思想光芒无处安放。供有需要的朋友参考借鉴,希望可以帮助到你!
《数学之美》,一个从事多年工作的谷歌研究员眼中的数学。令我大饱眼福的是,大学里面的数学知识竟能如此广泛运用到了计算机行业中。
在语音识别、翻译,还有密码学领域,有着许多基于概率统计的模型和思想。当然,贝叶斯公式是基础,应用到隐含马尔科夫链模型,神经网络模型。
在搜索中,一些相关性的计算,无不用到了概率的知识。在新闻分类中,用到了一些有关矩阵特征值、相似对角化的知识。当然,在图像处理方面,矩阵变换可谓是无处不在。另外,在识别方面,有一些通信模型,涉及到了信道、误码率、信息熵。
最近刚开学也没什么事,所以就想随便找几本书看一下,但最好别是那种太艰深晦涩的书。8月份一直到现在,吴军写的这本12年5月出版的《数学之美》一直盘踞京东、亚马逊等各大网上商城科技类图书的榜首,当然,还有早些时候出版的《浪潮之巅》也排在很靠前的位置。心想市场的力量应该能帮我挑出好书吧,于是就从图书馆借了一本来,一直到今天晚上把它给看完了。
因此想写一点东西来总结、反思一下,反正刚开完班会也没什么事干。
写在前面的建议:如果你不讨厌数学的话,强烈推荐这本书,网上也可以下到电子版,不过阅读感觉上还是很不一样的。
废话就不多说了,《数学之美》其实是一本科普类的读物,所面向的是接受过普通高等教育的人,完全不需要在特定领域有很深的造诣就可以看懂,大概懂一点线性代数、概率统计、组合数学、信息论、计算机算法、模式识别最好(虽然列举了这么多,其实有些不懂也没关系),所以尤其适合信科的人看。内容大部分是和人工智能、计算机相关的,这并非我所学的专业,但作者比较擅长将看似复杂的原理用简明的语言表达出来,所以可读性还是很好的。
吴军是清华大学毕业的,之前任职于Google,后来到了腾讯,这些文章都是发表在Google黑板报上的,后来经过了重写,所以网上下载的和书本内容有所差异。由于吴军本人是研究自然语言处理和语音识别的,所以统计语言模型的东西可能会多一点,不过我觉得这丝毫不妨碍全书数学之美的展现感觉收获还是挺多的,知识上的有一些,但更多还是思维方式上的。作者举了很多例子试图让人明白很多看似复杂的高科技背后,基本原理其实是出乎意料简单的(当然,必须承认第一个想到这些方法的人还是非常了不起的)。比如高准确率的机器翻译,看上去好像是计算机能够理解各国语言,隐藏在背后的却是很多具有大学理科学历的人都非常清楚的统计模型和概率模型;再比如拼音输入法的数学原理,早期的研究主要集中在缩短平均编码长度,比如曾经流行一时的五笔输入法,而现今真正实用的输入法却是有很多信息冗余、编码长度比较长的拼音输入法,作者从信息论和市场的角度做了简单的阐述;又比如新闻的自动分类,许多非IT领域的人可能会认为计算机可以读懂新闻并进行分类,而实际上只是特征向量的抽取、多维空间中向量夹角的计算,非常非常简单,但凡学过一点线性代数的人绝对是一看就懂的当然,完美的实现还需要考虑很多细节和现实的情况,但这并不是这本书所关注的地方,数学之美在于其简洁而不是繁琐。
除了对于具体信息技术的剖析之外,作者还花了很大篇幅来讲一些杰出人士的成长过程,特别是把这些人的成长经历和中国学生的成长经历作对比。虽然作者并没有明说,但字里行间多少流露出对于中国高等教育以及很多中国企业的批评,一是教育的功利性,缺乏宽松的独立思考的环境,即使学了一堆理论也难有用武之地,自然也就缺乏创新性的成果;二是中国企业的短视,大部分都不舍得在新框架开发上投资,而是坐享学术界和国外企业的研究成果。
总结一下呢,《数学之美》事实上不能带给你编程能力的提升,也没法让人的数学水平有显着的提升,但它在很大程度上让你跳出教科书式的繁琐细节的束缚,能够从更宏观的角度来思考信息世界背后的数学引擎的运行原理,让人明白看似很高级、复杂的东西背后其实并不如我们所想象的那样复杂,而我们所学的枯燥的数学真的可以四两拨千斤,改变亿万人的生活。
在网上看到有人推荐吴军博士的《数学之美》,尽管我从事社会科学研究,但对数学的推崇一直如此,所以买来一读,我的真切体验正如吴军博士在书的后记中所说,把自己“境界提升了一个层次”。
那么,对我而言,到底提升了什么境界呢?
首要的肯定是思想境界。在未读这本书之前,我知道对于这个世界的事件形成的信息集合,人类只有两种方式可以表达,一个是数字,一个是语言。整个实数的集合是无穷个,而且每个数字都是唯一的;整个世界中的事件也是无穷个的,而且每个事件也时独一无二的,这样数学中的数字集合与世界中的事件集合就构成一个一一对应的关系,所以研究数字之间的关系,实际上就是在研究世界中事件之间的关系。语言中的概念和世界中的事件之间也是可以构成一个对应关系的,但问题是,语言中概念的集合是有限的,所以它和数字集合的对应显然只能是部分对应。
计算机科学的发展,人类需要把语言处理成数字,因为计算机只能识别数字信号,所以“语言的数字化”成为计算机产生以来发展最快、而且最有创新性的领域,而许多华人科学家成为了这个领域的顶尖专家,如李开复,吴军博士是卓越的科学家之一。至此我才感到,在计算机主导的世界中,信息化就是数字化,而最难的数字化、也是最有成就的数字化,就是对人类自然语言的数字化,因为人类的信息几乎100%是用语言承载、传播的,计算机要与人对话,变成智能化的机器,首先要解决的就是语言的数字化问题。但我们在电脑上自如地输入文字时、或者拿着手机通话时,我们跟本没有意识到,那些卓越的语言科学家,早已经把我们的语言,转化成数字信号,通过输入、处理、解码的方式,让我们无障碍地联络、工作。
我似乎感到,语言与数字的关系,就是人与自然关系的接口。套用古希腊毕达哥拉斯学派的观点,加上我的理解,即是,数是万物的本原,语言是人的本原!
吴军博士似乎也在提升我对方法的认识境界。科学研究的思考方式,习惯遵循本质、规律、连续性思维,在语言学研究的早期,人类为了让计算机识别语言,采用建立语言规则和语言规则数据库的办法,但最终以失败告终(20世纪50-70年代),70年代后科学家采用了语言统计模型,研究取得了突飞猛进。语言统计模型的胜利,再一次证明了宇宙量子模型的信念,世界是不连续的随机性的粒子构成,人类数千年文明进化出来的语言系统,就是动态的随机概率事件。其二,物理思维再也难逃牛顿的经典本质思维方法,即找寻到百分之百确定性的规律,而信息论思维是研究如何把握不确定性现象,利用概率统计是不二法门。其三,语言本质上就是信息传播,只有从通信模型视角才能真正理解计算机的功能,对语言的编码、处理、传输、解码是计算机的强项,计算机是永远不可能理解语言的意思的。
在《数学之美》中,吴军博士对他的老师、师兄弟、同事的经历、掌故进行了叙述,让我们了解到这些世界一流的学科家、技术精英们的为人处世品质、鲜明个性、科学素养及其管理风格。例如贾里尼克对博士生的严酷淘汰,马库斯对学生的宽宏大度,但我感到他们有一样东西是共同的,就是对科学创造、顶尖人才的识别和器重,甚至是无条件的包容。如此为人的境界才是根本,因为伟大的科学创造毕竟是人做出来的,只有崇高的人文精神之下才能造就顶尖的人才、一流的科学和技术。
观国内的学说界,官风盛行、腐败当道、人情充斥,与这些一流学说群对科学创造的赏识、对个性人才的包容,对科学探索的热诚,可谓相去甚远。
看来,我们只能寄希望于年轻一代,但愿吴博士的《数学之美》,能让我们的学子们,初步体验到科学精英们卓越的才智与情怀。
看到吴军的另一本书《数学之美》,激起了很深的兴趣,所以很快把书看完了,普及了很多基础的知识的同时也启发了很多想法,感觉很爽。
我自己在交大学的是工科(虽然没怎么上过课),小学、初中、高中都是一路参加数学竞赛,名次都还不错,也因此没有参加中考、高考,一路保送,自己对数学有很深的感情,同时女朋友大学也是数学系,有点后悔的大学选了个并不感兴趣的专业(交大当时允许我随便选专业,我没有跟父母商量自己选了船舶制造)。看这本书的过程中找到了很多高中在看竞赛书的感觉,里面提到的很多概率论(不等式)、图论、数论的知识是高中数学联赛复试的重点,高中的时候已经研究的很深了,不过大学荒废了之后也忘得差不多了,书中提到的很多定理还很有亲切感
书名叫做《数学之美》,显得有些太大,毕竟更多的是吴军在google做搜索相关工作用到的数学模型的介绍与总结,提到的数学部分大多集中在概率论、图论、数论领域,所以书名太大了,可能hax说得对,也许是出版社为了卖书取得名字
不得不说吴军是一个大家,文字中能够透露出大家的气势,书中不断的穿插着各种历史上的大科学家以及科技领域的大家的小故事甚至八卦,从文字中非常能够感受到吴军是一个和他们一个层次的人(即使他自己会自谦说是一个二流的工程师之类)
书中具体的模型就不介绍了,说几点我学到的知识(仅仅皮毛),能列出来的都是看完还有点印象的:
1.在互联网的世界中,信息是如何量化的,信息熵是怎么回事?有啥用?
2.搜索领域中,语言是如何统计的,尤其是如何通过概率模型进行分词
3.搜索引擎是如何工作的—网络爬虫是怎么回事儿
4.PageRank是怎么回事?为了解决什么问题?
5.密码与解密领域的数学模型,尤其提到的二战时候的各种解密的趣事儿,提到的电视剧《暗算》打算抽空看下
6.拼音输入法的数学模型
7.、文本自动分类的模型
……
看完之后最大的感受就是:
1.数学模型巨大作用,推动着新技术的发展
2.攻城师是一个伟大的职业,能够运用这些知识转化为生产力,非常牛叉
3.书中提到了很多数学模型都是在不断的进化、改良、升级,也就是说有人不断的在做优化,会有不断更好的模型、更新的技术出现,跟得上技术的发展可能也是比较重要的,否则很多人一直在做某一点上的持续优化就没有意义了。
但同时技术很大的作用是用来解决实际问题的,书中提到的各个数学模型、各种方法都是为了解决人们的需求或者业务的需求,毕竟公司不是科学研究所,所以追求通过技术直接解决用户需求或者做成易用的工具给业务人员、运营人员来间接解决用户需求是挺重要的,可能不是技术人员觉得做到80分就可以了,而是用户、使用工具的人觉得做到80分是一个重要的衡量
提到“工具”,想到赵赵说过的一句话:“不好用就等于没有”,可能就是这个点,同时运用工具的人必须好好的运用,如果用不好甚至不用就太对不起技术了。
读完这本书有一点强烈的感受:工具一定要先进。数学是强大的工具,计算机也是。这两种工具结合在一起,造就了强大的google、百度、亚马逊、阿里、京东、腾迅等公司。他们不是百年老店,但他们掌握了先进的工具。
掌握了先进的工具,必将获得竞争优势。如果你知道哪里有一群软件工程师,维护着更大的一群计算机,那么不要犹豫,想办法使用他们提供的服务,因为这会给你带来优势。所以我们使用Google的搜索和邮件,在亚马逊、京东和淘宝上购物,用QQ和微博联系朋友,使用银行卡和网上银行,利用交易终端在全球市场上进行各种交易……
人类历史就是一部工具的进化史。石器、青铜、铁器、火药、蒸汽机、内燃机、电报、电话、电视、计算机、卫星、互联网,工具的进步引领着文明的进步。新的工具不断淘汰老的工具,就像互联网视频点播正在淘汰电视、微博正在淘汰报纸、电子书正在淘汰纸质书那样。
但有一些古老的工具,今天仍有人在学习和使用,甚至在上面花费许多时间。毛笔就是这样一个例子。今天学习掌握毛笔这种“落后的”工具,还有什么意义?其实我们在使用一些“落后的”工具时,主要是在学习工具背后的思想。书法和绘画中蕴含的艺术审美的一般原则,经得起具体工具变迁的考验。甲骨文、金文、石鼓文所包含的对空间构图的理解,仍然值得现代人学习。思想工具是比实物工具更强大的工具。
工具组合使用,形成更强大的新工具。《数学之美》中提到的马尔可夫链虽然是很强大的工具,但我在数学课上没有听老师提到过。这本书中给我印象最深的例子是余弦定理和新闻分类。余弦定理是中学数学,再加上一些不算很难的多维向量的知识,竟然解决了计算机新闻分类这样的难题!
每一种工具的背后,是人们对世界的一种理解。蒸汽机和内燃机背后,是力学的世界。电报、电话、电视、计算机和互联网背后,是信息的世界。数学是抽象的工具,是其他工具背后的工具。每一门学科要成为科学,都少不了数学。也许有一天人们会习惯,用数学工具来分析艺术。数学是一种语言,它源于具体的世界,又高于具体的世界。如果说语言是对世界的认识和描述,如果说数学是一种语言,那么它一定是最接近神的语言。看似毫不相关,却又能描述万事万物。
学习数学有什么用?物理学家费曼当年在大一时提出这个问题,他的师兄建议他转到物理系。今天,这个问题已不成为问题。具有扎实数学功底的人才正进入各行各业,例如金融业。我认识一个出版社的老总,他招应届毕业生有一个条件:数学要好。
工具虽好,关键还要会用。最终要回到掌握先进工具的人。软件算法工程师加上计算机集群,这是目前一流企业必需的装备。正如马克。安德森所说的,各行各业的一流公司,都是软件公司。优秀的软件算法工程师,是人才争夺的焦点。这样,我们就容易理解Google招工程师的要求。
对信息加工处理和传递的能力不断增强,是知识经济的特点。《数学之美》展示了Google如何运用数学和计算机网络,带领我们进入云计算和大数据时代。
知识经济时代的工作,就是在各自的领域中进行科学研究。科学研究要大胆假设,小心求证。科学研究要量化。科学研究要有对比实验。科学研究要有数学模型。科学研究要有田野调查。科学研究要有文献查证。科学研究要有同行评议。《数学之美》向我们介绍了自然语言分析领域的科研方法和过程。
任何一个领域,深入进去都有无数的细节。有兴趣的人不但没被这些细节吓倒,反而会兴致勃勃地研究,从而达到令人仰慕的高度。吴军先生向我们展示了数学和算法中的这些细节,也展示了他所达到的高度。值得我学习。
《数学之美》读后感2000字:
第一次看到《数学之美》系列文章,是在2008年的Google黑板报上(那个时候Google还没有退出中国)。作者吴军博士当时是Google的研究员,后来到腾讯担任副总裁,两年后又回到Google负责人工智能方面项目,现在他自己创办了创投公司。可以说,吴军是从学术到工业,再到投资界的顶尖专家,在每个领域都有很深的造诣。
之所以对这个系列文章记忆犹新,是因为当初自己正在做机器学习方面的研究,而书中举的很多例子正是我在研究过程中碰到的问题。和其他数学题材书籍比起来,最难能可贵的是,吴军把抽象、深奥的数学方法解释得通俗易懂,给人以很多启发,也让人由衷感叹数学的简单之美和强大之美。
此后,吴军把专栏内容集册成书,并发行了两版,每次读完都有更深一层的体会。至此,我从方法论和思维方式上对此书加以总结,以对这次持续十年的阅读历程画个句号。
一、学习建立解决智能问题的框架。在面对智能问题时,一般地可以考虑按以下四个步骤求解:1.将问题转换成数字描述;2.找到恰当的数学模型(目标函数);3.对复杂的数学模型进行简化或近似处理,以便计算;4.求解目标函数。(对统计模型来说,还要利用数据学习参数)
在今天这个大数据和云计算时代,统计模型往往是解决问题的利器,因为现在我们要解决的问题很多是不确定的。从信息论的角度讲,统计模型的本质是利用信息来消除或减少不确定性。此外,摩尔定律的持续作用,让计算能力快速提高的同时,计算成本急剧降低,使得解决统计模型所需要的海量计算成为可能。
可以说,在科技发展的这个时间点,统计+数据+计算=人工智能。以前计算能力不够,统计模型无法得到求解,在当等式左边三要素都齐备之后,人工智能才就此走向了浪潮之巅。
二、在做事上,首先追求完成,而非完美。许多时候做事失败,不是因为人不够优秀,而是做事的方法不对。一开始追求大而全的解决方案,之后长时间不能完成,最后不了了之。在工程上,应该坚持寻找简单有效的解决方案,先帮助用户解决80%的问题,再慢慢解决剩下的20%问题。
这么做至少有两个好处:1.节约资源。资深工程师往往倾向于低估简单方法的有效性,而完美的方案需要花费大量的资源和时间,但可能最后的提高不多,即性价比不高;2.简单的方案容易解释每个步骤和方法背后的道理,这样不仅便于出了问题时查错,而且容易找到今后改进的目标。
三、正确认识道和术。做事情的方法有道和术两种境界,具体的做事方法是术,做事的原理和原则是道。在术的层面,往往没有捷径可走,必须要通过不断的训练和努力。道决定了做事结果的上限,很多时候在术的层面再努力,也无法突破这个边界,这个时候就要考虑道是否正确。
对搜索引擎反作弊这件事,在术的层面的解决方案是,找出每个作弊的例子,分析并清除之。这种方法能解决问题,而且不需要太动脑子,但是工作量巨大,不断会有新的作弊方法出现,难以从个别现象上升到普通规律,即所谓的“头痛医头、脚痛医脚”。Google从一开始,就认为反作弊实质上是个通信中解决噪音问题,并从加强通信自身的抗干扰能力、过滤噪音两方面入手,从根本上提高了搜索算法的抗作弊能力,达到了事半功倍的效果。可见追求术的人一辈子工作很辛苦,只有掌握了做事的道才能永远游刃有余。
四、找到科学的工作方法很重要。人类为了实现飞行的梦想,首先想到的是模仿鸟类制作振动的翅膀,但这种方法根本不能让人飞起来。后来英国人乔治·凯利爵士通过重新审视鸟类翅膀的功能,发现了空气动力学原理,并制造了一架滑翔机,实现了人类历史上第一次载人滑翔飞行。后人从空气动力学这个科学原理出发,最终发明了现代固定翼飞机。
在人工智能领域,也存在上述“鸟飞派”和“空气动力学派”的分别。机器翻译中,最难的问题之一是词的二义性。比如Bush一词可以是美国总统布什的名字,也可以是灌木丛。最直接想法的是告诉计算机加一条规则:“总统做宾语时,主语必须是一个人”。如果这样做的话,语法规则就多得数不清了,而且还有很多例外。
真正简单却实用的方法是,从大量文本中找到和总统布什一起出现的词,比如美国、华盛顿、国会等等,对灌木丛也作如此处理。在翻译Bush时,看看上下文中哪类相关的词多就行了。这就巧妙地把一个人类的智能问题变成计算机擅长的计算统计问题。
从上述例子中可以看到,所谓鸟飞派,就是指从经验出发,让计算机模仿人的思维方式,试图获得智能的做法,这个做法证明行不通。所谓空气动力学派,就是指搞清楚智能问题的本质,让计算机通过数据和数学模型解决智能问题。今天人工智能的全部进步,都是走后一条道路的结果。
《数学之美》一书,即使对不做研究或工程的人来说,也是开卷有益的。当吴军老师如讲故事般地,把复杂的问题以简单的数学形式讲述出来的时候,你会发现,原本深奥的公式是如此亲切和栩栩如生,也让人由此坚信,任何复杂的问题,最终都可以用简单的方式去解决。
可以说,数学之美,也是化繁为简之美。
《数学之美》读后感800字:
本书介绍了Google产品中涉及的自然语言处理、统计语言模型、中文分词、信息度量、拼音输入法、搜索引擎、网页排名、密码学等内容背后的数学原理。让我们看到了布尔代数、离散数学、统计学、矩阵计算、马尔科夫链等似曾相识的内容在实际生活中的应用。相比于其他数学题材书籍,吴军老师把抽象、深奥的数学方法解释得通俗易懂,书中同时引用了诸多的历史典故和人物介绍,给人以很多启发,也让人由衷感叹数学的简洁和强大。
虽是数据专业毕业,但是才疏学浅,无力对数学的美进行阐述。仅就书中两个比较喜欢的地方发表一点不成熟的见解,与诸位共勉。
其一,在讲Google的搜素引擎反作弊时谈到做事情的两种境界“道”和“术”,术就是具体的做事方法,而道则是隐藏在问题背后的动机和本质。在术这个层面解决问题要付出更多的努力,有点类似于我们常说的“头疼医头,脚疼医脚”,暂时不疼了,过几天复发了,再去医治,如此往复,无法从根本上解决;而只有找到了致病原因,才能做到药到病除,根本治愈。本人之前参与过行内月终自动核对的研发,月终核对初期数据的不一致性只能靠数百业务人员人工核对数据差异,然后修改数据,每月1日都要加班加点,工作量很大,这是从术上解决问题。后来找到了产生差异的原因是会计核算时的利息调整造成的,把这些数据接过来进行相应冲减后差异就消失了,业务人员也不用来加班了,这才是从道上解决问题。
其二,是在做中文网页排名时提到的从业界成功的秘诀之一:“先帮助用户解决80%的问题,再慢慢解决剩下的20%的问题。许多时候做事失败,不是因为人不够优秀,而是做事的方法不对。一开始追求大而全的解决方案,之后长时间不能完成,最后不了了之”。我们在做项目时也是一样,业务有时要的功能非常急,可能有些功能也实现不了(比如系统响应时间长、查询明细不能支持省行等)。这时我们就要将焦点关注在那些可以实现的80%的功能上,哪怕刚刚上线的系统界面丑点,操作复杂点,反应速度慢点,但是至少业务有可用的系统,剩下时间再去优化那剩下的20%。这样可以帮助我行抢占先机,在与同行业的竞争中取得主动。如果等待我们把所有的细节都搞清楚再动手开发,力求完美,那么很可能系统能够上线的时候业务已经不需要了。
数学之美,也就是简单之美。希望大家能够喜欢数学,喜欢数学之美。
1,知识要学以致用。上学的时候学习概率论、运筹学这些学科,只是单纯的认为是数学知识。读过这本书才发现,原来我们日常用到的搜索、语音识别、文章分类这些功能的背后,都是数学知识在起作用。
如果读书的时候就知道这些,学习会更有目的性。结合应用情况,也能更好的理解这些概念。
2,一项技术如果注定要被淘汰,那么从现在就放弃它。从统计学的角度解决机器翻译的方法,明显优于从语法结构角度起手的方法。但是还是有很多学者钻研后者,最后白白浪费了自己多年的时间。
一个公司更应该如此。后面读《浪潮之巅》看到雅虎为了避免文章分类出错,竟然采用人工分类的方法。看到的时候,很难想象这是一家互联网公司能做出来的事情。
3,要学会发现问题的本质,从根源上解决问题。利用搜索引擎的漏洞,做所谓的SEO优化,方法千奇百怪。如果只去解决具体问题,那么就会让自己处于被动状态。发现作弊方法的特征,斩草除根,效率会提升很多。
我第一次看到这本书是在两三年前,当时看的是电子书,虽然没太仔细看,但是第一次近距离了解到这些互联网应用背后的数学原理。
前段时间,我在同学的桌上看到了《数学之美》的纸质书,就向他借来读。虽说“书非借不能读也”,但实际上借了书也没能好好读,断断续续读了有一个月才读完。
由于工作背景的缘故,吴军博士的这本书主要内容集中在语言识别和搜索领域,但这丝毫不妨碍它确实反映了很多共同的道理。我总结了几点供大家探讨。
1. 简单就是美
欧拉公式,最美的数据公式之一。
虽然在大家的眼里,数学是一门深奥的学科,但是很多数学规律却能用非常简单的公式表示出来。我想“简单却非常有用”或许就是数学之美的内涵吧。
书中作者给了很多“简单却非常有用”的例子,比如简单的布尔代数就是搜索引擎的数学基础;比如助Google一举逆袭成为搜索老大pagerank算法就是矩阵乘法迭代结合TF-IDF公式;地图导航搜索就是简单的动态规划;统计语言模型可以轻松解决看似难度、复杂度超高机器翻译、语音识别。
数学的精彩之处就在于简单的模型可以干大事。从本质上讲,数学的思维方法就是抽象与简化。简单的模型怎么来?靠的是先抽象,后简化。对于复杂的问题,往往可以通过抽象,然后用数学模型来描述它。选择了合理的模型就成功了一半。但是有了模型,往往模型看着简单,但求解比较困难。这就需要合理假设继续简化,或者说通过增加合理的假设条件来简化计算。以书上提到的马尔科夫链为例,虽然公式的求解非常困难,但是一旦加上适当的假设,问题就一下子简化了非常多。
所以,针对纷繁芜杂的现实情况,我们一定要能时刻准备着把复杂问题简单化,一定要做到大胆合理假设,尽可能的简化问题,抓住其主要矛盾,先用很小的代价解决大部分的问题,剩下的部分再分步解决。
2. 透过现象看本质
作者说到,技术分为术和道两种,具体的做事方法是术,做事的原理和原则是道。技术容易学,但也容易落伍,所以追求术的人一辈子工作很辛苦,只有掌握了道的本质和精髓才能永远游刃有余。真正做好一件事没有捷径,需要一万小时的专业训练和努力。
道是什么?道实际上就是方向,就是判断。
我想有些领导之所以成为优秀的领导,是因为他们掌握了道,反而对具体的术不那么关注。
举个书上的两个例子,都是关于搜索的:一个例子是搜索的本质是什么?自动下载尽可能多的网页;建立快速有效的索引;根据相关性对网页进行公平准确的排序。另一个例子是搜索引擎作弊的本质是什么?是在网页排名信号中加入了噪声,因此反作弊的关键是去除噪声。
所以,我们在工作的时候,要善于理解事物的原理与本质。要先回答是什么、为什么?最后才是怎么做。再比如,在学习某个软件或某项技术时,就需要先掌握它的工作原理与工作机制,以便于我们判断其适用的场景和不适用的场景,而不是先去熟悉怎么用它。
3. 循序渐进、逐步演化
书上对自然语言处理着墨很多。最初的自然语言处理是基于规则的句法分析,但是一段时间过后,人们发现句法分析的准确率很难提升。正当句法分析派走投无路的时候,统计语言模型出现了,而且越走越顺,很快就把句法分析派远远抛在了后面。问题就来了,那为什么最开始科学家们不直接研究统计语言模型?答案当然是不能,原因是时机还不成熟,因为统计语言模型所需要基于的大数据量的语言库还没有,大规模并行计算的能力还不够。同样的,统计语言模型就是最好的吗?当然是不尽然,科学家们现在开始研究基于深度学习的自然语言处理,相信不久的将来,语言识别、机器翻译会有另外一个质的飞跃。
我们做什么事情都不可能是一蹴而就,一步到位,想毕其功于一役的往往最后的结局都是失败的。
对我们而言,不管是架构规划也好、系统建设也好、管理工作也好,更是需要找准突破口,循序渐进,逐步演化。当然,我们也不能固步自封、墨守成规。
以下是小编为大家整理的关于《数学之美》读后感范文,仅供大家参考,希望能够帮助到大家!
《数学之美》,一个从事多年工作的谷歌研究员眼中的数学。令我大饱眼福的是,大学里面的数学知识竟能如此广泛运用到了计算机行业中。
在语音识别、翻译,还有密码学领域,有着许多基于概率统计的模型和思想。当然,贝叶斯公式是基础,应用到隐含马尔科夫链模型,神经网络模型。
在搜索中,一些相关性的计算,无不用到了概率的知识。在新闻分类中,用到了一些有关矩阵特征值、相似对角化的知识。当然,在图像处理方面,矩阵变换可谓是无处不在。另外,在识别方面,有一些通信模型,涉及到了信道、误码率、信息熵。
最近刚开学也没什么事,所以就想随便找几本书看一下,但别是那种太艰深晦涩的书。8月份一直到现在,吴军写的这本12年5月出版的《数学之美》一直盘踞京东、亚马逊等各大网上商城科技类图书的榜首,当然,还有早些时候出版的《浪潮之巅》也排在很靠前的位置。心想市场的力量应该能帮我挑出好书吧,于是就从图书馆借了一本来,一直到今天晚上把它给看完了。
因此想写一点东西来总结、反思一下,反正刚开完班会也没什么事干。
写在前面的建议:如果你不讨厌数学的话,强烈推荐这本书,网上也可以下到电子版,不过阅读感觉上还是很不一样的。
废话就不多说了,《数学之美》其实是一本科普类的读物,所面向的是接受过普通高等教育的人,完全不需要在特定领域有很深的造诣就可以看懂,大概懂一点线性代数、概率统计、组合数学、信息论、计算机算法、模式识别(虽然列举了这么多,其实有些不懂也没关系……),所以尤其适合信科的人看。内容大部分是和人工智能、计算机相关的,这并非我所学的专业,但作者比较擅长将看似复杂的原理用简明的语言表达出来,所以可读性还是很好的。
吴军是清华大学毕业的,之前任职于Google,后来到了腾讯,这些文章都是发表在Google黑板报上的,后来经过了重写,所以网上下载的和书本内容有所差异。由于吴军本人是研究自然语言处理和语音识别的,所以统计语言模型的东西可能会多一点,不过我觉得这丝毫不妨碍全书数学之美的展现……感觉收获还是挺多的,知识上的有一些,但更多还是思维方式上的。作者举了很多例子试图让人明白很多看似复杂的高科技背后,基本原理其实是出乎意料简单的(当然,必须承认第一个想到这些方法的人还是非常了不起的……)。比如高准确率的机器翻译,看上去好像是计算机能够理解各国语言,隐藏在背后的却是很多具有大学理科学历的人都非常清楚的统计模型和概率模型;再比如拼音输入法的数学原理,早期的研究主要集中在缩短平均编码长度,比如曾经流行一时的五笔输入法,而现今真正实用的输入法却是有很多信息冗余、编码长度比较长的拼音输入法,作者从信息论和市场的角度做了简单的阐述;又比如新闻的自动分类,许多非IT领域的人可能会认为计算机可以读懂新闻并进行分类,而实际上只是特征向量的抽取、*空间中向量夹角的计算,非常非常简单,但凡学过一点线性代数的人绝对是一看就懂的……当然,完美的实现还需要考虑很多细节和现实的情况,但这并不是这本书所关注的地方,数学之美在于其简洁而不是繁琐。
除了对于具体信息技术的剖析之外,作者还花了很大篇幅来讲一些杰出人士的成长过程,特别是把这些人的成长经历和中国学生的成长经历作对比。虽然作者并没有明说,但字里行间多少流露出对于中国高等教育以及很多中国企业的批评,一是教育的功利性,缺乏宽松的独立思考的环境,即使学了一堆理论也难有用武之地,自然也就缺乏创新性的成果;二是中国企业的短视,大部分都不舍得在新框架开发上投资,而是坐享学术界和国外企业的研究成果。
总结一下呢,《数学之美》事实上不能带给你编程能力的提升,也没法让人的数学水平有显着的提升,但它在很大程度上让你跳出教科书式的繁琐细节的束缚,能够从更宏观的角度来思考信息世界背后的数学引擎的运行原理,让人明白看似很高级、复杂的东西背后其实并不如我们所想象的那样复杂,而我们所学的“枯燥”的数学真的可以“四两拨千斤”,改变亿万人的生活。
读数学应该这样学有感
今天早饭后,爷爷让我和姐姐一起念了羊城晚报黄荣臻撰写的一篇文章,题目叫数学应该这样学,读后启发很大感触很深,深受鼓舞。
作者以自己亲身的教学体验,生动形象地讲述了数学应该怎样去学习,才会有比较高的效果。强调必须首先掌握六个环节:预习——听课——复习——做作业——课外练习——小结;其次,要学到点子上要攻克重点、难点;第三,做练习,做练习对巩固数学知识有很重要的作用,但要做有训练价值的习题,少做怪题、难题、垃圾题;最后就是写小结,经常将学习中的难点、易错点、技巧小结出来,是可以将知识由多变少、由难化易的好方法。
读了此文章后我受益非浅,文章让我懂得了只要掌握了好的学习方法,选择了有效的训练题目,就会产生良好的学习效果,提高学习成绩就会成为轻轻松松的事;也让我懂得学习数学也要认真小结,把各章节的内容及时小结,把做练习或考试时做错的类型进行小结;把相关同类的内容进行合并,对加强记忆是非常有用的。我将努力按照这个思路、这种学习方法去攻克数学难关,同时也要举一反三,用这种方法去攻破英语和语文,以优异成绩升上中学。
本书介绍了Google产品中涉及的自然语言处理、统计语言模型、中文分词、信息度量、拼音输入法、搜索引擎、网页排名、密码学等内容背后的数学原理。让我们看到了布尔代数、离散数学、统计学、矩阵计算、马尔科夫链等似曾相识的内容在实际生活中的应用。相比于其他数学题材书籍,吴军老师把抽象、深奥的数学方法解释得通俗易懂,书中同时引用了诸多的历史典故和人物介绍,给人以很多启发,也让人由衷感叹数学的简洁和强大。
虽是数据专业毕业,但是才疏学浅,无力对数学的美进行阐述。仅就书中两个比较喜欢的地方发表一点不成熟的见解,与诸位共勉。
其一,在讲Google的搜素引擎反作弊时谈到做事情的两种境界道和术,术就是具体的做事方法,而道则是隐藏在问题背后的动机和本质。在术这个层面解决问题要付出更多的努力,有点类似于我们常说的头疼医头,脚疼医脚,暂时不疼了,过几天复发了,再去医治,如此往复,无法从根本上解决;而只有找到了致病原因,才能做到药到病除,根本治愈。本人之前参与过行内月终自动核对的研发,月终核对初期数据的不一致性只能靠数百业务人员人工核对数据差异,然后修改数据,每月1日都要加班加点,工作量很大,这是从术上解决问题。后来找到了产生差异的原因是会计核算时的利息调整造成的,把这些数据接过来进行相应冲减后差异就消失了,业务人员也不用来加班了,这才是从道上解决问题。
其二,是在做中文网页排名时提到的从业界成功的秘诀之一:先帮助用户解决80%的问题,再慢慢解决剩下的20%的问题。许多时候做事失败,不是因为人不够优秀,而是做事的方法不对。一开始追求大而全的解决方案,之后长时间不能完成,最后不了了之。我们在做项目时也是一样,业务有时要的功能非常急,可能有些功能也实现不了(比如系统响应时间长、查询明细不能支持省行等)。这时我们就要将焦点关注在那些可以实现的80%的功能上,哪怕刚刚上线的系统界面丑点,操作复杂点,反应速度慢点,但是至少业务有可用的系统,剩下时间再去优化那剩下的20%。这样可以帮助我行抢占先机,在与同行业的竞争中取得主动。如果等待我们把所有的细节都搞清楚再动手开发,力求完美,那么很可能系统能够上线的时候业务已经不需要了。
数学之美,也就是简单之美。希望大家能够喜欢数学,喜欢数学之美。
书籍可以让我们静心。当我们从作者写的作品获得感悟之后,需要好好的就所收获的东西写一篇读后感。我们如何借鉴作品的优秀读后感呢?读后感大全小编特意为大家收集整理了“读后感数学之美”,欢迎阅读,希望大家能够喜欢!
我第一次看到这本书是在两三年前,当时看的是电子书,虽然没太仔细看,但是第一次近距离了解到这些互联网应用背后的数学原理。
前段时间,我在同学的桌上看到了《数学之美》的纸质书,就向他借来读。虽说“书非借不能读也”,但实际上借了书也没能好好读,断断续续读了有一个月才读完。
由于工作背景的缘故,吴军博士的这本书主要内容集中在语言识别和搜索领域,但这丝毫不妨碍它确实反映了很多共同的道理。我总结了几点供大家探讨。
1. 简单就是美
欧拉公式,最美的数据公式之一。
虽然在大家的眼里,数学是一门深奥的学科,但是很多数学规律却能用非常简单的公式表示出来。我想“简单却非常有用”或许就是数学之美的内涵吧。
书中作者给了很多“简单却非常有用”的例子,比如简单的布尔代数就是搜索引擎的数学基础;比如助Google一举逆袭成为搜索老大pagerank算法就是矩阵乘法迭代结合TF-IDF公式;地图导航搜索就是简单的动态规划;统计语言模型可以轻松解决看似难度、复杂度超高机器翻译、语音识别。
数学的精彩之处就在于简单的模型可以干大事。从本质上讲,数学的思维方法就是抽象与简化。简单的模型怎么来?靠的是先抽象,后简化。对于复杂的问题,往往可以通过抽象,然后用数学模型来描述它。选择了合理的模型就成功了一半。但是有了模型,往往模型看着简单,但求解比较困难。这就需要合理假设继续简化,或者说通过增加合理的假设条件来简化计算。以书上提到的马尔科夫链为例,虽然公式的求解非常困难,但是一旦加上适当的假设,问题就一下子简化了非常多。
所以,针对纷繁芜杂的现实情况,我们一定要能时刻准备着把复杂问题简单化,一定要做到大胆合理假设,尽可能的简化问题,抓住其主要矛盾,先用很小的代价解决大部分的问题,剩下的部分再分步解决。
2. 透过现象看本质
作者说到,技术分为术和道两种,具体的做事方法是术,做事的原理和原则是道。技术容易学,但也容易落伍,所以追求术的人一辈子工作很辛苦,只有掌握了道的本质和精髓才能永远游刃有余。真正做好一件事没有捷径,需要一万小时的专业训练和努力。
道是什么?道实际上就是方向,就是判断。
我想有些领导之所以成为优秀的领导,是因为他们掌握了道,反而对具体的术不那么关注。
举个书上的两个例子,都是关于搜索的:一个例子是搜索的本质是什么?自动下载尽可能多的网页;建立快速有效的索引;根据相关性对网页进行公平准确的排序。另一个例子是搜索引擎作弊的本质是什么?是在网页排名信号中加入了噪声,因此反作弊的关键是去除噪声。
所以,我们在工作的时候,要善于理解事物的原理与本质。要先回答是什么、为什么?最后才是怎么做。再比如,在学习某个软件或某项技术时,就需要先掌握它的工作原理与工作机制,以便于我们判断其适用的场景和不适用的场景,而不是先去熟悉怎么用它。
3. 循序渐进、逐步演化
书上对自然语言处理着墨很多。最初的自然语言处理是基于规则的句法分析,但是一段时间过后,人们发现句法分析的准确率很难提升。正当句法分析派走投无路的时候,统计语言模型出现了,而且越走越顺,很快就把句法分析派远远抛在了后面。问题就来了,那为什么最开始科学家们不直接研究统计语言模型?答案当然是不能,原因是时机还不成熟,因为统计语言模型所需要基于的大数据量的语言库还没有,大规模并行计算的能力还不够。同样的,统计语言模型就是最好的吗?当然是不尽然,科学家们现在开始研究基于深度学习的自然语言处理,相信不久的将来,语言识别、机器翻译会有另外一个质的飞跃。
我们做什么事情都不可能是一蹴而就,一步到位,想毕其功于一役的往往最后的结局都是失败的。
对我们而言,不管是架构规划也好、系统建设也好、管理工作也好,更是需要找准突破口,循序渐进,逐步演化。当然,我们也不能固步自封、墨守成规。
《数学之美》读后感800字:
本书介绍了Google产品中涉及的自然语言处理、统计语言模型、中文分词、信息度量、拼音输入法、搜索引擎、网页排名、密码学等内容背后的数学原理。让我们看到了布尔代数、离散数学、统计学、矩阵计算、马尔科夫链等似曾相识的内容在实际生活中的应用。相比于其他数学题材书籍,吴军老师把抽象、深奥的数学方法解释得通俗易懂,书中同时引用了诸多的历史典故和人物介绍,给人以很多启发,也让人由衷感叹数学的简洁和强大。
虽是数据专业毕业,但是才疏学浅,无力对数学的美进行阐述。仅就书中两个比较喜欢的地方发表一点不成熟的见解,与诸位共勉。
其一,在讲Google的搜素引擎反作弊时谈到做事情的两种境界“道”和“术”,术就是具体的做事方法,而道则是隐藏在问题背后的动机和本质。在术这个层面解决问题要付出更多的努力,有点类似于我们常说的“头疼医头,脚疼医脚”,暂时不疼了,过几天复发了,再去医治,如此往复,无法从根本上解决;而只有找到了致病原因,才能做到药到病除,根本治愈。本人之前参与过行内月终自动核对的研发,月终核对初期数据的不一致性只能靠数百业务人员人工核对数据差异,然后修改数据,每月1日都要加班加点,工作量很大,这是从术上解决问题。后来找到了产生差异的原因是会计核算时的利息调整造成的,把这些数据接过来进行相应冲减后差异就消失了,业务人员也不用来加班了,这才是从道上解决问题。
其二,是在做中文网页排名时提到的从业界成功的秘诀之一:“先帮助用户解决80%的问题,再慢慢解决剩下的20%的问题。许多时候做事失败,不是因为人不够优秀,而是做事的方法不对。一开始追求大而全的解决方案,之后长时间不能完成,最后不了了之”。我们在做项目时也是一样,业务有时要的功能非常急,可能有些功能也实现不了(比如系统响应时间长、查询明细不能支持省行等)。这时我们就要将焦点关注在那些可以实现的80%的功能上,哪怕刚刚上线的系统界面丑点,操作复杂点,反应速度慢点,但是至少业务有可用的系统,剩下时间再去优化那剩下的20%。这样可以帮助我行抢占先机,在与同行业的竞争中取得主动。如果等待我们把所有的细节都搞清楚再动手开发,力求完美,那么很可能系统能够上线的时候业务已经不需要了。
数学之美,也就是简单之美。希望大家能够喜欢数学,喜欢数学之美。
《数学之美》读后感2000字:
第一次看到《数学之美》系列文章,是在2008年的Google黑板报上(那个时候Google还没有退出中国)。作者吴军博士当时是Google的研究员,后来到腾讯担任副总裁,两年后又回到Google负责人工智能方面项目,现在他自己创办了创投公司。可以说,吴军是从学术到工业,再到投资界的顶尖专家,在每个领域都有很深的造诣。
之所以对这个系列文章记忆犹新,是因为当初自己正在做机器学习方面的研究,而书中举的很多例子正是我在研究过程中碰到的问题。和其他数学题材书籍比起来,最难能可贵的是,吴军把抽象、深奥的数学方法解释得通俗易懂,给人以很多启发,也让人由衷感叹数学的简单之美和强大之美。
此后,吴军把专栏内容集册成书,并发行了两版,每次读完都有更深一层的体会。至此,我从方法论和思维方式上对此书加以总结,以对这次持续十年的阅读历程画个句号。
一、学习建立解决智能问题的框架。在面对智能问题时,一般地可以考虑按以下四个步骤求解:1.将问题转换成数字描述;2.找到恰当的数学模型(目标函数);3.对复杂的数学模型进行简化或近似处理,以便计算;4.求解目标函数。(对统计模型来说,还要利用数据学习参数)
在今天这个大数据和云计算时代,统计模型往往是解决问题的利器,因为现在我们要解决的问题很多是不确定的。从信息论的角度讲,统计模型的本质是利用信息来消除或减少不确定性。此外,摩尔定律的持续作用,让计算能力快速提高的同时,计算成本急剧降低,使得解决统计模型所需要的海量计算成为可能。
可以说,在科技发展的这个时间点,统计+数据+计算=人工智能。以前计算能力不够,统计模型无法得到求解,在当等式左边三要素都齐备之后,人工智能才就此走向了浪潮之巅。
二、在做事上,首先追求完成,而非完美。许多时候做事失败,不是因为人不够优秀,而是做事的方法不对。一开始追求大而全的解决方案,之后长时间不能完成,最后不了了之。在工程上,应该坚持寻找简单有效的解决方案,先帮助用户解决80%的问题,再慢慢解决剩下的20%问题。
这么做至少有两个好处:1.节约资源。资深工程师往往倾向于低估简单方法的有效性,而完美的方案需要花费大量的资源和时间,但可能最后的提高不多,即性价比不高;2.简单的方案容易解释每个步骤和方法背后的道理,这样不仅便于出了问题时查错,而且容易找到今后改进的目标。
三、正确认识道和术。做事情的方法有道和术两种境界,具体的做事方法是术,做事的原理和原则是道。在术的层面,往往没有捷径可走,必须要通过不断的训练和努力。道决定了做事结果的上限,很多时候在术的层面再努力,也无法突破这个边界,这个时候就要考虑道是否正确。
对搜索引擎反作弊这件事,在术的层面的解决方案是,找出每个作弊的例子,分析并清除之。这种方法能解决问题,而且不需要太动脑子,但是工作量巨大,不断会有新的作弊方法出现,难以从个别现象上升到普通规律,即所谓的“头痛医头、脚痛医脚”。Google从一开始,就认为反作弊实质上是个通信中解决噪音问题,并从加强通信自身的抗干扰能力、过滤噪音两方面入手,从根本上提高了搜索算法的抗作弊能力,达到了事半功倍的效果。可见追求术的人一辈子工作很辛苦,只有掌握了做事的道才能永远游刃有余。
四、找到科学的工作方法很重要。人类为了实现飞行的梦想,首先想到的是模仿鸟类制作振动的翅膀,但这种方法根本不能让人飞起来。后来英国人乔治·凯利爵士通过重新审视鸟类翅膀的功能,发现了空气动力学原理,并制造了一架滑翔机,实现了人类历史上第一次载人滑翔飞行。后人从空气动力学这个科学原理出发,最终发明了现代固定翼飞机。
在人工智能领域,也存在上述“鸟飞派”和“空气动力学派”的分别。机器翻译中,最难的问题之一是词的二义性。比如Bush一词可以是美国总统布什的名字,也可以是灌木丛。最直接想法的是告诉计算机加一条规则:“总统做宾语时,主语必须是一个人”。如果这样做的话,语法规则就多得数不清了,而且还有很多例外。
真正简单却实用的方法是,从大量文本中找到和总统布什一起出现的词,比如美国、华盛顿、国会等等,对灌木丛也作如此处理。在翻译Bush时,看看上下文中哪类相关的词多就行了。这就巧妙地把一个人类的智能问题变成计算机擅长的计算统计问题。
从上述例子中可以看到,所谓鸟飞派,就是指从经验出发,让计算机模仿人的思维方式,试图获得智能的做法,这个做法证明行不通。所谓空气动力学派,就是指搞清楚智能问题的本质,让计算机通过数据和数学模型解决智能问题。今天人工智能的全部进步,都是走后一条道路的结果。
《数学之美》一书,即使对不做研究或工程的人来说,也是开卷有益的。当吴军老师如讲故事般地,把复杂的问题以简单的数学形式讲述出来的时候,你会发现,原本深奥的公式是如此亲切和栩栩如生,也让人由此坚信,任何复杂的问题,最终都可以用简单的方式去解决。
可以说,数学之美,也是化繁为简之美。
在网上看到有人推荐吴军博士的《数学之美》,尽管我从事社会科学研究,但对数学的推崇一直如此,所以买来一读,我的真切体验正如吴军博士在书的后记中所说,把自己“境界提升了一个层次”。
那么,对我而言,到底提升了什么境界呢?
首要的肯定是思想境界。在未读这本书之前,我知道对于这个世界的事件形成的信息集合,人类只有两种方式可以表达,一个是数字,一个是语言。整个实数的集合是无穷个,而且每个数字都是唯一的;整个世界中的事件也是无穷个的,而且每个事件也时独一无二的,这样数学中的数字集合与世界中的事件集合就构成一个一一对应的关系,所以研究数字之间的关系,实际上就是在研究世界中事件之间的关系。语言中的概念和世界中的事件之间也是可以构成一个对应关系的,但问题是,语言中概念的集合是有限的,所以它和数字集合的对应显然只能是部分对应。
计算机科学的发展,人类需要把语言处理成数字,因为计算机只能识别数字信号,所以“语言的数字化”成为计算机产生以来发展最快、而且最有创新性的领域,而许多华人科学家成为了这个领域的顶尖专家,如李开复,吴军博士是卓越的科学家之一。至此我才感到,在计算机主导的世界中,信息化就是数字化,而最难的数字化、也是最有成就的数字化,就是对人类自然语言的数字化,因为人类的信息几乎100%是用语言承载、传播的,计算机要与人对话,变成智能化的机器,首先要解决的就是语言的数字化问题。但我们在电脑上自如地输入文字时、或者拿着手机通话时,我们跟本没有意识到,那些卓越的语言科学家,早已经把我们的语言,转化成数字信号,通过输入、处理、解码的方式,让我们无障碍地联络、工作。
我似乎感到,语言与数字的关系,就是人与自然关系的接口。套用古希腊毕达哥拉斯学派的观点,加上我的理解,即是,数是万物的本原,语言是人的本原!
吴军博士似乎也在提升我对方法的认识境界。科学研究的思考方式,习惯遵循本质、规律、连续性思维,在语言学研究的早期,人类为了让计算机识别语言,采用建立语言规则和语言规则数据库的办法,但最终以失败告终(20世纪50-70年代),70年代后科学家采用了语言统计模型,研究取得了突飞猛进。语言统计模型的胜利,再一次证明了宇宙量子模型的信念,世界是不连续的随机性的粒子构成,人类数千年文明进化出来的语言系统,就是动态的随机概率事件。其二,物理思维再也难逃牛顿的经典本质思维方法,即找寻到百分之百确定性的规律,而信息论思维是研究如何把握不确定性现象,利用概率统计是不二法门。其三,语言本质上就是信息传播,只有从通信模型视角才能真正理解计算机的功能,对语言的编码、处理、传输、解码是计算机的强项,计算机是永远不可能理解语言的意思的。
在《数学之美》中,吴军博士对他的老师、师兄弟、同事的经历、掌故进行了叙述,让我们了解到这些世界一流的学科家、技术精英们的为人处世品质、鲜明个性、科学素养及其管理风格。例如贾里尼克对博士生的严酷淘汰,马库斯对学生的宽宏大度,但我感到他们有一样东西是共同的,就是对科学创造、顶尖人才的识别和器重,甚至是无条件的包容。如此为人的境界才是根本,因为伟大的科学创造毕竟是人做出来的,只有崇高的人文精神之下才能造就顶尖的人才、一流的科学和技术。
观国内的学说界,官风盛行、腐败当道、人情充斥,与这些一流学说群对科学创造的赏识、对个性人才的包容,对科学探索的热诚,可谓相去甚远。
看来,我们只能寄希望于年轻一代,但愿吴博士的《数学之美》,能让我们的学子们,初步体验到科学精英们卓越的才智与情怀。
《数学之美》,一个从事多年工作的谷歌研究员眼中的数学。令我大饱眼福的是,大学里面的数学知识竟能如此广泛运用到了计算机行业中。
在语音识别、翻译,还有密码学领域,有着许多基于概率统计的模型和思想。当然,贝叶斯公式是基础,应用到隐含马尔科夫链模型,神经网络模型。
在搜索中,一些相关性的计算,无不用到了概率的知识。在新闻分类中,用到了一些有关矩阵特征值、相似对角化的知识。当然,在图像处理方面,矩阵变换可谓是无处不在。另外,在识别方面,有一些通信模型,涉及到了信道、误码率、信息熵。
最近刚开学也没什么事,所以就想随便找几本书看一下,但最好别是那种太艰深晦涩的书。8月份一直到现在,吴军写的这本12年5月出版的《数学之美》一直盘踞京东、亚马逊等各大网上商城科技类图书的榜首,当然,还有早些时候出版的《浪潮之巅》也排在很靠前的位置。心想市场的力量应该能帮我挑出好书吧,于是就从图书馆借了一本来,一直到今天晚上把它给看完了。
因此想写一点东西来总结、反思一下,反正刚开完班会也没什么事干。
写在前面的建议:如果你不讨厌数学的话,强烈推荐这本书,网上也可以下到电子版,不过阅读感觉上还是很不一样的。
废话就不多说了,《数学之美》其实是一本科普类的读物,所面向的是接受过普通高等教育的人,完全不需要在特定领域有很深的造诣就可以看懂,大概懂一点线性代数、概率统计、组合数学、信息论、计算机算法、模式识别最好(虽然列举了这么多,其实有些不懂也没关系),所以尤其适合信科的人看。内容大部分是和人工智能、计算机相关的,这并非我所学的专业,但作者比较擅长将看似复杂的原理用简明的语言表达出来,所以可读性还是很好的。
吴军是清华大学毕业的,之前任职于Google,后来到了腾讯,这些文章都是发表在Google黑板报上的,后来经过了重写,所以网上下载的和书本内容有所差异。由于吴军本人是研究自然语言处理和语音识别的,所以统计语言模型的东西可能会多一点,不过我觉得这丝毫不妨碍全书数学之美的展现感觉收获还是挺多的,知识上的有一些,但更多还是思维方式上的。作者举了很多例子试图让人明白很多看似复杂的高科技背后,基本原理其实是出乎意料简单的(当然,必须承认第一个想到这些方法的人还是非常了不起的)。比如高准确率的机器翻译,看上去好像是计算机能够理解各国语言,隐藏在背后的却是很多具有大学理科学历的人都非常清楚的统计模型和概率模型;再比如拼音输入法的数学原理,早期的研究主要集中在缩短平均编码长度,比如曾经流行一时的五笔输入法,而现今真正实用的输入法却是有很多信息冗余、编码长度比较长的拼音输入法,作者从信息论和市场的角度做了简单的阐述;又比如新闻的自动分类,许多非IT领域的人可能会认为计算机可以读懂新闻并进行分类,而实际上只是特征向量的抽取、多维空间中向量夹角的计算,非常非常简单,但凡学过一点线性代数的人绝对是一看就懂的当然,完美的实现还需要考虑很多细节和现实的情况,但这并不是这本书所关注的地方,数学之美在于其简洁而不是繁琐。
除了对于具体信息技术的剖析之外,作者还花了很大篇幅来讲一些杰出人士的成长过程,特别是把这些人的成长经历和中国学生的成长经历作对比。虽然作者并没有明说,但字里行间多少流露出对于中国高等教育以及很多中国企业的批评,一是教育的功利性,缺乏宽松的独立思考的环境,即使学了一堆理论也难有用武之地,自然也就缺乏创新性的成果;二是中国企业的短视,大部分都不舍得在新框架开发上投资,而是坐享学术界和国外企业的研究成果。
总结一下呢,《数学之美》事实上不能带给你编程能力的提升,也没法让人的数学水平有显着的提升,但它在很大程度上让你跳出教科书式的繁琐细节的束缚,能够从更宏观的角度来思考信息世界背后的数学引擎的运行原理,让人明白看似很高级、复杂的东西背后其实并不如我们所想象的那样复杂,而我们所学的枯燥的数学真的可以四两拨千斤,改变亿万人的生活。
1,知识要学以致用。上学的时候学习概率论、运筹学这些学科,只是单纯的认为是数学知识。读过这本书才发现,原来我们日常用到的搜索、语音识别、文章分类这些功能的背后,都是数学知识在起作用。
如果读书的时候就知道这些,学习会更有目的性。结合应用情况,也能更好的理解这些概念。
2,一项技术如果注定要被淘汰,那么从现在就放弃它。从统计学的角度解决机器翻译的方法,明显优于从语法结构角度起手的方法。但是还是有很多学者钻研后者,最后白白浪费了自己多年的时间。
一个公司更应该如此。后面读《浪潮之巅》看到雅虎为了避免文章分类出错,竟然采用人工分类的方法。看到的时候,很难想象这是一家互联网公司能做出来的事情。
3,要学会发现问题的本质,从根源上解决问题。利用搜索引擎的漏洞,做所谓的SEO优化,方法千奇百怪。如果只去解决具体问题,那么就会让自己处于被动状态。发现作弊方法的特征,斩草除根,效率会提升很多。
读数学书的读后感范文一
自三年级起,我开始订阅《趣味数学》,它是一本生动有趣的课外数学辅导资料。
借用一句古话:授人以鱼,不如授人以渔。就是说:给人一条鱼,不如教他打渔的方法(或技术)。就像我们的老师孜孜不倦的在课堂上教会我们学习时的方法或公式。《趣味数学》就像一本教你如何在知识的海洋里打渔的杂志它不仅让我们学到了知识的要点,更我们掌握了学习中的方法。
《趣味数学》它的内容分为:科幻故事。名人数学家的成长经历。历史故事。开心笑话。脑筋急转弯,以及漫画;它以这些方式,向我们展示了数学世界的精彩。例如:科幻故事利用魔法的神奇让我们感到数学世界的魅力和神秘。科幻故事虽然只有一个叫《菜鸟魔法师之黑魔法复苏》,这是一篇每期连载的科幻故事里面的主要人物有:格鲁、贝奇、萨尔、吉米、托比和索拉,他们各有各自的本领以及独特的性格,但是他们都有一个共同点,就是爱探险。所谓的菜鸟魔法师就是格鲁,他喜欢钻研魔法。托比是个数学家。贝奇是个语言学家。萨尔是个植物学家。吉米是个考古学家。索拉是个探险家。他们是一个个爱动脑筋。善于思考的人。通过读他们的故事,让我的思维变的灵敏,使我更加喜欢思考和发现问题。
让我记忆深刻的是第一册《趣味数学》名人数学家的成长经历中讲的是我国著名数学家陈景润。
陈景润爷爷,从小就酷爱读书,可惜家庭贫困无法供他读书。小时侯陈爷爷每天一见到自己哥哥放学回到家就缠着叫哥哥讲数学故事。这件事一直被陈景润的母亲看在眼里,她一咬牙把陈景润也送进了学校。入学后,陈景润的成绩优异,可是因家庭困难,陈景润上了高中以后,不得不退学,后来,他在家里坚持自学一学期。从小到大,陈景润都酷爱看书,他与小朋友一起捉迷藏时,手里都拿着本书,然后往隐蔽的地方一窝,等到大家都走光了,他也不知道。有一次,妈妈让他煮饭,因为专注地看书他居然连饭煮糊了也不知道。陈景润有着忘我的学习精神,能够在艰苦的环境下坚持学习,因此后来他成为我国著名的数学家。我们应该向他学习这种酷爱读书的学习精神。
另外,这本书中的开心笑话和漫画让我们在一个充满乐趣的环境下学习数学,还用脑筋急转弯的方式来锻炼我们的思维能力,让我成为一个爱思考、爱发现的孩子。
《趣味数学》让我们在趣味中学习,在快乐中进步。它使我的学习充满乐趣,也使我变得热爱思考。我喜欢读《趣味数学》。
读数学书的读后感范文二
教学之余,我拜读了《小学数学教师》这本书,读完以后,回想自己的数学教师生涯感受颇多
在这本书里,我能体会到她作为一名数学教师是怎样让学生感受数学之美,让学生感受数学鲜活、好玩儿,同时我又能感受到她作为一名数学教师又是怎样让学生学到的不仅仅是课本上的数学知识,怎样帮助学生赢得学以致用。
作为一名数学教师,她们爱数学,她们爱教学生数学。让学生感受数学之美吸引她们去努力探求问题的答案,成为贯穿她们数学教育的一条主线。知识的记忆是暂时的,思想与能力的获得是永存的。因此面向每一个学生的数学教学必须以提高学生的数学素养为目的。新的课程改革和教学改革对数学教学的要求正反应了上述要求,数学教学从传统的传授知识的模式更多地转变到以激励学习为特征、以学生为中心的实践模式。学生的自主学习、独立创造、个性发展将受到更多的重视。数学教学将更重于培养、发展学生的广泛的数学能力。
让学生在玩中学数学,范老师说在玩中教数学、学数学是学生体验数学、喜欢上数学的好办法。这对于小学生里来说确实是一个好办法,让孩子看到的数学不是一张严肃的面孔。在教学上,留给学生的作业就是做玩具。结果老师收到了学生们制作的许多漂亮的模型和手工纸模艺术品,如长颈鹿、飞机、火箭、仿古花瓶、未来汽车等等。这让我想到,其实我们的作业可以不必那么机械,只停留在读读写写上,可以让学生更多的接触生活,动起来,玩起来。例如,我们在教学方向与位置一单元时就让学生回家设计校园的平面图,孩子交上来的作业五花八门,可是却渗透了学生的智慧和快乐。
在书中还写到,每年我都要组织学生到郊外的大自然中去玩,但我强调,玩不是无目的的疯玩、傻玩,要能够在玩中学到知识和技能。在这本书里,张老师还特别介绍了一个如何让学生喜欢上数学、感受到数学鲜活、好玩儿的办法,为了让学生们真正体验到学习数学的乐趣,感受数学的魅力,把数学与生活联系起来,形成科学探索精神。
下面是小编整理的关于阅读数学读后感范文,欢迎阅读参考。
阅读数学读后感【1】
一个酋长要分给一位名叫纪塔娜的美丽女神一块土地,这块土地的大小可以用一张灰鼠皮围起来。
纪塔娜接过鼠皮,并没有把它直接铺在地上,而是把它剪成了很细很细的皮条,把这些皮条连接成了一条很长的皮绳,她用这条皮绳靠着海岸,围出了一块很大的半圆形的土地,结果她就分到了一块很大的土地,自作聪明的酋长这下可傻了眼。
原来,用一定长度的绳子,围出一块面积,其中,围成的圆的面积是最大的,二如果围成一个完全的圆形,那它的面积确是有限的。
纪塔娜利用了海岸线,把海岸线当成了这个半圆的直径,这样围得的土地是最多的。
读了这篇故事,我体会到做事情不能只看事物的表面,有时一个小小东西的应用得当,可以创造出很大的成就。
这个故事还告诉我们考虑事情要从事物的多个角度出发,如果没有仔细考虑,就得出来的结论只是片面的、不一定是最好的。
阅读数学读后感【2】
一个最小的自然数,它非正非负,乘或除以任何数,结果都等于0,而且没有倒数,是谁呢?没错,这个数就是0。
最近,我读了一篇趣味数学小故事,名叫0和它的数字兄弟,故事的大意是这样的:1234567890十个兄弟去了森林,9自豪的以为自己是最大的数字,大家一致认为0是最小的,除了0,每个数都有自己的本事,所以,没人和0玩。
可是,大象掉进了大洞爬不出来了,1到9都来帮忙,组成了最大的数字987654321,使出浑身解数都救不了大象。
最后,0也来帮忙了,组成了9876543210,力量突然扩大了10倍,救出了大象。
读完这个故事,我深有所悟。
原来,一个小小的0,也能释放出这样大的力量啊!那么,我们比不上小小的0吗?答案一定是否定的。
为什么有人数学很差,正是他把一个0给忽略了,只要你比别人多花一点时间,上课认真听了,作业还好完成,就会一点一点的进步。
记住,数学不是靠看看就能会的,而是靠你的大脑去思考,数学很简单。
我们一定不能看低自己,也不能像9一样自大骄傲,要怀着谦虚的心态去学习。
遇到什么事,大家都要团结,只要齐心协力就能打倒困难,天生我材必有用。
阅读数学读后感【3】
今天我读了《数学司令》这本书,这本书主要讲了一个名叫牛牛的数学学的很好的小孩儿在一次数学竞赛中取得了第一名的好成绩,变自称数学司令。
七七王国便邀请牛牛去七七王国参加一次重要会议,七七王国为了夺回属于自己的领土,便向八八王国发动了战争,牛牛也就便成了真正的数学司令。
一上来便用三路包抄的办法打败了八八王国,八八王国又派出了机械兽,都把八八王国打败了,小七副官设计把牛牛抓了起来,但是牛牛运用自己的数学知识逃了出来,并化装侦察,摸清了八八王国的底细,牛牛训练出了圆形队列,打败了八八王国。
读了这本书我知道了数学的重要,也非常佩服牛牛,其中有一道题有七名士兵,一二一二的报数报一的下场,让牛牛站在队伍中的任何地方,数一的下场,看谁能坚持到最后,便奖励一袋糖,牛牛站在了第八个,最终获得了胜利。
看了这个片段,我便更加敬佩数学司令牛牛了,更被数学的魅力所吸引,数学可以让人更加聪明。
我也要向牛牛学习,把数学学好,让自己变得更聪明更自信。
在阅读时我们能够全身心的进入书中的那个世界,是一件非常幸福的事情!我们在生活中可以多多去读一些经典书籍作品,在阅读过一篇书籍后内心肯定有属于自己的感悟,为了充分回味作品这个作品,就可以好好写一篇读后感。一篇优秀的作品读后感是怎么样写的呢?下面是小编为大家精心推荐的“「读书有感」数学之美读后感450字(1000字)”,赶紧看看对您有没有帮助吧,喜欢请收藏哦!
看到吴军的另一本书《数学之美》,激起了很深的兴趣,所以很快把书看完了,普及了很多基础的知识的同时也启发了很多想法,感觉很爽。
我自己在交大学的是工科(虽然没怎么上过课),小学、初中、高中都是一路参加数学竞赛,名次都还不错,也因此没有参加中考、高考,一路保送,自己对数学有很深的感情,同时女朋友大学也是数学系,有点后悔的大学选了个并不感兴趣的专业(交大当时允许我随便选专业,我没有跟父母商量自己选了船舶制造)。看这本书的过程中找到了很多高中在看竞赛书的感觉,里面提到的很多概率论(不等式)、图论、数论的知识是高中数学联赛复试的重点,高中的时候已经研究的很深了,不过大学荒废了之后也忘得差不多了,书中提到的很多定理还很有亲切感
书名叫做《数学之美》,显得有些太大,毕竟更多的是吴军在google做搜索相关工作用到的数学模型的介绍与总结,提到的数学部分大多集中在概率论、图论、数论领域,所以书名太大了,可能hax说得对,也许是出版社为了卖书取得名字
不得不说吴军是一个大家,文字中能够透露出大家的气势,书中不断的穿插着各种历史上的大科学家以及科技领域的大家的小故事甚至八卦,从文字中非常能够感受到吴军是一个和他们一个层次的人(即使他自己会自谦说是一个二流的工程师之类)
书中具体的模型就不介绍了,说几点我学到的知识(仅仅皮毛),能列出来的都是看完还有点印象的:
1.在互联网的世界中,信息是如何量化的,信息熵是怎么回事?有啥用?
2.搜索领域中,语言是如何统计的,尤其是如何通过概率模型进行分词
3.搜索引擎是如何工作的—网络爬虫是怎么回事儿
4.PageRank是怎么回事?为了解决什么问题?
5.密码与解密领域的数学模型,尤其提到的二战时候的各种解密的趣事儿,提到的电视剧《暗算》打算抽空看下
6.拼音输入法的数学模型
7.、文本自动分类的模型
……
看完之后最大的感受就是:
1.数学模型巨大作用,推动着新技术的发展
2.攻城师是一个伟大的职业,能够运用这些知识转化为生产力,非常牛叉
3.书中提到了很多数学模型都是在不断的进化、改良、升级,也就是说有人不断的在做优化,会有不断更好的模型、更新的技术出现,跟得上技术的发展可能也是比较重要的,否则很多人一直在做某一点上的持续优化就没有意义了。
但同时技术很大的作用是用来解决实际问题的,书中提到的各个数学模型、各种方法都是为了解决人们的需求或者业务的需求,毕竟公司不是科学研究所,所以追求通过技术直接解决用户需求或者做成易用的工具给业务人员、运营人员来间接解决用户需求是挺重要的,可能不是技术人员觉得做到80分就可以了,而是用户、使用工具的人觉得做到80分是一个重要的衡量
提到“工具”,想到赵赵说过的一句话:“不好用就等于没有”,可能就是这个点,同时运用工具的人必须好好的运用,如果用不好甚至不用就太对不起技术了。
读完这本书有一点强烈的感受:工具一定要先进。数学是强大的工具,计算机也是。这两种工具结合在一起,造就了强大的google、百度、亚马逊、阿里、京东、腾迅等公司。他们不是百年老店,但他们掌握了先进的工具。
掌握了先进的工具,必将获得竞争优势。如果你知道哪里有一群软件工程师,维护着更大的一群计算机,那么不要犹豫,想办法使用他们提供的服务,因为这会给你带来优势。所以我们使用Google的搜索和邮件,在亚马逊、京东和淘宝上购物,用QQ和微博联系朋友,使用银行卡和网上银行,利用交易终端在全球市场上进行各种交易……
人类历史就是一部工具的进化史。石器、青铜、铁器、火药、蒸汽机、内燃机、电报、电话、电视、计算机、卫星、互联网,工具的进步引领着文明的进步。新的工具不断淘汰老的工具,就像互联网视频点播正在淘汰电视、微博正在淘汰报纸、电子书正在淘汰纸质书那样。
但有一些古老的工具,今天仍有人在学习和使用,甚至在上面花费许多时间。毛笔就是这样一个例子。今天学习掌握毛笔这种“落后的”工具,还有什么意义?其实我们在使用一些“落后的”工具时,主要是在学习工具背后的思想。书法和绘画中蕴含的艺术审美的一般原则,经得起具体工具变迁的考验。甲骨文、金文、石鼓文所包含的对空间构图的理解,仍然值得现代人学习。思想工具是比实物工具更强大的工具。
工具组合使用,形成更强大的新工具。《数学之美》中提到的马尔可夫链虽然是很强大的工具,但我在数学课上没有听老师提到过。这本书中给我印象最深的例子是余弦定理和新闻分类。余弦定理是中学数学,再加上一些不算很难的多维向量的知识,竟然解决了计算机新闻分类这样的难题!
每一种工具的背后,是人们对世界的一种理解。蒸汽机和内燃机背后,是力学的世界。电报、电话、电视、计算机和互联网背后,是信息的世界。数学是抽象的工具,是其他工具背后的工具。每一门学科要成为科学,都少不了数学。也许有一天人们会习惯,用数学工具来分析艺术。数学是一种语言,它源于具体的世界,又高于具体的世界。如果说语言是对世界的认识和描述,如果说数学是一种语言,那么它一定是最接近神的语言。看似毫不相关,却又能描述万事万物。
学习数学有什么用?物理学家费曼当年在大一时提出这个问题,他的师兄建议他转到物理系。今天,这个问题已不成为问题。具有扎实数学功底的人才正进入各行各业,例如金融业。我认识一个出版社的老总,他招应届毕业生有一个条件:数学要好。
工具虽好,关键还要会用。最终要回到掌握先进工具的人。软件算法工程师加上计算机集群,这是目前一流企业必需的装备。正如马克。安德森所说的,各行各业的一流公司,都是软件公司。优秀的软件算法工程师,是人才争夺的焦点。这样,我们就容易理解Google招工程师的要求。
对信息加工处理和传递的能力不断增强,是知识经济的特点。《数学之美》展示了Google如何运用数学和计算机网络,带领我们进入云计算和大数据时代。
知识经济时代的工作,就是在各自的领域中进行科学研究。科学研究要大胆假设,小心求证。科学研究要量化。科学研究要有对比实验。科学研究要有数学模型。科学研究要有田野调查。科学研究要有文献查证。科学研究要有同行评议。《数学之美》向我们介绍了自然语言分析领域的科研方法和过程。
任何一个领域,深入进去都有无数的细节。有兴趣的人不但没被这些细节吓倒,反而会兴致勃勃地研究,从而达到令人仰慕的高度。吴军先生向我们展示了数学和算法中的这些细节,也展示了他所达到的高度。值得我学习。
在网上看到有人推荐吴军博士的《数学之美》,尽管我从事社会科学研究,但对数学的推崇一直如此,所以买来一读,我的真切体验正如吴军博士在书的后记中所说,把自己“境界提升了一个层次”。
那么,对我而言,到底提升了什么境界呢?
首要的肯定是思想境界。在未读这本书之前,我知道对于这个世界的事件形成的信息集合,人类只有两种方式可以表达,一个是数字,一个是语言。整个实数的集合是无穷个,而且每个数字都是唯一的;整个世界中的事件也是无穷个的,而且每个事件也时独一无二的,这样数学中的数字集合与世界中的事件集合就构成一个一一对应的关系,所以研究数字之间的关系,实际上就是在研究世界中事件之间的关系。语言中的概念和世界中的事件之间也是可以构成一个对应关系的,但问题是,语言中概念的集合是有限的,所以它和数字集合的对应显然只能是部分对应。
计算机科学的发展,人类需要把语言处理成数字,因为计算机只能识别数字信号,所以“语言的数字化”成为计算机产生以来发展最快、而且最有创新性的领域,而许多华人科学家成为了这个领域的顶尖专家,如李开复,吴军博士是卓越的科学家之一。至此我才感到,在计算机主导的世界中,信息化就是数字化,而最难的数字化、也是最有成就的数字化,就是对人类自然语言的数字化,因为人类的信息几乎100%是用语言承载、传播的,计算机要与人对话,变成智能化的机器,首先要解决的就是语言的数字化问题。但我们在电脑上自如地输入文字时、或者拿着手机通话时,我们跟本没有意识到,那些卓越的语言科学家,早已经把我们的语言,转化成数字信号,通过输入、处理、解码的方式,让我们无障碍地联络、工作。
我似乎感到,语言与数字的关系,就是人与自然关系的接口。套用古希腊毕达哥拉斯学派的观点,加上我的理解,即是,数是万物的本原,语言是人的本原!
吴军博士似乎也在提升我对方法的认识境界。科学研究的思考方式,习惯遵循本质、规律、连续性思维,在语言学研究的早期,人类为了让计算机识别语言,采用建立语言规则和语言规则数据库的办法,但最终以失败告终(20世纪50-70年代),70年代后科学家采用了语言统计模型,研究取得了突飞猛进。语言统计模型的胜利,再一次证明了宇宙量子模型的信念,世界是不连续的随机性的粒子构成,人类数千年文明进化出来的语言系统,就是动态的随机概率事件。其二,物理思维再也难逃牛顿的经典本质思维方法,即找寻到百分之百确定性的规律,而信息论思维是研究如何把握不确定性现象,利用概率统计是不二法门。其三,语言本质上就是信息传播,只有从通信模型视角才能真正理解计算机的功能,对语言的编码、处理、传输、解码是计算机的强项,计算机是永远不可能理解语言的意思的。
在《数学之美》中,吴军博士对他的老师、师兄弟、同事的经历、掌故进行了叙述,让我们了解到这些世界一流的学科家、技术精英们的为人处世品质、鲜明个性、科学素养及其管理风格。例如贾里尼克对博士生的严酷淘汰,马库斯对学生的宽宏大度,但我感到他们有一样东西是共同的,就是对科学创造、顶尖人才的识别和器重,甚至是无条件的包容。如此为人的境界才是根本,因为伟大的科学创造毕竟是人做出来的,只有崇高的人文精神之下才能造就顶尖的人才、一流的科学和技术。
观国内的学说界,官风盛行、腐败当道、人情充斥,与这些一流学说群对科学创造的赏识、对个性人才的包容,对科学探索的热诚,可谓相去甚远。
看来,我们只能寄希望于年轻一代,但愿吴博士的《数学之美》,能让我们的学子们,初步体验到科学精英们卓越的才智与情怀。
《数学之美》,一个从事多年工作的谷歌研究员眼中的数学。令我大饱眼福的是,大学里面的数学知识竟能如此广泛运用到了计算机行业中。
在语音识别、翻译,还有密码学领域,有着许多基于概率统计的模型和思想。当然,贝叶斯公式是基础,应用到隐含马尔科夫链模型,神经网络模型。
在搜索中,一些相关性的计算,无不用到了概率的知识。在新闻分类中,用到了一些有关矩阵特征值、相似对角化的知识。当然,在图像处理方面,矩阵变换可谓是无处不在。另外,在识别方面,有一些通信模型,涉及到了信道、误码率、信息熵。
最近刚开学也没什么事,所以就想随便找几本书看一下,但最好别是那种太艰深晦涩的书。8月份一直到现在,吴军写的这本12年5月出版的《数学之美》一直盘踞京东、亚马逊等各大网上商城科技类图书的榜首,当然,还有早些时候出版的《浪潮之巅》也排在很靠前的位置。心想市场的力量应该能帮我挑出好书吧,于是就从图书馆借了一本来,一直到今天晚上把它给看完了。
因此想写一点东西来总结、反思一下,反正刚开完班会也没什么事干。
写在前面的建议:如果你不讨厌数学的话,强烈推荐这本书,网上也可以下到电子版,不过阅读感觉上还是很不一样的。
废话就不多说了,《数学之美》其实是一本科普类的读物,所面向的是接受过普通高等教育的人,完全不需要在特定领域有很深的造诣就可以看懂,大概懂一点线性代数、概率统计、组合数学、信息论、计算机算法、模式识别最好(虽然列举了这么多,其实有些不懂也没关系),所以尤其适合信科的人看。内容大部分是和人工智能、计算机相关的,这并非我所学的专业,但作者比较擅长将看似复杂的原理用简明的语言表达出来,所以可读性还是很好的。
吴军是清华大学毕业的,之前任职于Google,后来到了腾讯,这些文章都是发表在Google黑板报上的,后来经过了重写,所以网上下载的和书本内容有所差异。由于吴军本人是研究自然语言处理和语音识别的,所以统计语言模型的东西可能会多一点,不过我觉得这丝毫不妨碍全书数学之美的展现感觉收获还是挺多的,知识上的有一些,但更多还是思维方式上的。作者举了很多例子试图让人明白很多看似复杂的高科技背后,基本原理其实是出乎意料简单的(当然,必须承认第一个想到这些方法的人还是非常了不起的)。比如高准确率的机器翻译,看上去好像是计算机能够理解各国语言,隐藏在背后的却是很多具有大学理科学历的人都非常清楚的统计模型和概率模型;再比如拼音输入法的数学原理,早期的研究主要集中在缩短平均编码长度,比如曾经流行一时的五笔输入法,而现今真正实用的输入法却是有很多信息冗余、编码长度比较长的拼音输入法,作者从信息论和市场的角度做了简单的阐述;又比如新闻的自动分类,许多非IT领域的人可能会认为计算机可以读懂新闻并进行分类,而实际上只是特征向量的抽取、多维空间中向量夹角的计算,非常非常简单,但凡学过一点线性代数的人绝对是一看就懂的当然,完美的实现还需要考虑很多细节和现实的情况,但这并不是这本书所关注的地方,数学之美在于其简洁而不是繁琐。
除了对于具体信息技术的剖析之外,作者还花了很大篇幅来讲一些杰出人士的成长过程,特别是把这些人的成长经历和中国学生的成长经历作对比。虽然作者并没有明说,但字里行间多少流露出对于中国高等教育以及很多中国企业的批评,一是教育的功利性,缺乏宽松的独立思考的环境,即使学了一堆理论也难有用武之地,自然也就缺乏创新性的成果;二是中国企业的短视,大部分都不舍得在新框架开发上投资,而是坐享学术界和国外企业的研究成果。
总结一下呢,《数学之美》事实上不能带给你编程能力的提升,也没法让人的数学水平有显着的提升,但它在很大程度上让你跳出教科书式的繁琐细节的束缚,能够从更宏观的角度来思考信息世界背后的数学引擎的运行原理,让人明白看似很高级、复杂的东西背后其实并不如我们所想象的那样复杂,而我们所学的枯燥的数学真的可以四两拨千斤,改变亿万人的生活。
1,知识要学以致用。上学的时候学习概率论、运筹学这些学科,只是单纯的认为是数学知识。读过这本书才发现,原来我们日常用到的搜索、语音识别、文章分类这些功能的背后,都是数学知识在起作用。
如果读书的时候就知道这些,学习会更有目的性。结合应用情况,也能更好的理解这些概念。
2,一项技术如果注定要被淘汰,那么从现在就放弃它。从统计学的角度解决机器翻译的方法,明显优于从语法结构角度起手的方法。但是还是有很多学者钻研后者,最后白白浪费了自己多年的时间。
一个公司更应该如此。后面读《浪潮之巅》看到雅虎为了避免文章分类出错,竟然采用人工分类的方法。看到的时候,很难想象这是一家互联网公司能做出来的事情。
3,要学会发现问题的本质,从根源上解决问题。利用搜索引擎的漏洞,做所谓的SEO优化,方法千奇百怪。如果只去解决具体问题,那么就会让自己处于被动状态。发现作弊方法的特征,斩草除根,效率会提升很多。
《数学之美》读后感2000字:
第一次看到《数学之美》系列文章,是在2008年的Google黑板报上(那个时候Google还没有退出中国)。作者吴军博士当时是Google的研究员,后来到腾讯担任副总裁,两年后又回到Google负责人工智能方面项目,现在他自己创办了创投公司。可以说,吴军是从学术到工业,再到投资界的顶尖专家,在每个领域都有很深的造诣。
之所以对这个系列文章记忆犹新,是因为当初自己正在做机器学习方面的研究,而书中举的很多例子正是我在研究过程中碰到的问题。和其他数学题材书籍比起来,最难能可贵的是,吴军把抽象、深奥的数学方法解释得通俗易懂,给人以很多启发,也让人由衷感叹数学的简单之美和强大之美。
此后,吴军把专栏内容集册成书,并发行了两版,每次读完都有更深一层的体会。至此,我从方法论和思维方式上对此书加以总结,以对这次持续十年的阅读历程画个句号。
一、学习建立解决智能问题的框架。在面对智能问题时,一般地可以考虑按以下四个步骤求解:1.将问题转换成数字描述;2.找到恰当的数学模型(目标函数);3.对复杂的数学模型进行简化或近似处理,以便计算;4.求解目标函数。(对统计模型来说,还要利用数据学习参数)
在今天这个大数据和云计算时代,统计模型往往是解决问题的利器,因为现在我们要解决的问题很多是不确定的。从信息论的角度讲,统计模型的本质是利用信息来消除或减少不确定性。此外,摩尔定律的持续作用,让计算能力快速提高的同时,计算成本急剧降低,使得解决统计模型所需要的海量计算成为可能。
可以说,在科技发展的这个时间点,统计+数据+计算=人工智能。以前计算能力不够,统计模型无法得到求解,在当等式左边三要素都齐备之后,人工智能才就此走向了浪潮之巅。
二、在做事上,首先追求完成,而非完美。许多时候做事失败,不是因为人不够优秀,而是做事的方法不对。一开始追求大而全的解决方案,之后长时间不能完成,最后不了了之。在工程上,应该坚持寻找简单有效的解决方案,先帮助用户解决80%的问题,再慢慢解决剩下的20%问题。
这么做至少有两个好处:1.节约资源。资深工程师往往倾向于低估简单方法的有效性,而完美的方案需要花费大量的资源和时间,但可能最后的提高不多,即性价比不高;2.简单的方案容易解释每个步骤和方法背后的道理,这样不仅便于出了问题时查错,而且容易找到今后改进的目标。
三、正确认识道和术。做事情的方法有道和术两种境界,具体的做事方法是术,做事的原理和原则是道。在术的层面,往往没有捷径可走,必须要通过不断的训练和努力。道决定了做事结果的上限,很多时候在术的层面再努力,也无法突破这个边界,这个时候就要考虑道是否正确。
对搜索引擎反作弊这件事,在术的层面的解决方案是,找出每个作弊的例子,分析并清除之。这种方法能解决问题,而且不需要太动脑子,但是工作量巨大,不断会有新的作弊方法出现,难以从个别现象上升到普通规律,即所谓的“头痛医头、脚痛医脚”。Google从一开始,就认为反作弊实质上是个通信中解决噪音问题,并从加强通信自身的抗干扰能力、过滤噪音两方面入手,从根本上提高了搜索算法的抗作弊能力,达到了事半功倍的效果。可见追求术的人一辈子工作很辛苦,只有掌握了做事的道才能永远游刃有余。
四、找到科学的工作方法很重要。人类为了实现飞行的梦想,首先想到的是模仿鸟类制作振动的翅膀,但这种方法根本不能让人飞起来。后来英国人乔治·凯利爵士通过重新审视鸟类翅膀的功能,发现了空气动力学原理,并制造了一架滑翔机,实现了人类历史上第一次载人滑翔飞行。后人从空气动力学这个科学原理出发,最终发明了现代固定翼飞机。
在人工智能领域,也存在上述“鸟飞派”和“空气动力学派”的分别。机器翻译中,最难的问题之一是词的二义性。比如Bush一词可以是美国总统布什的名字,也可以是灌木丛。最直接想法的是告诉计算机加一条规则:“总统做宾语时,主语必须是一个人”。如果这样做的话,语法规则就多得数不清了,而且还有很多例外。
真正简单却实用的方法是,从大量文本中找到和总统布什一起出现的词,比如美国、华盛顿、国会等等,对灌木丛也作如此处理。在翻译Bush时,看看上下文中哪类相关的词多就行了。这就巧妙地把一个人类的智能问题变成计算机擅长的计算统计问题。
从上述例子中可以看到,所谓鸟飞派,就是指从经验出发,让计算机模仿人的思维方式,试图获得智能的做法,这个做法证明行不通。所谓空气动力学派,就是指搞清楚智能问题的本质,让计算机通过数据和数学模型解决智能问题。今天人工智能的全部进步,都是走后一条道路的结果。
《数学之美》一书,即使对不做研究或工程的人来说,也是开卷有益的。当吴军老师如讲故事般地,把复杂的问题以简单的数学形式讲述出来的时候,你会发现,原本深奥的公式是如此亲切和栩栩如生,也让人由此坚信,任何复杂的问题,最终都可以用简单的方式去解决。
可以说,数学之美,也是化繁为简之美。
读《和吴正宪老师一起读数学新课标》有感
龙港十小 曹海鸥
作者简介
吴正宪,全国著名小学数学特级教师,全国模范教师,全国人大代表,国家督学,《义务教育数学课程标准(2011年版)》审定专家,国家基础教育课程教材专家工作委员会委员,教育部中小学教材审查委员会委员,全国小学数学教学专业委员会副理事长,北京教育科学研究院基础教育研究中心小学数学教研室主任。张秋爽,北京市顺义区教育研究考试中心小学数学教研员。李惠玲,北京小学数学教师。
内容简介
这本书分为五大部分:第一部分是总述,第二部分是“数与代数”领域解读,第三部分是“图形与几何”领域解读,第四部分是“统计与概率”领域解读,第五部分是“综合与实践”领域解读。在每个部分中,以“关键词+新在哪里+吴老师解疑+精彩课例”的形式聚焦新课标,解决教师教学中的实际问题。
这本书有以下几个特色:注重新课标的精神实质,注重新课标的主要变化,注重结合课例来解读新课标。它以“学习新课标”为主题,以“新课标的理念和课程的四个领域”为主要线索,以“和吴正宪老师一起读新课标”为看点,由吴正宪团队的多位老师根据自己的学习体会谈感想,许多论点又有教学实践的片断做支撑,便于读者理解。这对于小学数学教师学习、领会新课标,会有很好的启发,所以它是学习新课标很好的参考读物。
精彩分享
1、数学的学习就是学生不断感悟、逐步开窍的过程,就是学生不断生疑——解疑——生疑的过程。在教学过程中,学生会问许多问题,尽管有时我们把握不准,尽管有时学生的问题不着边际,但也应该让学生提,从而培养他们的质疑能力,而教师所要做的就是倾听、筛选。最重要的是,教师要和学生一起思考问题,从习以为常的经验中学会反思和追问。
2、模型思想作为一种思想要真正使学生有所感悟,需要经历一个长期的过程。在这一过程中,学生总是从相对简单到相对复杂,从相对具体到相对抽象,逐步积累经验,掌握建模方法,逐步形成运用模型去进行数学思维的习惯。在教学中要注意根据学生的年龄特征和“数与代数”领域内容在不同学段的要求,逐步渗透模型思想。比如在第一学段,可以引导学生经历从现实情境中抽象出数的过程,使学生能学会用适当的符号来表示这些现实情境中的简单现象,提出一些力所能及的数学问题;在第二学段,通过一些具体问题,引导学生通过观察分析抽象出更为一般的模式表达,如用字母表示有关的运算律和运算性质,总结出路程、速度、时间,单价、数量、总价等关系式。总之,对模型思想的感悟应该蕴含于概念、命题、公式、法则的教学之中,并与数感、符号意识等方面的培养紧密结合。
3、对情感态度进行评价,帮助学生树立自信心。师生之间真诚的情感交流,是学生能否全身心投人课堂学习的一个关键因素。学生在数学学习中思考方式、思考问题的角度有不全面和不尽完善之处,但那是他们对事物最本真的认识。教师抓住学生对事物认识的特点,给予恰当的评价,就能够激发学生学习的热情,把抽象的知识与学生的认识建立起联系。只有学生感兴趣了,他们才能建立自信心。
4、学生学习本身就是动态的过程,教师应该善于将静态的知识动态化,让学生在动静结合的过程中,掌握知识,形成能力。
5、小学生由于认识的深浅、思考的角度、生活的阅历、个性的差异等因素,必然表现出理解的差异、创造的差异。在教学实践中,引导学生从不同角度出发来观察和思考问题,有利于培养学生灵活处理数学问题的能力。我们要鼓励学生对于一个问题所要求的适当答案不与他人相同,总有新想法、新设计,表现得独特;我们还要有意识地设计开放性的习题,给学生以创新的机会,从而培养学生思维的广阔性、灵活性和创造性。
读后反思
英国著名哲学家罗素说:“数学,不但拥有真理,而且拥有至高的美。”我很庆幸我做了一名教师,更庆幸做了一名数学教师,与数学邂逅是我最值得感恩的一件事。这段时间,迷恋上了吴正宪老师,连续几个月都看她的书。这个月与她一起走进数学新课标,让我在这次《三角尺的再认识》磨课过程中,受到了很多启发。心理学家皮亚杰的研究表明,儿童的理解来自他们作用于物体的活动。在学习比较抽象的数学知识过程中,动手操作是一种不可缺少的方式。我想,数学的学习是学生在动手操作和与老师平等对话中不断感悟、逐步开窍的过程。这样的过程带领着学生不断思考,体会着思考的快乐与幸福。
数学思考是数学学习的灵魂,数学课堂绝不能丢了它的魂。教师不仅要在数学课堂中,不断引导学生追问为什么,从知识的结果和过程,追溯知识的来源。还要在备课时,不断深挖源头,只有清楚知识的源头和发展,才能在课堂上自信、沉稳地引导学生,才能真正做到“平等”地与学生对话和交流,从而引发学生思考,共同建设智慧课堂。
书中在数与代数这一章节提到,世界是运动变化的,函数是研究运动变化的重要数学模型,与实际的联系十分紧密。我想,函数思想不仅体现在数与代数的领域,它其实也渗透在其他各个领域里,如统计与概率、综合与实践等。作为教师的我们,在日常的教学中,如长方形和正方形的周长与面积、立体图形的体积、积的变化规律、折线统计图中数据与点的一一对应等,要善于做一个用心之人,在点滴中渗透函数思想。
虽然之前,我也读过新课标,但《和吴正宪老师一起读数学新课标》这本书,让我重新审视了我的课堂教学,让我在备课之初会多问几遍自己为什么,关于知识、关于学生、关于课堂呈现。在上课时,会更关注学生的思维与表达,还会更注重与学生的交流,倾听他们的思想。并从他们的思考里,得到知识的生长点,从而能更好地做到与孩子们平等交流、共同成长。
相信《读数学之美有感》一文能让您有很多收获!“好读后”是您了解读后感的必备网站,请您收藏hdh765.com。同时,编辑还为您精选准备了读独享体罚之秘密有感专题,希望您能喜欢!