|文科生也能领略数学之美吗?当然


可能是出于缺什么偏爱什么 , 我这个文科生内心里充满了对数学的虔诚与热爱 。 尽管担心智商不足以支撑这种热爱 , 仍然通过一点点局部努力靠近着数学 , 毕竟热爱不能只是说说而已 。 这不 , 我翻开了吴军的《数学之美》……

|文科生也能领略数学之美吗?当然
本文插图

《数学之美》的内容与疏漏可能性
这本书讲的是数学之美 , 更确切地说 , 是计算机应用领域的数学之美 。 作者吴军是计算机博士 , 毕业于清华和约翰霍普金斯大学 , 曾在谷歌和腾讯就职 , 后来当了投资人 。 投资的朋友可能都读过他的《浪潮之巅》 , 讲的是AT&T、IBM、苹果、英特尔、微软和谷歌等一浪接一浪的电子科技巨头们 。 而这本书 , 吴军指向了理解电子科技所需要的更基础性的、更理论化的知识:数学 。
《数学之美》早期是发表在博客上的计算机科普系列文章 , 宗旨一直是面向大众 , 而不仅仅是计算机从业人员 。 以前我仅仅知道计算机背后都是数学 , 没了 。 阅读完吴军这本书后 , 基础的数学知识并没有增进多少 , 到底是术业有专攻的 , 书里的公式我可没有试图去掌握 , 但是 , 对计算机应用确实拥有了更基础的理解 。
全书分为34个章节 , 从怎么理解信息化到不同计算机应用领域对应的数学 , 章题分得很细 。 那些输入法、搜索引擎、加密与解密、云计算、区块链等等我们耳熟能详的东西 , 都是由一个个数学公式、数学模型搭建起来 。 作为一个计算机基础理论的工作者 , 吴军想要解决一个问题时 , 是拿着一堆纸、一只笔进行几个小时的公式演算 , 而非在电脑面前快速翻飞手指 , 对我这个外行来说 , 是很有意思的一个画面 。
由于通常情况下 , 从业人员一生的从业方向只会是其中一个具体的领域 , 所以这本书也会适合从业人员从更大的视野看待自己的专业 。 不过这也暗含了一个问题 , 就是吴军也不可能在他所写的全部领域都拥有前线经验 , 故而也看到有专业的网友批评密码学这个章节的内容有误 。
科普需要严谨 , 而且是分外需要 。 科普是在向所有大众 , 包括我这样根本不懂具体的科学知识 , 通过类比等文字来理解个中逻辑的普通大众 。 默认科普文章背后都是严谨的、正确的科学知识 , 难道不是写作者与阅读者心照不宣的共识吗?要向读者掀开计算机应用神秘面纱的文章 , 本身存在误导的话 , 真是叫人感到沮丧呢 。 其实如果有作者本人不甚了解的领域 , 也可以通过与其它专业的科学家合作的方式来完成一本科普书籍的 。
【|文科生也能领略数学之美吗?当然】这个问题的存在同时也是一种祛魅 , 人无完人 , 书无完书 , 有所选择地为我所用 , 也算是无论如何强调都不过分的一点了 。
《数学之美》中让我印象深刻的内容
《数学之美》通过文字和语言对比数字和信息 , 有效又有趣地带文科生推开计算机世界的大门 。 文字、语言和数学 , 在起源处就有相通性 。 为了统一理解和交流 , 不同文字和语言都有自己的编码规则 , 交流和翻译需要解码的能力 。 这也是为什么很多翻译软件都叫“罗塞塔”的原因 , 正是罗塞塔石碑的破译使得人类重新掌握古埃及象形文字 。
通过数学的逻辑也可以让我们理解歧义、病句在文字和语言中的必然存在 。 如果说 , 词是有限而封闭的组合 , 语言是相对而言无限和开放的组合 , 如此 , 任何语言都有语法规则覆盖不及之处 。 而恰恰人类用来给语言“编码”的语法规则与习惯 , 一度引自然语言处理的研究往一个无法突破的方向上长跑多年 , 始终无果 。 一个学术领域迷失方向的20年 , 背后是很多个学者一生学术蹉跎 。
如果人类不是通过模仿鸟飞 , 而是通过学习空气动力学来造出飞机的 , 那么 , 机器也不用通过学习人类去分析语句和语义 , 而是通过数学和统计学来处理自然语言的 。 从这点看 , 人工智能并没有那么神秘 , 只是算力而已 。
算力的发展却又特别重要 。 事实上 , 人工智能是上世纪40年代便提出来的概念 , 50年代开始在计算机上实现 , 尽管只是解决一些非常简单的分类问题 , 却足够让学界去憧憬 , 计算机会否产生“智能” 。 事情一直没有发生的根源在于 , 稍微复杂点的东西当时的计算机根本没有足够的算力去实现 。
摩尔定律使得计算机的速度成指数级增长 , 然而 , 一个被冷落的科研领域申请不到经费 , 科学家们只好祭出新的概念“连接主义” 。 一片树叶的确可以再次掉进同一条河流 , 连接主义的规模不够 , 仍然干不了足够重要的大事 , 行业再度遇冷 , 直到 , 新兴科学家们再一次给同一片树叶起了一个新名字:深度学习 。 可以说 , 深度学习是乘坐在云计算的翅膀上 , 尝试起飞的 。
云计算使得同时使用成千上万台计算机资源成为可能 , 算力规模不可同日而语 。 Google大脑的脱颖而出 , 就是一方面利用了云计算的并行处理技术 , 另一方面通过算法降低了每次迭代的计算量 , 可以说是通过开源节流实现创新的 。
吴军在《数学之美》中反复提到数学的简单之美 , 合适的、创新的数学模型很多时候是更简单而非更复杂的 , 甚至于可以说 , “数学在计算机科学的一个重要作用 , 就是找到计算复杂度尽可能低的解” 。 为此 , 吴军还花了一整个章节通过天文学领域的模型来谈论数学模型的重要性 。 一个椭圆模型就可以解决的运行轨迹 , 用错误的圆形模型 , 计算要繁复许多许多倍 。
这么一看倒是对2000年前的托勒密肃然起敬 。 他赤手空拳地通过40-60个大圆套小圆的方程 , 精确地计算出了行星运动的轨迹 , 误差甚至比后来哥白尼基于日心说的模型还要小……
输入法那个章节的内容则让我重新审视了一下自己的打字习惯 。 小时候跟着家里人一起学五笔输入法 , 当时是说练熟了五笔 , 打字可以比拼音输入法快很多 。 不记得是什么鼓舞着我背诵与练习毫无规律的“一地在要工”以及各个偏旁部首的位置 , 练熟不容易 , 不然也不会一旦练熟就很难放弃 , 似乎放弃就太浪费了过去的努力, 也就一直使用了下来 。
早期拼音输入法卯足劲儿在拼音的编码上 , 相对忽略了消除歧义性的编码 , 给其它输入法的迅速崛起创造了条件 。 五笔只是当时数千种中文输入法中的一个 , 暂时性的胜出是由于王永民更会做市场 , 而不是编码技术更合理 。 反正那些输入法的逻辑都差不多 , 只要背熟用熟它们设计的编码规则 , 打字都可以快得飞起 。
而拼音输入法的优势在于 , 随着普通话的普及 , 人们并不需要额外学习一种新的编码规则来实现打字 。 后来 , 拼音输入法通过建立一个基于词的统计语言模型 , 通过上下文降低信息熵 , 降低歧义性的同时提高了平均击键次数 , 其它输入法的优势不复存在 , 人们便自然而然选择了拼音输入法 。 看起来 , 我是在拼音输入法的发展真空期学会了五笔——一个运气蛮好却终将消逝的输入法 , 结果再也丢不下了 。
整体而言 , 《数学之美》不是一趟寻常意义的阅读旅程 , 不习惯跳着看一本书的我却不得不绕着书里的公式走 , 尽管作者再三强调 , 公式可看可不看 , 不影响阅读体验 。 文科生并不用担心读得目光涣散 , 不会解一环套一环的方程 , 仍然可以领略逻辑 , 领略逻辑背后的美 。


    推荐阅读