编程的宗派【转自： http://www.yinwang.org/blog-cn/2015/04/03/paradigms/】 - 闲聊灌水

问题点数：0 回复次数：0

编程的宗派【转自： http://www.yinwang.org/blog-cn/2015/04/03/paradigms/】

　　编程的宗派

　　总是有人喜欢争论这类问题，到底是“函数式编程”（FP）好，还是“面向对象编程”（OOP）好。既然现在出了两个帮派，就有人积极地做它们的帮众，互相唾骂和残杀。然后呢，又出了一个“好好先生帮”，这个帮的人喜欢说，管它什么范式呢，能解决问题的工具就是好工具！

　　我个人其实不属于这三帮人中的任何一个。

　　面向对象编程（Object-Oriented Programming）

　　如果你看透了面向对象的本质就会发现，其实“面向对象编程”本身就没有引入很多新东西。所谓“面向对象语言”，其实不过是普通的“过程式语言”（比如Pascal），加上一点点抽象能力。所谓的“类”和“对象”，其实不过是过程式语言里面的记录（record）或者结构（structure），它的本质其实就是一个从名字到数据的“映射表”（map）。你可以用名字从这个表里面提取相应的数据，这比起数组来是一件很方便的事情，因为你不需要记住存放数据的下标。即使你添加了新的数据成员，仍然可以用原来的名字来访问已有的数据，所以已有的代码完全不需要修改。

　　所谓“对象思想”（区别于“面向对象”），实际上就是对这种数据访问方式的进一步抽象。一个经典的例子就是平面点的数据结构。如果你把一个点存储为：

struct Point {
    double x;
    double y;
}

　　那么你用point.x和point.y可以直接访问它的X和Y坐标。但你也可以把它存储为极坐标方式：

struct Point {
    double r;
    double angle;
}

　　那么你可以用point.r和point.angle访问它的模和角度。可是现在问题来了，如果你的代码开头把Point定义为第一种XY的方式，使用point.x, point.y访问X和Y坐标，可是后来你决定改变Point的存储方式，用极坐标，你却不想修改已有的使用point.x和point.y的代码，怎么办呢？

　　这就是“对象思想”的价值，它让你改变point.x和point.y的语义，从而让使用它们的代码完全不需要修改。虽然你的实际数据结构里面根本没有x和y这两个成员，你可以通过改变.x和.y的意义来临时生成它们。在你使用point.x和point.y的时候，系统内部其实在运行两个函数，它们的作用是从r和angle计算出x和y的值。这样你的代码就感觉好像x和y是实际存在的成员一样。在Python之类的语言里面，你可以通过定义“方法”来直接改变point.x和point.y的语义。在Java里稍微复杂一些，你需要使用point.getX()和point.getY()这样的写法。然而它们最后的目的其实都是一样的——它们为数据访问提供了一层“间接”，或者叫做“抽象”。

　　这种抽象是一个非常好的想法，它甚至可以跟量子力学的所谓“不可观测性”扯上关系。你觉得这个原子里面有10个电子？也许它们只是像point.x给你的幻觉一样，也许宇宙里根本就没有电子这种东西，也许你每次看到一个所谓的电子，它都是临时生成来给你看的呢？然而，这就是对象思想的一切。你见过的所谓“面向对象思想”，几乎无一例外可以从这个想法推广出来。面向对象语言的绝大部分特性，其实是过程式语言早就提供的。因此我觉得，其实没有语言可以叫做“面向对象语言”。就像一个人为一个公司贡献了一点点代码，并不足以让公司以他的名字命名一样！

　　“对象思想”，作为数据访问的抽象，是有一定好处的。然而“面向对象”（多了“面向”两个字），就是把这种本来良好的思想东拉西扯，牵强附会，发挥过了头。很多面向对象语言，把所有的函数都放进所谓对象里面，叫做“方法”，把普通的函数叫做“静态方法”（static method）。实际上呢，就像我之前的例子，只有极少需要抽象的时候，需要使用内嵌于对象之内，跟数据紧密结合的“方法”。其他的时候，我们完全可以用普通的函数来完成任务，而且这样做更加简单和直接。这种强制把函数放进数据的做法是本末倒置的，因为函数本身并不属于对象，它们只是对象的变换操作。函数是独立于对象的，强制把函数放进它们本来不属于的对象里面，导致了面向对象代码逻辑过度复杂。很简单的想法，非得绕好多道弯子才能表达清楚。

　　软件领域就是喜欢制造宗派。“面向对象”当年就是这样扯着各种幌子，成为了一种宗派，给很多人洗了脑。很多人至今不知道自己所用的“面向对象语言”里面的很多优点，都是从过程式语言继承来的。每当发生函数式与面向对象式语言的冲突，都有面向对象的帮众拿出这些过程式语言早就有的优点来进行反驳，说：“你说面向对象不好，看它能做这个……” 拿别人的优点撑起自己的门面，这样的辩论纯粹是鸡同鸭讲，所以我懒得参加。

　　函数式编程（Functional Programming）

　　函数式语言一直以来比较低调，直到最近由于并发计算编程瓶颈的出现以及Haskell，Scala之类语言的流行，它忽然变成了一种宗派。被函数式语言洗脑的帮众，喜欢否定其它语言的一切，看低其它程序员。特别是有些初学编程的人，俨然把函数式编程当成了一天瘦二十斤的减肥神药，以为自己从函数式语言入手，就可以对其它经验超过他十年以上的老程序员说三道四，仿佛别人不用函数式语言就什么都不懂一样。函数式语言的拥鳖们认为这个世界本来应该是“纯”（pure）的，没有任何“副作用”。他们把一切的“赋值操作”看成低级弱智的作法。他们很在乎所谓尾递归，类型推导，fold，currying，maybe type等等。他们以自己能写出使用这些特性的代码为豪。

　　可是殊不知，那些东西其实除了能自我安慰，以为自己高人一等，并不一定能带来真正优秀的代码。大量使用fold和currying的代码，写起来貌似很酷，可是读起来非常痛苦。很多人根本不明白fold的本质，却老喜欢用它，因为他们觉得那是函数式编程的“精华”，可以显示自己的聪明。然而，他们没有看到的是，其实fold包含的，只不过是在列表上做递归的“通用模板”，这个模板需要你填进去三个参数，就可以给你一个新的递归函数。所以每一个fold的调用，本质上都是一个完整的在列表上的递归函数定义。fold的问题在于，它定义了一个递归函数，却没有给它一个简单的名字。使用fold的结果是，每一次看到这个fold调用，你都需要重新读懂它的整个定义，才能琢磨出它到底是干什么的。比如，当你看到这句Haskell代码：

　　foldr (+) 0 [1,2,3]

　　你知道它是做什么的吗？也许你一秒钟之后就琢磨出，它的意思其实是对[1,2,3]里的数字进行求和，本质上相当于sum [1,2,3]。虽然只花了一秒钟，可你仍然需要琢磨。如果fold里面带有更复杂的函数，那么很有可能一分钟都琢磨不透。写起来倒没有费很大力气，可为什么我每次读这段代码，都需要看到+和0这两个跟自己的意图毫无关系的东西？为什么我需要搞清楚+, 0, [1,2,3]的相对位置以及它们的含义？这样的写法其实还不如写一个递归函数，给它一个有意义名字（比如sum），这样以后看到这个名字被调用，比如sum [1,2,3]，你想都不用想就知道它要干什么。定义sum这样的名字虽然稍微增加了写代码时的工作，却给读代码的时候带来了很大的方便。所以为了写的时候简洁或者很酷而用fold，其实增加了读代码时的脑力开销。要知道代码被读的次数，要比被写的次数多很多，所以使用fold往往是得不偿失的。然而，被函数式语言宗派洗脑的人，却是看不到这一点的，他们太在乎显示给别人看，我也会用fold！

　　半壶水都喜欢响叮当。很多喜欢自吹为“函数式程序员”的人，往往并不真的理解函数式语言的本质。他们一旦看到过程式语言的写法就嗤之以鼻。比如以下这个C函数：

int f(int x) {
    int y = 0;
    int z = 0;
    y = 2 * x;
    z = y + 1;
    return z / 3;
    　　
}

　　很多函数式程序员可能看到那几个赋值操作就皱起眉头，然而他们看不到的是，这是一个真正意义上的“纯函数”，它在本质上跟Haskell之类语言的函数是一样的，也许还要更加优雅一些。

　　盲目鄙视赋值操作的人，也不理解“数据流”的概念。其实不管是对局部变量赋值还是把它们作为参数传递，其实本质上都像是把一个东西放进一个管道，或者把一个电信号放在一根导线上，只不过这个管道或者导线，在不同的语言范式里放置的方向和样式有一点不同而已！

　　函数式语言的帮众没有看清楚的另一个重要的东西，是数据结构。数据结构的有些问题是“物理”和“本质”地存在的，真的不是你换个语言，或者换个风格，就可以搞定的。函数式语言的拥鳖们喜欢盲目的相信和使用列表（list），而没有看清楚它的本质以及它所带来的时间复杂度。列表带来的问题，不仅仅是编程的复杂性。不管你怎么聪明的使用它，很多性能问题是根本没法解决的，因为列表的拓扑结构根本就不适合用来干有些事情！

　　从数据结构的角度看，Lisp所谓的list就是一个单向链表。你必须从上一个节点才能访问下一个，而这每一次“间接寻址”，都是需要时间的。在这种数据结构下，很简单的像length或者append之类函数，时间复杂度都是O(n)！为了绕过这数据结构的不足，所谓的“Lisp风格”告诉你，不要反复append，如果需要反复把元素加到列表末尾，那么应该先反复cons，然后再reverse一下。很可惜的是，当你同时又有循环或者递归的，就会发现cons+reverse的做法颠来倒去的，非常容易出错。这种方式用一次还可以，多几层嵌套之后，自己都把自己搞糊涂了。好不容易做对了，下次修改可能又会出错。然而就是有人喜欢显示自己聪明，喜欢自虐，迎着这类人为制造的“困难”勇往直前 :)

　　富有讽刺意味的是，半壶水的Lisp程序员都喜欢用list，真正深邃的Lisp大师级人物，却知道什么时候应该使用记录（结构）或者数组。在Indiana大学，我曾经上过一门Scheme（一种现代Lisp方言）编译器的课程，授课的老师是R. Kent Dybvig，他是世界上最先进的Scheme编译器Chez Scheme的作者。我们的课程编译器的数据结构（包括AST）都是用list表示的。在课程最后，Kent对我们说：“你们的编译器已经可以生成跟我的Chez Scheme媲美的代码。然而Chez Scheme不止生成高效的目标代码，它的编译速度是你们编译器的700倍以上。它可以在5秒钟之内编译它自己！” 然后他透露了一点Chez Scheme速度之快的原因，而其中一个，就是因为Chez Scheme的内部数据结构根本不是list。在编译一开头的时候，Chez Scheme就已经把输入的代码转换成了数组一样的，固定长度的结构。

　　后来在工业界的经验教训也告诉了我，数组比起链表，确实在某些时候有大幅度的性能提升。在什么时候使用链表，什么时候使用数组，是一门艺术。

　　好好先生

　　很多人避免“函数式vs面向对象”的辩论，于是他们成为了“好好先生”。这种人没有原则的认为，任何能够解决当前问题的工具就是好工具。也就是这种人，喜欢使用shell script，喜欢折腾各种Unix工具，因为显然，它们能解决他“手头的问题”。

　　然而这种思潮是极其有害的，它的害处其实更胜于投靠函数式或者面向对象。没有原则的好好先生们忙着“解决问题”，却不能清晰地看到这些问题为什么存在。他们所谓的问题，往往是由于现有工具的设计失误。由于他们的“随和”，他们从来不去思考，如何从根源上消灭这些问题。他们在一堆历史遗留的垃圾上缝缝补补，妄图使用设计恶劣的工具建造可靠地软件系统。当然，这代价是非常大的。不但劳神费力，而且也许根本不能解决问题。

　　所以每当有人让我谈谈“函数式vs面向对象”，我都避免说“各有各的好处”，因为那样的话我会很容易被当成这种毫无原则的好好先生。

　　符号必须简单的对世界建模

　　从上面你已经看出，我既不是一个铁杆“函数式程序员”，也不是一个铁杆“面向对象程序员”，我也不是一个爱说“各有各的好处”的好好先生。我是一个有原则的批判性思维者。我不但看透了FP和OOP的本质，而且看透了它们之间的统一关系。我编程的时候看到的不是表面的语言和程序，而是一个类似电路的东西。我看到数据的流动和交换，我看到效率的瓶颈，而这些都是跟具体的语言和范式无关的。

　　在我的心目中其实只有一个概念，它叫做“编程”（programming），它不带有任何附加的限定词（比如“函数式”或者“面向对象”）。我的老师Dan Friedman喜欢把自己的领域称为“Programming Languages”，也是一样的原因。因为我们研究的内容，不局限于某一个语言，也不局限于某一类语言，而是所有的语言。在我们的眼里，所有的语言都不过是各个特性的组合。在我们的眼里，最近出现的所谓“新语言”，其实不大可能再有什么真正意义上的创新。我们不喜欢说“发明一个程序语言”，不喜欢使用“发明”这个词，因为不管你怎么设计一个语言，所有的特性几乎都早已存在于现有的语言里面了。我更喜欢使用“设计”这个词，因为虽然一个语言没有任何新的特性，它却有可能在细节上更加优雅。

　　编程最重要的事情，其实是让写出来的符号，能够简单地对实际或者想象出来的“世界”进行建模。不管看起来多么酷的语言或者范式，如果必须绕着弯子才能表达程序员心目中的模型，那么它就不是一个很好的语言或者范式。有些东西本来就是有随时间变化的“状态”的，如果你偏要用“纯函数式”语言去描述它，当然你就进入了那些monad之类的死胡同。最后你不但没能高效的表达这种副作用，而且让代码变得比过程式语言还要难以理解。如果你进入另一个极端，一定要用对象来表达本来很纯的数学函数，那么你一样会把简单的问题搞复杂。Java的所谓design pattern，很多就是制造这种问题的，而没有解决任何问题。

　　关于建模的另外一个问题是，你心里想的模型，并不一定是最好的，也不一定非得设计成那个样子。有些人心里没有一个清晰简单的模型，觉得某些语言“好用”，就因为它们能够对他那种扭曲纷繁的模型进行建模。所以你就跟这种人说不清楚，为什么这个语言不好，因为显然这语言对他是有用的！如何简化模型，已经超越了语言的范畴，在这里我就不细讲了。

　　我设计Yin语言的宗旨，就是让人可以用最简单，最直接的方式来对世界进行建模，并且帮助他们优化和改进模型本身。