编程语言：实现自己的Lisp解释器（一）

热点排行

实现自己的Lisp解释器（一）

类别：编程语言点击：0 评论：0 推荐：

发了好几篇关于Lisp的文章，但是一直苦于手头没有一个合用的Lisp解释器，于是狠一狠心，决定自己写一个，一来是为了配合前几篇入门教程，二来也算是打发无聊的时光吧。

花了不到两天时间，写出了一个Lisp解释器的雏形，遵照惯例，我给它起名叫Lisp48，意思就是48小时内写出的Lisp，当然，你也可以把它理解为只完成了48%的Lisp。其中还有很多Bug，很多语句还不能正常工作，不过我想这应该不妨碍我们理解如何用“命令式语言”构造一个最基本的Lisp解释器。

整个源程序发表在这里：http://www.msnusers.com/TheWindozeFamily/Documents/Lisp48.zip

注意：这个程序完全没有优化，执行效率在某些情况下可能会低的惊人，如果你有兴趣，对于这个问题我们可以进一步探讨。

如果你是一个软件工程派，喜欢合理的结构，规范的代码和详尽的文档，你一定不会喜欢我写的程序；如果你是一个Design Pattern Zealot，你一定会发现我的程序里很多地方没有规范的使用GoF Pattern。考虑到这是一个Quick and Dirty Solution，我建议你把有关规范性的合理化建议放到你所在的公司/学校/组织机构的开发例会上提出，这样会更有效。

如果这些可能被你视为垃圾的代码严重的伤害了你的感情，触犯了你的审美观和道德观，你可以选择：1、提出改进意见；2、在其它地方痛斥我和程序；3、去看别的网页。如果你在我的地盘上用不适当的词语斥责我，结果只能是删贴，这样做浪费的不光是我的时间和精力，还有你的。

请不要在这里发表对排版格式/命名规范的观点和看法，这里不是火葬场，不是Flame War应该出现的地方。而且我绝对不会采纳这样的意见。因为就我的个人经验，我采用的命名规范往往比你按照教科书提出的规范更好用。

Lisp的语法很简单，而且程序和数据结构相同，这就为我们编写解释器提供了很大的便利，而且为了简单起见，我们在这里不考虑Lexical Scope，而是按照McCarthy创造Lisp时所采用的Dynamic Scope方式进行名字解析，这样我们只需要在运行过程中保留一个Context。总而言之，现代Lisp中的一切会导致实现复杂化的因素在这里都不存在。

在Lisp中，函数、程序都是表，表是由原子和表组成的一个嵌套递归结构，所以我们首先从一个抽象的数据结构MetaObject说起。

在本程序中，MetaObject有如下形式的定义：

class MetaObject { public: virtual ~MetaObject(){} // 确保RTTI和dynamic_cast可以使用 // Overloads virtual MetaPtr Clone() const=0; virtual MetaPtr atom() const=0; virtual MetaPtr null() const=0; virtual MetaPtr eq(MetaPtr m) const=0; virtual MetaPtr equal(MetaPtr m) const=0; protected: // Convenient functions virtual std::string ToString() const=0; virtual void Parse(std::string s)=0; public: // Properties void Text(std::string s) { Parse(s); } std::string Text() const { return ToString(); } };

这里有几点需要注意：

Clone函数的作用顾名思义，把它放在这里的一个最主要的目的在于：在“古代”Lisp中，表达式没有副作用，所有的表和原子都是不可变的（对照Python中的不可变类型），修改一个表唯一的办法就是生成一个新表，既然如此，那么Clone接口就是很重要的，我们将会看到，Clone在整个程序中大量使用（这恐怕也是效率低下的一个主要原因）。 eq和equal，在Common Lisp中，eq测试两个表的“同一性”而不是值是否相等，也就是说(eq '(a b) '(a b))在CL中返回nil，测试是否相等要使用equal，(equal '(a b) '(a b))在CL中返回T；但是在“古代”的Lisp中，没有同一性测试，只有等值测试，使用eq操作符，(eq '(a b) '(a b))在其中返回T。
我在这里准备了两个操作符，但是由于我们要实现的是“古代”Lisp，所以eq在程序中并没有使用，只是放在这里而已。一个空表是一个原子，所以atom和null对于空表同时等于T。 ToString/Parse/Text用来处理文本输入输出，这里只是一个接口，具体实现在后面讨论。关于垃圾收集，我没精神去自制一个GC，也没精神去研究bohemGC等流行的库，所以我采用了一种“穷人的垃圾收集”，也就是引用计数，这种方式在我目前的这个实现中是有好处的，因为在这里不存在循环引用的问题（除非是我程序的Bug），每一个新表都是通过Clone制做的Deep copy或者凭空new出来的。实际上我连引用计数都没兴趣自己做，所以我用了Boost.SharedPtr，这个比较省事。

本文地址：http://com.8s8s.com/it/it28719.htm