早上我的一个朋友高诉我,说小叮咚机器人还是那么笨,不好玩。这是我才意识到小叮咚机器人有大概半年没有更新过了,不过小叮咚一直活着:-),我希望他能快快长大。
大概在去年,网络上流行起了聊天机器人,做的好的有 小I
,小强等几种机器人,也包括QQ提供的机器人,但是他们的定位并不在于“聊天”,而是个人信息工具。比如查询电话号码所属区域,ip地址,邮编,天气情况
等个人服务。很显然由于用户和后台的沟通方式的单一(只能通过聊天的方式),所以这种服务的优势并不明显。这也就是我当时做小叮咚机器人的时候有了要把机器人做成一个类似专家系统的想法。
把小叮咚机器人做成专家系统很困难。
对小叮咚机器人来说,中文分词,对自动归类,在加上一个推理机,似乎就可以让小叮咚机器人的IQ提升一个档次了。需要的技术如下:
首先:要让小叮咚机器人理解用户输入的对话;
其次:要对对话进行归类,然后基于自己的知识库进行推理,进而做出反应。
这也就是我开始研究中文分词的一个初衷。中文分词是很多中文计算机自动处理的基础,比如:搜索引擎,自动摘要,等。最近很多网友给我写信询问相关的问题,感觉到这部分真的是一个热点了。
中文分词之后,要做的就是归类。这部分新浪的IASK是个典型的应用,我觉得这个实现并不困难;
最近看到 猜猜20问 ,这个我认为就是一个决策树学习的很好的应用,或许我现在应该考虑也想实现一个类似的应用,为小叮咚机器人的IQ全面提升做准备。
那就从构建决策树开始吧。
相关联接:
多么乐
中文分词
新浪IASK
猜猜20问
本文地址:http://com.8s8s.com/it/it21778.htm