·搜索引擎Nutch介绍(1)-简介

类别:Java 点击:0 评论:0 推荐:

简介

Nutch 是一个刚刚诞生开放源代码(open-source)的web搜索引擎.

尽管Web搜索是漫游Internet的基本要求, 但是现有web搜索引擎的数目却在下降. 并且这很有可能进一步演变成为一个公司垄断了几乎所有的web搜索为其谋取商业利益.这显然不利于广大Internet用户.

Nutch为我们提供了这样一个不同的选择. 相对于那些商用的搜索引擎, Nutch作为开放源代码搜索引擎将会更加透明, 从而更值得大家信赖. 现在所有主要的搜索引擎都采用私有的排序算法, 而不会解释为什么一个网页会排在一个特定的位置. 除此之外, 有的搜索引擎依照网站所付的费用, 而不是根据它们本身的价值进行排序. 与它们不同, Nucth没有什么需要隐瞒, 也没有动机去扭曲搜索的结果. Nutch将尽自己最大的努力为用户提供最好的搜索结果.

Nutch 致力于让每个人能很容易, 同时花费很少就可以配置世界一流的Web搜索引擎. 为了完成这一宏伟的目标, Nutch必须能够做到:

每个月取几十亿网页 为这些网页维护一个索引 对索引文件进行每秒上千次的搜索 提供高质量的搜索结果 以最小的成本运作

这是一个巨大的挑战. 如果你相信它的价值, 请伸出你的援手. 你可以参与开发, 或是提供捐赠.

Nutch的应用

Creative Commons Search engine是一个由Nutch技术制作的搜索引擎,用以来搜索符合CC协议的网络资源,包括文档,图片,音频,视频或是交互式内容都可以被搜索到。每一条搜索结果后面都会显示该链接所遵从的不同CC协议版本,也可以根据需要来搜索符合特定协议版本的内容。

本文地址:http://com.8s8s.com/it/it12257.htm