在dot Net中开发基于office2003的信息检索服务

类别:.NET开发 点击:0 评论:0 推荐:

         Office2003添加了许多实用而有趣的新功能,使用信息检索服务就是其中的一个,我在上个星期进“博客堂”中闲逛的时候发现开心就好发布了博客堂的全文检索服务,觉得这是一个很不错的功能,因此也下载了office2003sdk,依葫芦画瓢自己开发了一个信息检索服务的范例,特此共享给大家。

         信息检索服务可以让office中的所有工具使用网络上所有的信息检索功能(一种定制的web服务),作为用户,也可以开发或者添加其他的信息检索功能。

 

第一部分:安装和使用信息检索服务:

信息检索服务的截图:(这里我使用的是英文版的截图,与后面的截图稍有不同:p

 

1.   使用信息检索服务的系统要求:

安装了office2003beta版本也可)的各种windows操作系统。

此功能适用于office2003的各个部件,包括在wordexcelaccess等工具中使用,在安装了office2003以后,IE也可以使用这个功能。

2.   安装信息检索服务的步骤:

      以微软中国mvp的博客网站为例,步骤如下:

        打开word2003,点击工具->信息检索,此时word的右边会出现一个停靠栏,点击停靠栏下方的信息检索选项,将出现一个标题为信息检索选项的对话框,点击其左下的添加服务按钮,在地址栏内输入“http://blog.joycode.com/research.asmx”,点击添加按钮,并依次安装完就可以使用博客堂专用的信息检索服务了。

      IE中的位置是主菜单->"查看"->"浏览器栏"->"信息检索".

 

二.开发信息检索服务:

1.开发一般的信息检索服务的系统要求:

         微软office2003

         .NET框架1.0或后续版本;

         .NET框架SDK1.0或后续版本;

         MS VS.NET2002或后续版本;

         IIS5.0或后续版本。

         Office2003信息检索sdk(作为参考).

2.建立web服务:

         VS.NET中建立一个C#web服务应用程序,添加两个服务方法:

                    [WebMethod]
                    public string Registration(string registrationXml)
                    {
                    }
                    [WebMethod]
                    public string Query(string queryXml)
                    {
                    }
                    注意:1)此服务类必须使用urn:Microsoft.Search的命名空间。
                                 2Registration方法和Query方法是必须的,其参数也必须按照上面的格式。

         读取注册请求(Registration方法的参数registrationXml):

注册请求为一个字符串,此字符串为调用信息检索服务的工具(如word)发出,它实际上为一个xml文本,我们可以读取此字符串,也可以装载一个xml模板文件来实现。具体的格式可以参考office2003信息检索服务sdk

 

         写注册响应(Registration方法的返回值)

3种方式可供选择用来写注册响应,一种是使用XmlTextWriterXml处理对象写,第二种是使用StringBuilder对象写响应,第三种是装载一个Xml模板文件并适当的修改它作为注册响应。

简便起见,我使用的是第三种方法:

XmlDocument registrationResponse = new XmlDocument();

//装载模板文件

                            registrationResponse.Load("e:\\test\\2ndResearch\\regResponse.xml");               

                            XmlNamespaceManager nsm=new XmlNamespaceManager(registrationResponse.NameTable);

                            nsm.AddNamespace("ns", "urn:Microsoft.Search.Registration.Response");

                            //返回注册响应

return registrationResponse.InnerXml.ToString();

 

注意:在注册响应中,服务提供者(Provider)必须有唯一的ID,也就是说在返回给客户机的注册响应中服务提供者的ID不能与其他信息检索服务提供者的ID相同,否则此服务将注册失败。

 

         读取检索请求(Query方法中的参数queryXml)。

类似的,检索请求也是一个可格式化为xml的字符串,其中包括了客户端检索工具的检索信息。我们仍然可以利用直接读取和装载模板文档这两种方式进行。

在这里我使用的是直接读取请求这种方法:

XmlDocument myDoc=new XmlDocument();                  

myDoc.Load(queryXml);

在已经格式化的Xml文档myDoc中,有几个节点值得注意,它们是:

QueryId节点,OriginatorId节点,QueryText节点以及Keyword节点的内容。

QueryId节点和OriginatorId节点的内容表示客户机信息检索请求的ID,而QueryText节点和Keyword节点的内容表示需检索的关键字信息。

下面用了一段代码来取出QueryText节点的内容(其他节点的处理方法类似)

XmlNamespaceManager xnm=new XmlNamespaceManager(myDoc.NameTable);

                            xnm.AddNamespace("urn","urn:Microsoft.Search.Query");

string searchWord=myDoc.SelectSingleNode("//urn:QueryText",xnm).InnerText;

 

         写检索响应(Query方法的返回值)

读取了检索请求之后便可以根据其信息写检索结果了,书写检索响应仍然可以按照类似于书写注册响应的三种方法进行,在这里我是混用了几种方法。

先装载模板文档:

XmlDocument queryResponse=new XmlDocument();                                  queryResponse.Load("e:\\test\\2ndResearch\\queryResult.xml");

然后添加一些内容使它变得完整:

在检索响应中将显示在客户机界面上的信息由Range节点的内容决定,因此我对SQL Server中的Northwind数据库作了一个简单的查询,此查询的功能是返回在customer表中客户名包含检索关键字的记录:

private DataSet FindInfo(string searchText)

                            {

                                     SqlConnection conn=new SqlConnection("workstation id=localhost;packet size=4096;user id=sa;data source=localhost;persist security info=False;initial catalog=NorthWind");

                                     SqlDataAdapter da=new SqlDataAdapter("select * from Customers where CompanyName like '%"+searchText+"%'",conn);

                                     DataSet ds=new DataSet();

                                     da.Fill(ds);

                                     return ds;

}

生成检索结果的Xml文档:

public string CreateResult(DataSet ds)

                   {

                            StringWriter resultWriter=new StringWriter();

                            XmlTextWriter xmlCreator=new XmlTextWriter(resultWriter);

                            if(ds.Tables[0].Rows.Count>0)

                            {

                                     for(int i=0;i<ds.Tables[0].Rows.Count;i++)

                                     {

                                               xmlCreator.WriteStartElement("Results");

                                               //中间略去…….

                                               xmlCreator.WriteEndElement();

                                     }

                            }

                            else

                            {

                                     xmlCreator.WriteStartElement("Results");

                                     //中间略去

                                     xmlCreator.WriteEndElement();

                            }

                            return resultWriter.ToString();

}

                            然后将检索结果文档填入到响应文档(queryResponse)中:

                            XmlNamespaceManager nsmResponse=new XmlNamespaceManager(queryResponse.NameTable);

                            nsmResponse.AddNamespace("ns", "urn:Microsoft.Search.Response");                                  queryResponse.SelectSingleNode("//ns:Range",nsmResponse).InnerXml=this.CreateResult(ds);

                            最后返回响应文档:

return queryResponse.InnerXml.ToString();

 

注意:检索响应文档中必须有结果(查不到自己写一个“找不到内容”的结果吧),否则客户机将会报告异常。另外检索响应文档中的检索信息ID必须与检索请求信息的ID一致,否则将显示无法找到结果的错误。

 

3.编译,调试,和生成信息检索服务:

                   在调试环境下,可以顺便使用显示的IE来调试信息检索服务J.

 

4.下面是最终的结果:

        

 

第三部分.小结和参考:

         信息检索是一种强大而有效的功能,此处仅实现了一个极为简单的例子。基于office信息检索sdk的参考,可以实现更复杂的检索服务。

         信息检索服务的xml格式文档在office信息检索sdk中可以方便的找到,用户可以使用sdk作为参考进行开发,其中包括了Helloworld,google等几个例子。

 

注解:1.博客堂:微软中国MVP的博客网站,地址是:http://blog.joycode.com

            2.开心就好:博客堂的版主,微软MVP.

            3.office信息检索sdk(英文版)的下载地址:http://download.microsoft.com/download/0/1/8/018ec82d-a764-

4471-ac0f-6a08cca4cfcc/rssdk.msi

 

本文地址:http://com.8s8s.com/it/it45284.htm