just-in-time information retrieval

类别:编程语言 点击:0 评论:0 推荐:

Just-In-Time Information Retrieval (JITIR) 代理 是一个根据用户当前上下文信息,主动检索并为用户提供与用户当前工作上下文相关的信息,不需要用户做出明确的指示。可以看成是一个不需要提供查询的搜索引擎。

上下文相关环境可能是人在计算机上的当前工作环境,例如email,webpage以及document等,或者是人所处在的自然环境,通过照相机,麦克风,GPS等传感器获得,并传递给计算机。

当JITIR获得与用户上下文相关的信息后,尽可能的以一种不分散用户注意力的形式提供给用户,但是这些信息还是可访问的。在用户的当前的上下文环境变化后,JITIR提供的信息也会随之变化。

JITIR的三个重要特征:主动性、信息提供方式的非强制性以及可访问性以及提供的信息始终与用户的当前上下文相关。

主动性:人们从搜索引擎,例如yahoo!,获得信息之前,头脑中会有一些查询的想法,并且有一些关键字。但是,JITIR更加具有主动性,并不需要用户有查询的想法,甚至不需要知道他所处工作环境的相关信息。另外,用户通过搜索引擎的查询获得的信息受限于用户对当前工作环境的感知。

非强制但可访问行: 当一个电话响起的时候,它提供了一个信息,有人打电话找你,甚至从来电音乐中可以知道打电话人的身份,但是它强行进入到我们的生活:不管我们当前的工作有多么重要,不能被打扰,它都分散了我们的注意力。如果电话被关了,所有的来电都转发到留言箱。这样一个无声的电话是不可能影响我们的工作的,但是它的可访问性又大大的降低了。JITIR的信息提供方式在这两个极端之间。桌面警报系统是一个类似的例子。JITIR以一种尽量不分散用户的注意力的方式为用户提供信息,甚至能够被忽视,但是如果有用户需要的信息,它还是可以被用户访问的。不管提供的信息是有用还是没有用,都是由用户决定是否浏览它。

上下文相关性:公告系统,例如新闻服务,报警信号,都具有主动性,但是这些信息都是与用户上下文无关的。例如:一个警告可能响起,当收到一封邮件或股价降低或有与用户兴趣、利益有关的新闻出现时。这些公告系统提供的信息都要吸引用户的注意力,把用户从当前的工作中拉出来。这一类的系统是从不断变化的信息源中提供新的信息给用户。而JITIR是根据用户不断变化的上下文环境,从一定的信息源中提供信息给用户。并不影响用的当前工作,而且提供更多的与用户工作相关的有用的信息。

自动帮助系统,像Microsoft Office Assistant,符合JITIR的定义。但是自动帮助系统是限定于特定领域的,它们仅仅提供特定领域的帮助信息从特定的数据库中。

Remembrance Agent (RA),是一个在Emacs上运行的JITIR,是为适应用户当前工作而特定设计的。它不断的在Emacs窗口的底部显示与当前正在被读或写的文档有关的内容的一个列表,并根据内容的相关度排列。当用户键入了新的内容,或翻页,或其它的方式改变了当前的环境,这个列表也会随之改变。

大致工作过程如下:

首先,用户在Emacs环境中工作,读email或webpage等,或写论文之类。RA会根据用户当前的工作内容从某一数据库中提取一部分与当前内容最相关的内容列表在Emacs窗口的最底部显示给用户。5秒钟之后而且用户的当前工作内容发生了变化,则RA更新提供的信息列表。如果某一时刻,用户看了RA提供的信息,如果并不对这些信息感兴趣,则直接返回当前的工作。如果对RA提供的信息发生了兴趣,并对它作了相应的操作,则RA会根据用户的操作为用户提供更加详细的、符合用户兴趣的信息。如果用户在某一条感兴趣的信息上单击右键,RA就会这条信息上方弹出一个小窗口,并显示这条信息与当前工作内容相关的关键字。如果用户想看某一条信息的全文,他可以在键盘上用组合键Ctrl和这条信息的编号(阿拉伯数字,用#代替)或直接在这条信息编号上单击。相关信息的全文会替代当前工作内容在Emacs上显示。RA并不会对自己提供的信息进行对自己的递归调用。用户还可以对RA提供的信息进行评价,有1到5五个等级,这些评级会记入一个日志文件,便于RA提供信息的精准度。如果用户想要自己查询,可以通过在提供信息的上单击或选中这条信息并键入组合键Ctrl和q,则会查询与这条信息相关的信息,或者键入Ctrl和f并输入你想要查询的关键字。更换数据库可以用组合键Ctrl+d。

 

 

Margin Notes,是一个基于Web的代理,当一个网页载入浏览器时,它自动为这个网页加上注解。

Jimminy,也叫做可穿戴的RA。它是根据用户的自然环境来为用户提供信息的:用户在哪儿,他在和随说话,现在的时间等。它通过一个附加在可穿戴的计算机上的安装在头上的显示装置将信息提供给用户。

以上三个JITIR都有一个同样的信息检索系统作为后台,Savant。他包含一个文档索引器和一个检索引擎。文档索引器利用一个模板结构根据文件类型去索引文档。例如:它能够识别存档邮件文件,并根据来源、主题、日期和邮件正文索引个人的邮件文档。检索引擎从用户当前工作环境接收到分析得来的文本(正在读或写的email,或正在读的网页等),并返回一个可能对当前环境最有作用的文档列表。

Savant包含两个程序:ra-retrieve根据查询运行信息检索,ra-index制作索引以便检索能够更快的运行。

模板匹配:识别文档或查询类型,分词,索引。

数据融合:

过滤
continue……

本文地址:http://com.8s8s.com/it/it24700.htm