1:查全率(recall rate)是评估检索成效的一项指标又称召回率。在资讯检索系统中系统找出相关资料的笔数与文件库中应有的相关资料总笔数的比值称为查全率。例如:假设在某一次检索需求中相关文件的总篇数应该有50笔而在系统回传的100笔结果中只有20笔相关文件则此次检索的查全率为20/50=0.4或是40%。查全率可以用来了解系统找回所有相关资料的能力或是系统遗漏相关资料的情形。根据上述定义在大多数的情况下查全率都不易获得。针对某次检索需求想知道系统中应有的相关文件总笔数必须将检索系统中所有的文件每一篇都经人工判断过才能得知。检索系统中的文件动辄上万篇甚至上百万篇一篇篇判断下去成本非常惊人。因此在求取系统的查全率时常以便宜措施来近似系统中应该有的相关文件总篇数。最常用的方式是针对同一个查询需求以M种不同的检索技术或系统分别找出前N篇文件取得最多M*N篇文件做相关判断。这种作法的合理性是假设:不被任何检索技术与系统找出来的文件都认为其与该次检索需求不相关因而不用再进行人工判断。与原先的作法相较只判断这M*N篇文件可以大幅降低求取查全率的成本。跟查全率非常相关的概念是查准率其为系统找出相关资料的笔数与系统传回资料笔数的比值。在衡量系统检索成效时查全率与查准率是一起并用的单独检视其中一项指标并无意义。例如假设资料库内有文件10000篇就某一个检索主题其中应有的相关文件有100篇若系统仅查询出1笔资料且此资料是相关的则其查准率为100%但此时系统漏掉了99篇相关文件。同理若系统将资料库里所有的文件都当作查询结果回覆使用者则必然涵盖其中的100篇相关文件因而其查全率为100%但此时系统查出9900篇不相关的资料浪费使用者检视结果的时间。查全率的取得成本虽高因有上述的理由仍是进行严谨的检索成效比较时不可或缺的指标。查全率与查准率一起并用的方式有数种详见查准率辞条。在某些资讯检索的任务中相关文件应有的总笔数可能非常稀少只有一笔、二笔。例如在问答系统(question answering systems)中询问「孙中山卒于何年?」系统传回的回答应该只有公元1925或是1925年是相关的其他皆非。此时系统的查全率很容易出现只有0或是1的极端数值不利于系统的成效比较。因此遂有「相关文件排名倒数平均」或是「平均倒数率」(mean reciprocal rate简称MRR)的指标提出。亦即评估这些系统时不仅以一道或少量题目来评估而是N道题目如N=500、N=1000等。将查询结果中相关文件首次出现的排序名次加以倒数再加总所有题目的这些倒数后取平均值即为MRR指标的数值。