导航菜单
首页 >  整个考研流程和信息检索是什么  > 信息组织与检索【知识点整理】

信息组织与检索【知识点整理】

目录

1 简单的定义

(一)广义的信息检索(信息组织+信息检索)

(二)狭义的信息检索

2 信息检索技术与方法

(一)文本信息检索

(二)多媒体信息检索

3 信息检索系统结构和功能模块

(一)信息检索系统基本结构

(二)信息组织各功能模块

(三)信息检索各功能模块

(四)知识组织工具(作用)

(五)信息检索系统结构实例分析

4 信息采集(没有具体程序噢~)

5 信息描述(重点)

(一)理解信息描述

(二)传统文献信息描述

(三)数字化信息描述

(四)信息描述需要注意的问题

6 信息标引(重点)

(一)信息标引的目的

(二)信息标引的方法

(三)信息标引和信息检索结果

7 信息存储(重点)

(一)理解资源库

(二)理解索引

(三)倒排索引及构建

1 简单的定义

基本概念:数据、信息、知识、智慧、信息检索、信息生命周期

(一)广义的信息检索(信息组织+信息检索)

定义:利用一定的科学规则和方法,通过对信息外在特征和内容特征的分析、选择、描述、标引、存储、排序和重组等活动,实现无序信息流向有序信息流的转换,从而保证用户对信息的有效获取和利用及信息的有效流通和组合

信息组织主要包括对某范围内的信息选择的基础上对信息的内外特征进行描述、标引、存储并使其有序化,形成信息集合

(二)狭义的信息检索

定义:借助一定的设备与工具,采用一系列方法与策略从信息集合中查询所需的信息的过程

发展历程 图书目录和文摘、索引(手工检索)以印刷型文献为主要检索对象以各类文摘、题录和目录型工具书为可利用的主要检索工具以图书馆的参考咨询部门作为开展信息检索服务的中心机构计算机化检索【脱机批处理——联机实时检索——联机网络化与多元化检索】以各类机读数据库为检索对象各类信息中心、联机服务中心作为信息服务部门信息检索用户逐渐由专业检索人员向个人终端用户转移和扩散网络化检索以WWW为核心的网络应用上的各种资源做检索对象,包括各种网页、FTP资源、用户组资源、联机数据库等和各种通过网络提供服务的数据库等以搜索引擎为主要检索工具信息用户多为终端用户人工智能得到应用,自动化程度、智能性大大提高(如自然语言理解、语义检索、推理等) 2 信息检索技术与方法 (一)文本信息检索

常用检索技术:布尔检索、加权检索、截词检索、限制检索、位置检索和聚类检索等

布尔检索 算符含义

逻辑或OR:A OR B

逻辑与AND:A AND B

逻辑非NOT:A NOT B

逻辑异或XOR:A XOR B //检索结果是含有检索词A但不含有检索词B的文献或者是包含检索词B但不含有检索词A的文献

优先级同级运算自左向右AND和NOT先执行,OR后执行检索式中如果包括其他检索技术的算符,布尔运算最后执行 加权检索 加权检索的定义和示例加权检索是对布尔逻辑检索的一种扩充加权在标引及检索阶段都可使用

           示例:Q=知识管理(4)and竞争情报(2)and企业文化(1)

加权检索优缺点优点:明确了各检索词在检索中的重要程度;可以通过提高和降低阈值来扩大和缩小检索范围;检索结果易于顺序排缺点:提问表达式烦琐,权值确定比较困难 截词检索 检索者将检索词汇在他认为合适的地方截断,并使用该截断词进行检索匹配截词检索有多种类型

           按照截断位置分:后截断(主要方式)、前截断和中截断

           按照截断的字符数量分:有限截断和无限截断

限制检索

方式:字段检索、二次检索、其他方式的限制

位置检索(区别于字段检索)

针对自然语言文本中检索词之间的特定位置关系而进行的检索匹配

主要方式:邻接检索、同句检索、同字段检索、同记录检索

聚类检索

聚类检索起源于向量空间模型

针对系统中的全部文献向量,使用一定的相似性(或相异性)度量指标和聚类方法,计算出文献与文献之间的相似度,将相似度较高的文献聚集在一起,形成文献类目,进而形成文献的聚类文档聚类检索针对聚类文档进行

其他文本辅助检索技术

      信息的浏览时检索与

相关推荐: