检索语言主要描述文献的内容特征是什么?
【检索语言及其作用】 1、检索语言的概念
检索语言是应文献信息的加工、存储和检索的共同需要而编制的专门语言,是表达一系列概括文献信息内容和检索课题内容的概念及其相互关系的一种概念标识系统。简言之,检索语言是用来描述信息源特征和进行检索的人工语言,可分为规范化语言和非规范化语言(自然语言)两类。
2、检索语言的作用
检索语言在信息检索中起着极其重要的作用,它是沟通信息存储与信息检索两个过程的桥梁。在信息存储过程中,用它来描述信息的内容和外部特征,从而形成检索标识;在检索过程中,用它来描述检索提问,从而形成提问标识;当提问标识与检索标识完全匹配或部分匹配时,结果即为命中文献。
检索语言的主要作用如下: ①标引文献信息内容及其外表特征,保证不同标引人员表征文献的一致性; ②对内容相同及相关的文献信息加以集中或揭示其相关性; ③使文献信息的存储集中化、系统化、组织化,便于检索者按照一定的排列次序进行有序化检索; ④便于将标引用语和检索用语进行相符性比较,保证不同检索人员表述相同文献内容的一致性,以及检索人员与标引人员对相同文献内容表述的一致性;⑤保证检索者按不同需要检索文献时,都能获得最高查全率和查准率。
【检索语言的类型】
目前,世界上的信息检索语言有几千种,依其划分方法的不同,其类型也不一样。下面叙述两种常用的检索语言划分方法及其类型。
(一)按照标识的性质与原理划分
1、分类语言
分类语言是指以数字、字母或字母与数字结合作为基本字符,采用字符直接连接并以圆点(或其他符号)作为分隔符的书写法,以基本类目作为基本词汇,以类目的从属关系来表达复杂概念的一类检索语言。
以知识属性来描述和表达信息内容的信息处理方法称为分类法。著名的分类法有《国际十进分类法》、《美国国会图书馆图书分类法》、《国际专利分类表》、《中国图书馆图书分类法》等。
2、主题语言
主题语言是指以自然语言的字符为字符,以名词术语为基本词汇,用一组名词术语作为检索标识的一类检索语言。以主题语言来描述和表达信息内容的信息处理方法称为主题法。主题语言又可分为标题词、元词、叙词、关键词。
(1)标题词
标题词是指从自然语言中选取并经过规范化处理,表示事物概念的词、词组或短语。标题词是主题语言系统中最早的一种类型,它通过主标题词和副标题词固定组配来构成检索标识,只能选用“定型”标题词进行标引和检索,反映文献主题概念必然受到限制,不适应时代发展的需要,目前已较少使用。
(2)元词
元词又称单元词,是指能够用以描述信息所论及主题的最小、最基本的词汇单位。经过规范化的能表达信息主题的元词集合构成元词语言。元词法是通过若干单元词的组配来表达复杂的主题概念的方法。元词语言多用于机械检索,适于用简单的标识和检索手段(如穿孔卡片等)来标识信息。
(3)叙词
叙词是指以概念为基础、经过规范化和优选处理的、具有组配功能并能显示词间语义关系的动态性的词或词组。一般来讲,选做的叙词具有概念性、描述性、组配性。经过规范化处理后,还具有语义的关联性、动态性、直观性。叙词法综合了多种信息检索语言的原理和方法,具有多种优越性,适用于计算机和手工检索系统,是目前应用较广的一种语言。CA、EI等著名检索工具都采用了叙词法进行编排。
(4)关键词
关键词是指出现在文献标题、文摘、正文中,对表征文献主题内容具有实质意义的语词,对揭示和描述文献主题内容是重要的、关键性的语词。关键词法主要用于计算机信息加工抽词编制索引,因而称这种索引为关键词索引。在检索中文医学文献中使用频率较高的《CMCC》数据库就是采用关键词索引方法建立的。
3、代码语言
代码语言是指对事物的某方面特征,用某种代码系统来表示和排列事物概念,从而提供检索的检索语言。例如,根据化合物的分子式这种代码语言,可以构成分子式索引系统,允许用户从分子式出发,检索相应的化合物及其相关的文献信息。
(二)按照表达文献的特征划分
1、表达文献外部特征的检索语言
表达文献外部特征的检索语言主要是指文献的篇名(题目)、作者姓名、出版者、报告号、专利号等。将不同的文献按照篇名、作者名称的字序进行排列,或者按照报告号、专利号的数序进行排列,所形成的以篇名、作者及号码的检索途径来满足用户需求的检索语言。
描述文献外表特征的检索语言可简要概述为:
2、表达文献内容特征的检索语言
表达文献内容特征的检索语言主要是指所论述的主题、观点、见解和结论等。
描述文献内容特征的检索语言可简要概述为:
什么叫主题词,我需要一个比较权威的解释。
一、什么叫主题词、主题词表和检索语言
(一)主题词。主题词也称叙词,是一些以概念为基础的,规范化的,具有组配性能,并可显示词间语义关系的词和词组。
主题词分正式主题词和非正式主题词。
正式主题词用来标引和检索文献,非正式主题词是查找正式主题词的引导词。
(二)主题词表。主题词表也称叙词表,是指由自然语言中优选出来的语义相关、族性相关的名词术语按字顺排列所组成的一种规范化的动态词典。
(三)《公文主题词表》。《公文主题词表》是用于公文主题标引与检索的主题词表。它是适应机关办公自动化,尤其是计算机数据处理的需要,为党政机关公文主题标引与检索而编制的一部术语控制工具。
(四)检索语言。检索语言是根据人们检索工作的需要而创造的一种人工语言,它是存储、查找文献的共同依据,也叫标引语言。
检索语言又分为分类语言和主题语言。
分类语言的概念。是指以阿拉伯数字或以拉丁字母和数字混合作为类目标识符号,以基本类目作为词汇,以类目的从属关系表达复杂概念的一类检索语言。
主题语言的概念。是以直接论述的事物、对象为依据,以自然语言为基本词汇,以概念之间的逻辑关系作为构词法的一类检索语言。
二、为什么要标引公文主题词
(一)标引公文主题词有利于建立先进的公文检索体系,辅助领导同志决策。
信息量的增加,数据量的增大,单纯的分类检索方法难以满足人们对多主题文件查找的要求。
主题检索方法弥补了分类检索方法的不足,检索更自由,查找跨度更大。
(二)标引公文主题词是建立机关办公自动化检索系统的前提条件。
办公自动化系统通过文件上标注的主题词将文件纳入检索系统。
办文人员在办公自动化系统上通过主题词来查找有关主题的文件。
(三)标引主题词是实现公文管理现代化的基础。
档案工作人员可以根据公文主题词编制档案、文件主题索引或主题目录、专题目录等手工检索工具。
办文人员可直接利用根据公文主题词而建立的档案编目计算机检索系统查找文件。
(四)对提高秘书工作人员业务素质有重要作用。
三、《公文主题词表》的体系结构
《公文主题词表》由范畴表、字顺表、附表三大部分组成。
1、范畴表。范畴表又称分类表,它根据公文的主要内容和职能部门的分工划分若干范畴,将字顺表中所列款目词按词义归入有关类目,满足按类查词和按族性检索的要求。
范畴表设两级类目,一级类目19个,用一个汉语拼音字母标识。二级类目70个,用两个拼音字母标识。
2、字顺表。字顺表由正式主题词与非正式主题词款目(词单元)、款目词的汉语拼音、范畴号和词的参照关系四部分组成,个别词还有注释。
例如,第121页:
财政政策
款目词汉语拼音→cai zheng zheng ce
①汉语拼音。注上汉语拼音主要是便于按音排序和按音查词。
②款目词。款目词单元按汉语拼音字顺规定的同音同调同形排列,起排列和查找作用。
③范畴号。范畴号即每个款目词所属的分类范畴编号。这是字顺表与范畴表联系的渠道,通过范畴号可以在范畴表中查找与该主题词同属一个类别的相关主题词。
④参照关系。参照关系有等同关系、属分关系和相关关系三种。
等同关系指两个以上概念相同或相近的主题词之间的关系,也叫用代关系,用“Y”表示正式主题词,用“D”表示非正式主题词;
属分关系指概念上具有隶属关系的主题词之间的关系。不同隶属关系主题词分别用 “F”、 “S”、 “.”、“..”和“Z”表示。“F”是下位词指引符,该词之后的主题词为下位词,用“.”、“..”表示,黑点多少表示词的等级,黑点越多表示该词越专指;“S”是上位词指引符;“Z”是族首词指引符,同时带有“*”号。
相关关系指主题词之间具有的交叉、对立、矛盾、对应等相互参照的关系,用C表示。
3、附表。附表有三个,内容为:组织机构名称表;中国地区名称表;世界各国和地区名称表。附表中的主题词与字顺表中的主题词具有同等效力。
四、怎样标引公文主题词
(一)公文主题分析。
1、审读文件,了解主题。审读文件的重点。
2、分析主题类型,确定主题概念。
主题类型分为单主题和多主题两种。
单主题是指一份公文所研究和论述的只有一个对象或问题。多主题是指一份公文所研究和论述的主题对象不只一个,而是两个或者更多,而且都是并列的独立主题。
3、分析主题结构,确定主题因素。主题因素分为主体因素、通用因素、位置因素、时间因素和文献类型因素五部分。
主体因素是指公文论述的主题中的关键性概念,它是公文主题的主要成分,其他主题因素都附属于这个主体因素;通用因素是构成主题的一些通用概念,它说明主体因素的动态和趋势。通用概念没有专指性也没有独立检索价值,不宜单独使用;位置因素是表明主体因素所处的位置和范围,文件规定适用的地区、位置和对象。位置因素包括国家名称、地区名称和组织机构名称; 时间因素是从时间上对主体因素进行限定,把主题对象放在特定的时间范围之内。时间因素包括年代、时代、朝代、期限等;文献类型因素包括文献种类、公文文种、文件名称编号等。
(二)查表选词,转换主题概念。
通过查找主题词表进行主题概念转换时,必须采用词表上规范化的主题词。转换主题概念主要有两种形式:一是直接转换。二是间接转换。
(三)主题词组配标引。
组配,就是用两个或两个以上主题词构成逻辑关系组合以表达一个专指概念的一种方式。它以词间语法关系和逻辑关系为基础,只有相容关系的概念词才可以组配,而且,不是字面上的组配,决定的因素是逻辑关系。组配标引有概念交叉组配、概念限定组配、上位词或下位词组配。应优先考虑交叉组配和限定组配。
交叉组配是指两个组配的概念之间具有交叉关系,两个概念的外延有一部分重合。
限定组配是以概念的限定为基础,由属概念过渡到种概念的组配。
(四)直接上位词标引和靠词标引。
上位词标引要求两个概念之间具有属分关系。靠词标引要求两个概念必须是同一范畴、同一属性。无论是直接上位词标引或是靠词标引,都不能越级标引。
(五)自由词标引。
自由词标引是用未经规范化处理的自然语言表述公文主题概念,并作为表达公文主题概念的检索标识。
自由词标引范围:一是某些主题概念虽然可以采用组配标引或上位词标引,但使用频率较高;二是新出现的主题概念,包括新科技、新政策、新理论、新名词术语等;三是人物、时间和年代称号;四是地区、组织机构名称。
自由词标引应遵守的规则:一是应认真地查找词表,确实没有合适的专指的主题词,才进行自由词标引。二是可选用其他词表以及权威性参考书、工具书上的词。三是所选的词必须具有较强的检索功能和组配功能,具有实用性,能检索,能组配。四是应尽可能做到词形简单、概念明确。五是在标出自由词的同时相应标出它的上位主题词(或类别词)。六是在自由词后标上“△”符号,并适时将新词登记在主题词表上。选用《词表》以外的地名(组织机构名)、时间、人名、文献名称等专用名词作自由词标引时,不作"△"标记。
五、标引工作中一些具体问题
(一)主题词的排列。
反映公文整体(概述)内容的主题词在前,反映公文部分(分述)内容的主题词在后。
在单主题公文中,反映中心内容的主题词在前,反映其他方面的主题词在后;在多主题公文中,反映公文整体(概述)内容的主题词在前,反映公文其他内容的各主题词按出现的先后次序排列。
作为自由词标引的地名(组织机构名)、时间、人名等,应置于表现公文内容的主题词后面,置于表现公文形式的主题词前面。同时出现在同一公文中,则按地名(组织机构名)、时间、人名的顺序排列。
(二)文种的标引。
文种作为正式主题词,标在所有主题词的最末位。在转(印)发类型通知中,被转(印)发的公文的文种可不作为主题词标引。但如果被转(印)发的公文属法规性质,其名称为条例、规定、办法等,则应作为主题词标引。
(三)标点符号的标引。
公文主题词一般不应出现标点符号。
在《公文主题词表》中带有标点符号的正式主题词,应予保留。因为这些标点符号有特殊功能,删去后容易引发歧义。
自由词标引时一般不要带标点符号。
CNKI检索文献时,主题代表什么意思
__在中国知网(CNKI)检索文献时,对检索词范围进行限定,有“主题、摘要、篇名、关键词、参考文献、全文”等。
选择“主题”,表示在“题名、关键词、摘要”范围中检索,也就是说在“题名、关键词、摘要”中包含有检索词的文献都被检出。
以你的“内生”,“针茅”作为检索词例子来说,在主题中,即在“题名、关键词、摘要”中检索,同时包含“内生”和“针茅”被检出,共计9条文献。而你分别在“题名”、“关键词”、“摘要”中进行检索,“内生”和“针茅”不一定同时分别在“题名”、“关键词”或“摘要”中,所以有些文献没有被检出,也就是说,检出的文献数可能比在”主题”中检索的少一些,共计8条。其中一篇文献:“醉马草内生真菌共生体对其伴生植物种子萌发的影响”,在篇名中含有“内生”,不含“针茅”,在“关键词”中两个词没有,在“摘要”中只含有“针茅”,没有“内生”,所以没有被检出。这就解释了为什么检索条件设为“主题”时,检索出来的结果比分别用“摘要、篇名、关键词”加起来还多了一个的问题。
选择“参考文献”限定,不仅仅是篇名中检索,至少是在“主题”中检索,有待考证。
CNKI检索文献时,主题代表什么意思
__在中国知网(CNKI)检索文献时,对检索词范围进行限定,有“主题、摘要、篇名、关键词、参考文献、全文”等。 选择“主题”,表示在“题名、关键词、摘要”范围中检索,也就是说在“题名、关键词、摘要”中包含有检索词的文献都被检出。 以你的“内生”,“针茅”作为检索词例子来说,在主题中,即在“题名、关键词、摘要”中检索,同时包含“内生”和“针茅”被检出,共计9条文献。而你分别在“题名”、“关键词”、“摘要”中进行检索,“内生”和“针茅”不一定同时分别在“题名”、“关键词”或“摘要”中,所以有些文献没有被检出,也就是说,检出的文献数可能比在”主题”中检索的少一些,共计8条。其中一篇文献:“醉马草内生真菌共生体对其伴生植物种子萌发的影响”,在篇名中含有“内生”,不含“针茅”,在“关键词”中两个词没有,在“摘要”中只含有“针茅”,没有“内生”,所以没有被检出。这就解释了为什么检索条件设为“主题”时,检索出来的结果比分别用“摘要、篇名、关键词”加起来还多了一个的问题。 选择“参考文献”限定,不仅仅是篇名中检索,至少是在“主题”中检索,有待考证。
文章的中心,主旨和主题有什么区别
1、三者所指的内容不同
主题就是写文章所要表达的东西;主旨就是这篇文章的那条主线,也就是文章的角度;中心就是所围绕的东西,也就是文章的目的,没有主旨的文章就凌乱,没有中心的文章就没有侧重点。
2、三者含义不一样
文章的中心是该文所表达的主要内容(从分析文章的结构、语句、文字可看出来);文章的主题是该文所表达主要内容的抽象化、简练化的题目(从分析文章的题目、主要内容可归纳);文章的主旨是该文的思想、外延、意境、目的(这需要从作者的情况、读者的情况、社会时代的情况全面分析,仅从文章本身分析可能会出错)。
扩展资料:
主旨在写作教学中指作者在说明问题、发表主张或反映社会生活现象时,通过文章或作品的全部内容表达出的基本观点,是文章的叙写、议论目的。在记叙文类中,主旨与主题是相同的概念;在议论等类文章中,写作意图一般称主旨,不称主题。
主旨可以指作者写作的目的,还可以指故事要告诉我们的事情,道理,主旨是文章和作品的灵魂,决定文章和作品的质量高低、价值大小、作用强弱,是文章和作品的统帅。
有些文章,它的题目本身就揭示了中心思想或是中心思想的高度概括。从题目中可以看出文章主要写了什么,反映了什么等问题,通过对这些问题的回答,并把这些回答连接起来,就概括出了中心思想。
所以,“中心”应是文章写作内容的概括,“主旨”则是作者写此篇文章想告诉读者的道理,思想等,或是作者的情感表达。“中心句”就是能概括文章的主要内容的句子,“主旨句”就是能揭示作者的情感,目的的句子。
写邮件是一定要写主题吗 ?什么是主题?
写邮件可以不写主题,也能发送出去的。
邮件主题,就是要告诉收件人的事情的中心思想。比如要向对方公司百投递简历,主题可以是:应聘。如果想告诉对方,他急于知道的一道题的做法,主题可度以是:XX题解法。
拓展资料
无主题邮件的发送
第一步,进入邮箱,输入收件人邮箱号、写好内容,主题栏空白,点击“发送”。
第二步,系统会询问“确定真的不版需要写主题吗?”,点击“确定”,邮件即可发送出去,且不需要主题。
无主题邮件,一般都是收件人、发件人双方心知肚明的东西,对方权根本不需要查看主体,只要打开邮件就能得到想要的东西。
比如利用邮箱给对方传送图片或某些资料等。
参考文献代码[Z]是指什么?
根据GB3469-83《文献类型与文献载体代码》规定,以单字母标识:
M——专著(含古籍中的史、志论著)
C——论文集
N——报纸文章
J——期刊文章
D——学位论文
R——研究报告
S——标准
P——专利
A——专著、论文集中的析出文献
Z——其他未说明的文献类型