鸭绿江学术资源论坛's Archiver

Custom Search

jack911 发表于 2005-10-25 03:16

【原创】检索教学ppt新手必看

  检索教学ppt新手必看

什么是检索?
first:医学信息检索
一文献检索基础概念
二计算机检索相关知识

1.1 文献的定义
记录有知识的一切载体。
四要素:知识、载体、记录手段、符号等
1.2几个概念及其相互关系
A 信息(information)
信息是指事物运动的状态与方式的反映,是自然界、人类社会和人类思维活动中存在的一切物质的一种属性。

B知识(knowledge)
知识是指人类在改造世界的实践中所获得的认识和经验的总和。

C 情报(information)
情报是指运用一定的形式,传递给用户,并产生效益的知识或消息。
三个属性:知识性、传递性、效益性。
1.3文献分类(按内容性质分)
1.一次文献(Primary Literature)

2.二次文献(Secondary Literature)
即检索工具。
3.三次文献(Tertiary Literature)
是指在利用二次文献的基础上,对一次文献的内容经阅读研究,浓缩提炼而编写成的文献。

1.4 文献检索(Literature Retrieval)
是根据课题的要求,采用科学的方法,利用专门的检索工具,如书刊或数据库,从大量的文献资料中找到所需文献的过程。 包括,书目检索、题录或索引检索、文摘检索
全文检索。
1.5 检索原理
是指通过一定的方法和手段,使信息存储与检索两个过程所采用的特征和标识达到一致,以便有效地获取和利用文献。

存储过程--对文献进行标引
检索过程--根据需求,确定提问式

1.6 检索语言(检索标识)
I 概念 检索语言是一种在文献存储和检索过程中共同使用的语言。它的用途是描述文献特征,表达情报提问,并使两者能相互沟通。

II 分为规范化语言(受控语言)和非规范化语言(自然语言)。

规范化语言:是指对文献检索用语的概念加以人工控制和规范,把检索语言中各种同义词、多义词、近义词、同形异义词等进行规范化处理,使每个检索词只能表达一个概念。
例:《IM》的Subject headings;

非规范化语言:它对检索用语中的各种同义词、多义词、近义词、同形异义词等不加处理,所以也叫自然语言,如关键词。
例:《CA》Keywords

1.7检索工具(Retrieval Device)
定义:是指用于报道、存储和查找文献的工具。它具有存储(编制过程)和检索(查找过程)两大职能。
检索工具按著录形式可分为:
目录、索引、文摘、全文

1.8 检索的途径与步骤
1 从文献外表特征

题名途径-Title Index
著者途径-Author Index
号码途径-Number Index

2 从文献内容特征
分类途径-Classified Index
关键词途径-Keyword Index
主题词途径-Subject Index
分类主题途径-Classified subject Index

1.81使用著者途径应注意:

书写格式 姓前(全称)、名后(缩写,即用首字母)
Willian Henry Harrison →Harrison W H

姓前有前缀M’、Mc、Mac,
姓前带冠词De、Della、Des、La、Van、Vanden、Von
有等级制称号的著者,先排Johs W 后排Johs W jr
音译中国人;俄国人;日本人

1.82分类途径
1 概念:根据文献内容在学科分类体系中的位置作为文献信息的检索途径,它的检索标识是分类号,是一种族性检索。

2 我国《中国图书资料分类法》

3 国外《国际十进分类法,UDC》;
《杜威法,DDC》。

1.83关键词途径
1 概念:是按照文献题目或内容中具有实质意义并能表达文献的主要内容、起关键作用的词或词组,从关键词字顺的检索系统中检索的一种途径,它的检索标识为关键词。

2 特点:未经规范的自然语言

1.84主题词途径
概念:通过文献所属学科的主题对文献进行检索,是以主题词为检索标识,它是一种特性检索。

主题词是用来表达文献的主题概念的,经过规范化处理的名词或词组。

如:出生缺陷-畸形
杵状指-骨关节病,继发肥大性
1.85分类主题途径
是分类和主题途径的结合
例:《BA》的目次
(Major Concept Headings)
二 、计算机检索
(一)计算机信息检索基础知识
(二)计算机信息检索的基本技术
(三)计算机检索服务的类型

1 计算机检索的特点
检索速度快:
检索途径多:
更新快:
资源共享:
检索更方便灵活:
检索结果可以直接输出:
2计算机信息检索系统的构成
计算机硬件
软件
数据库
通讯线路
检索终端


3数据库的结构
数据库是指计算机存储设备上存放的相互关联的数据的有序集合,是计算机信息检索的重要组成部分。
记录(record)是数据库的信息单元,每条记录描述了一个原始信息的外部特征和内部特征。
字段(field)是比记录更小的单位,是组成记录的数据项目。

4数据库的类型
①书目数据库(bibliographic database)
②数值数据库(numeric database)
③全文数据库(full text database)
④事实数据库(fact database)
⑤超文本型数据库(hypertext database)

①书目数据库(bibliographic database)
是机读的目录、索引和文摘检索工具,检索结果是文献的线索而非原文。
如许多图书馆提供的基于网络的联机公共检索目录(Web-based Online Public Access Catalogue)、MEDLINE、CBMDisc等。
②数值数据库(numeric database)
主要包含的是数值数据
例如美国国立医学图书馆编制的化学物质毒性数据库RTECS,包含了10万多种化学物质的急慢性毒理实验数据。
③全文数据库(full text database)
存储的是原始文献的全文,有的是印刷版的电子版,有的则是纯电子出版物
例如《中国学术期刊(光盘版)》
④事实数据库(fact database)
存储指南、名录、大事记等参考工具书的信息
例如美国医生数据咨询库PDQ(Physician Data Query)。
⑤超文本型数据库(hypertext database)
存储声音、图象和文字等多种信息
例如:美国的蛋白质结构数据库PDB,该数据库可以检索和观看蛋白质大分子的三维结构。

(二)计算机信息检索的基本技术

(1)布尔逻辑检索
(2)截词检索和通配检索
(3)限定检索
(4)加权检索和聚类检索
(5)原文检索:记录级检索、字段级检索、子字段或自然句级检索、词位置检索
1布尔逻辑检索(Boolean searching)

AND, OR , NOT

A AND B
A OR B
A NOT B

()> NOT >AND >OR

2截词检索(truncation searching) 通配检索(wildcard searching)

截词符(truncation symbol)
通配符(wildcard symbol)
*、?、#、$等。
3限定检索(limit searching)

限制符多为in、=、[]
Chinese in LA
LA=Chinese
Chinese【la】

4加权检索
概念:是某些检索系统中提供的一种定量检索技术,判定检索词或字符串在满足检索逻辑后对文献命中与否的影响程度
例如:CBM, MEDLINE
5聚类检索
在对文献进行自动标引的基础上,构造文献的形式化表示——文献向量,然后通过一定的聚类方法,计算出文献与文献之间的相似度,并把相似度较高的文献集中在一起,形成一个个的文献类的检索技术。
例如:CNKI “related article”
6原文检索(全文检索)
原文是指数据库中的原始记录.
原文检索即以原始记录中的检索词与检索词间特定位置关系为对象的运算。
7扩展检索与缩检
①扩展检索
扩展检索的方法:概念的扩大;范围的扩大;增加同义词;年代的扩大。

②缩小检索, 又称二次检索
缩检方法:即概念的缩小、范围的限定、年代的减少等。此外,还可以通过以下方法进行限定: 核心概念的限定;语种的限定;特定期刊的限定。


8运算符
记录级检索,要求检索词出现在同一记录中;

字段级检索,要求检索词出现在同一字段中;

2. 子字段或自然句级检索,要求检索词出现在同一子字段或同一自然句中;

3. 词位置检索,要求检索词之间的相互位置满足某些条件
(三)计算机检索服务的类型
联机信息检索服务
光盘信息检索服务
网络信息检索
光盘信息检索服务具有以下特点:
存储容量大,占据空间小
读取速度快
费用低
对硬件有一定要求
3.1卫生系统常用的光盘数据库
①MEDLINE
②中国生物医学文献数据库(CBMDisc)
③中文生物医学期刊数据库(CMCC)
④中国学术期刊光盘版(CAJ-CD)
⑤EMBASE
⑥IPA(国际药学文摘数据库)
⑦ProQuest Medical Library
3.2网络信息检索服务
网络信息检索服务是利用络检索网络资源的信息检索服务

(四)计算机网络信息检索效果评价
2.4.1评价的目的、范围
2.4.2评价标准 :质量、费用和时间
2.4.3影响检索效果的因素


2.4.2查全率
查全率是指系统在进行某一检索时,检出的相关文献量与系统文献库中相关文献总量的比率,它反映该系统文献库中实有的相关文献量在多大程度上被检索出来。
查全率 = [ 检出相关文献量 / 文献库内相关文献总量 ] × 100%

2.4.2查准率
查准率是指系统在进行某一检索时,检出的相关文献量与检出文献总量的比率,它反映每次从该系统文献库中实际检出的全部文献中有多少是相关的。
查准率 = [ 检出相关文献量 / 检出文献总量 ] × 100%

2.4.3影响检索效果的因素
(1)影响查全率的因素

(2)影响查准率的因素

检索教学ppt新手必看

页: [1]

Powered by Discuz! Archiver 6.1.0  © 2001-2007 Comsenz Inc.