医学论坛|医药招商|药学论坛 - 鸭绿江医药论坛's Archiver

武科大人 发表于 2008-4-24 00:50

中文期刊全文数据库的对比分析

中文期刊全文数据库的对比分析
   
    目前国内3个规模巨大、利用率较高的综合性中文电子期刊全文数据库为:重庆维普资讯公司的《中文科技期刊全文数据库》、清华同方的《中国期刊网全文数据库》和北京万方数据公司的《中国数字化期刊群》。由于各数据库的检索界面均提供了“帮助系统”或“操作指南”,其相关内容这里就不再赘述。
   
    1.中文科技期刊全文数据库
   
    维普资讯公司的中文科技期刊数据库(以下简称维普库)是国家科委计算机文献检索系统"八五"重点项目。它于1989年建库,1990年1月正式发行,1999年底发展成为全文数据库,现累积文献量1865万篇。
   
    在其检索界面,将逻辑算符“+”、“*”、“-”构造的检索式一次性输入检索框,就能表达完整的主题内容,例如:“网络*数据库*检索”或者“产品*(品牌+名牌)*(保护+维护+制度+体制+机制)”。这种检索方式非常方便、灵活,可以显著地提高检索效率。
   
    在检索输入框的右侧还提供了"模糊"和"精确"检索方式的可选项,便于进行更灵活的搜索,以实现扩检与缩检的调节。例如,检索字段选择"关键词",然后输入“纳米”一词,在"模糊"检索方式(默认方式)下,将查到该字段中含有“纳米”、“纳米材料”、“纳米复合材料”、“纳米结构”、“纳米颗粒”、“碳纳米管”等标引关键词的文献;而在"精确"检索方式下,则只是命中“纳米”这个关键词。
   
    2.中国期刊网全文数据库
   
    清华同方的中国期刊全文数据库(以下简称清华库)曾被国家科技部列为国家级火炬计划项目,它于1996年建库,现收录1979年至今的文献量达2315万篇。
   
    中国期刊全文数据库的全文检索功能很有特色,它可在文章全文中搜索,能获得较高的查全率,但其命中的文献量较大(相应的筛选量也大),所以应指定检索结果按相关度排序,以保证密切相关的文献排列在前面,也便于鉴别、剔除后面相关度较低的命中记录。
   
    2007年该库也可采用逻辑算符“+”、“*”、“-”实现多重组配的检索,但此时必须认定"模糊"检索方式。
   
    要注意的是,由于清华库中的文献记录字段内容是采用原文照录的方式,不再进行二次加工和补充,而不少期刊文章没有关键词和摘要,因此使得该数据库的部分文献记录缺少关键词和摘要字段内容(现用全文前百余字替代摘要)。实践证明,这2种重要检索字段的残缺,将会明显地影响检索效果。
   
    3.中国数字化期刊群
   
    万方数据——中国数字化期刊群,简称“万方数字化期刊”,是国家“九五”重点科技攻关项目“科技期刊网络服务系统”的一个组成部分, 目前集纳了理、工、农、医、哲学、人文、社会科学、经济管理与教科文艺等8大类100多个类目的近5500余种各学科领域核心期刊,实现全文上网。
   
    从2001年开始,数字化期刊已经囊括我国所有科技统计源期刊和重要社科类核心期刊。现累积文献量为882万篇。
   
    4.对比分析
   
    维普数据库和万方数据库系统均是对主要检索字段抽取单汉字建立索引(检索词典),从而实现了先进的模糊检索功能;清华库的主要检索字段则是以词索引为主,其“模糊匹配”并不是真正意义上的模糊检索。
   
    对有些课题检索,清华库这种索引方式就会影响检索效果。例如,用检索式“爆破*优化*矿”在维普库题名字段很方便就命中了所要的相关文献;而在清华库的篇名字段,即使采用“爆破*优化* (矿+矿山+露天矿+……)”这样的提问式,也只能查到为数不多的文献。
   
    通过分析命中记录得知,在清华库篇名索引中,有关“矿”之类的索引形式为:矿、矿脉、矿柱、矿山、露天矿……。这样,在该字段检索,就需要将含“矿”字样的所有相关词一一选全,才能保证检索效果;这就是对有经验的专业检索人员来说,既是想不到也是做不到的。
   
    “万方数字化期刊”的检索界面只有2个检索框,每一个检索框只能输入一个词,检索功能相对不足(万方“中国学位论文全文数据库”也是如此)。万方库所谓的全文检索, 实际上只是类似于维普库的任意字段检索(除全文以外的所有字段的搜索)。
   
    一般来说,维普库的检索功能较强,索引质量较好,使用方便灵活,是收录文献较全(特别是自然科学方面)、回溯年限较长的综合性全文数据库。
   
    清华库有的功能尚待改进、提高,但该库的检索入口较多,其全文检索功能较有特点,但不宜频繁使用(主要是检索“噪音”高、文献筛选量大),一般是在其它检索途经命中量太少的情况下采用,此时便可明显地提高查全率。清华库也是收录文献量较大的综合性全文数据库,并在若干社会科学类目的文献收藏量上占优势。
   
    “万方数字化期刊”与前两个数据库相比,在文献的收录量和检索功能的多样性方面还存在着一定差距。
   
    总之,维普库、清华库和万方库收录的文献不尽相同,并各有特点,人们在选用时应注意互为补充。
   
    (本文摘编自:“中文期刊全文数据库检索方法与技巧”,《大学图书情报学刊》,2004(2)。[url]http://www.lib.wust.edu.cn/jiansuo/redetail.aspx?id=20[/url])

页: [1]

Powered by Discuz! Archiver 6.1.0  © 2001-2007 Comsenz Inc.