搜索国外免费全文资料的技巧
Google是快速、简便地获取网络外文信息的有效工具,只要善于运用搜索技巧,其检索潜力不可估量。Google搜索引擎([url]http://www.Google.com[/url])界面简洁、使用方便,信息资源丰富、数据内容广泛,它搜集了全球范围内的10亿多张图片、100多亿网页及网页快照。
其功能强大、技术先进、搜索范围广,是当今世界最优秀、最受欢迎、利用率最高的搜索引擎;Google每天完成12亿次以上的网络搜索,约占全球搜索总量的60%。
Google的逻辑检索规则为:
①两个关键词之间有空格,便为“逻辑与”关系:两词同时出现的记录便被命中。
②“逻辑或”功能:其算符用大写的“OR”表示。可用“A OR B”来搜索“包含A , 或包含B,或者同时包含A和B”的网页。
③两个关键词之间用减号(前面空一格)连接,可实现“逻辑非”功能:命中记录中不含减号后的关键词。
该系统不支持(英文搜索引擎常用的)通配符截词检索,以实现精确匹配,提高查准率,这也是它的精明之处。
目前国内专业人员均不善于利用Google来构造包括众多关键词、多概念组面的复杂组配式;为此,下面将通过典型的搜索实例,来讲解外文全文资料的检索策略。
举例:检索有关“镇静钢钙处理”的国外全文资料
1)初选关键词
在外文资料检索中,如何选全和选准相关检索词,这是保证检索效果的关键。
专职信息人员常用的方法为:从相应的检索刊物中选取索引词,从规范专业词表中选取主题词,从专业文献中选取关键词等等。这些方法虽然可行,其实际效果却因人而异,这主要取决于检索者的专业修养、信息素质和实践经验。
笔者依据多年信息咨询的经验,在此另推荐一种简便实用、高效可靠的方法:
首先,借助于一些电子型专业词典(如:新世纪汉英科技大词典、金山词霸、东方大典、灵格斯词典、新编全医药学大词典等。还可参见附录),初步选取各种相关专业词语,然后再利用搜索引擎,将这些词语限定在专业范围内搜索,进行验证,从而确定合适的专业检索词。
由此,本课题借助于多种电子词典选词如下:
镇静钢:killed steel; full killed steel; dead steel; dead-melted steel; piping steel; degasified steel; solid steel; deoxidized steel
钙:calcium;Ca
处理:treat;treated;treatment;treating
2)确定检索词
由于当今专业学科众多,相互间交叉渗透频繁,同一专业术语,常在不同专业使用,但其含义和英文表达形式却不尽相同。
为了保证搜索的准确性,同时提高检索效率,因此决定利用搜索引擎筛选出与本课题相关的专业用词及其各种表达形式。
进入Google的高级搜索界面(参见附件:附图1),在第1个输入框(包含以下全部的字词──表示“逻辑与”)键入“killed steel Calcium”,在第3个输入框(包含至少一个下列字词──表示“逻辑或”)键入“treat treated treatment treating”,然后在“文件格式”处,选择“PDF”格式(大多数英文全文资料都采用此格式),点击“Google搜索”。
其后,系统显示的基本搜索框内出现了完整的检索提问式:killed steel Calcium treat OR treated OR treatment OR treating filetype:pdf(参见附件:附图2)。
同时也列出检索结果,在命中记录中,检索词以醒目的红色显示,这样便于浏览、筛选;在查看中发现,有关“钙处理”的表述,除了有 “calcium treated;calcium treatment;treated with calcium”外,还有“Ca-treated;Ca-treatment;Ca Treated”等字样。
采用同样方式,对各种表示“镇静钢”的词语进行验证,其结果有:killed steel;deoxidized steel;Al-killed low-carbon steels等形式。
3)检索策略
检索策略1:
这里表达主题概念的有多组相关词:“killed OR deoxidized”、“steel OR steels”、“Calcium,Ca”、“treated OR treatment”(同一组相关词间应为“逻辑或”关系);其中包括同义词、近义词及检索词的单复数形式。
而Google高级搜索界面只支持一组相关词间的“逻辑或”运算,为了提高检索效率,减少重复输入量,可参照前面的检索提问式,在基本检索框内直接输入多重逻辑组配式,系统显示的搜索结果如下:
约有115,000项符合killed OR deoxidized steel OR steels Calcium treated OR treatment filetype:pdf的查询结果
共有 57 项符合killed OR deoxidized steel OR steels "Ca treated" OR "Ca treatment" filetype:pdf的查询结果
其中,第1项检索范围宽泛,命中量大,但也只需在前200~300项中筛选相关文献记录就差不多了。因为搜索结果是按相关度排序,对后面众多的相关度较低的文献记录,基本上可以不用多花费心力。
第2项检索式命中量不多,这是由于采用了带引号的短语形式(可避免“Ca”的误组配)搜索,其专指度高,切题文献相对集中,不可忽视。
检索策略2:
为了提高查准率,同时提升检索效率,还可采用下列方式搜索:
约有231项符合killed OR deoxidized steel OR steels "Calcium treatment" OR "Calcium treated" OR "treated with Calcium" OR "Ca treated" OR "Ca treatment" filetype:pdf的查询结果
这里只用了1个检索表达式,去掉了一些重复文献记录,节省了筛选时间,很便捷地搜获了一批相关的全文资料。
另外,还可以考虑将检索式中的文件限定符“filetype:pdf”舍去,这样就可以不受限制地搜索PDF、HTM、DOC、PPT等各种格式的资料,其命中量将会大幅上升;但同时也会出现大量非全文记录,从而增加了筛选工作量。
但要注意的是,对多重逻辑组配表达式,Google没采用通用的检索规则:用括弧将“逻辑或”组配与“逻辑与”分隔,以便区别。这样,容易造成检索者的混淆。另外,在多年的检索中发现,Google的“逻辑或”运算常出现少量漏检错误(参见下列正文),但总的影响不是太大。
附件:附图及附录([url]http://www.lib.wust.edu.cn/jiansuo/redetail.aspx?id=28[/url])
(本文摘编自:“网络信息检索技巧及析疑”,《武汉科技大学学报(社会科学版)》,2008,10(2)。[url]http://www.lib.wust.edu.cn/jiansuo/redetail.aspx?id=28[/url])
[[i] 本帖最后由 武科大人 于 2008-4-25 10:14 编辑 [/i]]
页:
[1]