文献搜索
一次有效的搜索离不开“正确”的搜索项。换而言之,所输入的词条,必须确保检索到与相关文献资料。
遗憾的是,英语是一门富于变化的语言。一个单词的多种词性变化往往可以表达一种概念。如果研究人员在论文标题或摘要中使用的是某一种词形,而搜索的是另一种词形,很有可能错过相关的重要论文。
另一方面,在某些数据库中,当用户搜索某一单词时,返回的结果中会包含词形不同而含义相关的单词。
为什么会得到这些结果?怎样才能充分利用搜索界面获得所需的搜索结果?
在搜索词条时,利用截词(trucation)、通配符(wildcard)、词干提取(stemming)和词形还原(lemmatization)这四种方法,可以获得该词条的更多词形变化。截词和通配符是对搜索词条的简单修改。
词干提取和词形还原是数据库平台对搜索项进行的算法式修改,一种内置功能。了解它们的工作原理以及如何利用,确保文献搜索事半功倍。
本期IFIS将教大家如何用截词和通配符的方式对搜索词条进行修改,从而更高效的进行文献搜索。
1.
让搜索变得更加全面的方法-截词
研究人员优化搜索结果的主要方式是使用截词。通配符也很有帮助。使用这些方法时,用户可以键入搜索词条的一部分字母,然后将这些字母与替代符号进行组合,这些替代符号用于替代可能键入的其他字母。
什么是截词?
对搜索项进行截词处理时,可以先输入某单词的开头字母或词干,然后再输入指定符号,如*、$或!。
当截词符加入词干后,数据库会返回两类结果,一类结果完全匹配所输入的字母,另一类结果所含的关键词在字母数量上要多于所输入的字母。举例来说,搜索toxin*时,返回的结果可能包含toxin、toxins、toxinogenesis、toxinogenic、toxinotype、toxinotypes、xinotyping、toxinfective、toxinaemia和toxinometer。
截词搜索是一种有效的搜索扩展方法。
如何选择恰当的截词符?
截词符通常为星号(*)。某些数据库则使用美元标志($)代替,还有少数几个数据库用的是感叹号(!)。所有数据库都会在帮助信息中提供截词指南。
截词符总是紧挨着所输入的字母,字母和符号之间没有空格。
哪些数据库允许对搜索项截词?
截词是一种通用的数据库搜索技巧。如果发现数据库无法截词,用户可以检查所用的截词符能否被数据库识别。
如何选择合适位置对词条截词?
需要输入多少字母来代表所需的搜索词条及变体,同时又不会返回太多不相关的结果?如果用户对此不确定,可以尝试在不同位置对搜索词条进行截词。可以多尝试输入一个比预想的更短的词干,得到足够多的相关结果。如果返回的是大量不相关结果,可以让词干再变长一些。
某些数据库在截词方面限制最短的词干长度。以PubMed为例,用户在截词时,词干的最小长度为四个字母。
能否限制被截词干后所添加的字母数量?
有时可以。在Ovid平台,键入adult$1会返回含adult和adults的结果,而不会返回含adultery或adulteration的结果。键入adult$3会返回含adult、adults和adultery的结果,但不会显示含adulteration的结果。然而,大多数平台并不提供这一选项。
数据库帮助页面会详细说明其截词符的具体功能。
能否对单词的开头部分进行截词?
某些数据库平台允许用户对单词的首尾进行截词。在这些数据库中,输入*toxin*会返回含toxin、toxins、aflatoxin、aflatoxins、ochratoxin、ochratoxins的结果,以及更多含字符串toxin的结果。
2.
通配符是提高效率的必胜法宝
通配符是插入到单词中间部分的符号,[1]能够帮助用户扩展搜索词条的拼写变化。某些数据库使用不同符号来定义其所谓的强制通配符和可选通配符。强制通配符意味着,该符号只能代表一个字母,可以是任何字母;可选通配符指的是,该符号可以代表任何字母或者无字母。举例来说,在Ovid平台上,用户可以用organi#ation同时搜索含英式和美式英语两种拼法的结果(organisation/organization),但需要用favo?rite来搜索含favourite/favorite的结果。
还想知道其他高效搜索文献的方法?
快把这个文献搜索秘籍收藏起来吧!
热文速递
编辑:袁艺;责编:张睿梅