: 网络信息检索 >> 常用通用搜索引擎  

    Google会忽略最常用的词和字符,这些词和字符称为忽略词。 Google自动忽略“http”,”.com”,和“的”等字符以及数字和单字,这类字词不仅无助于缩小查询范围,而且会大大降低搜索速度
 
   若想查询某一类文件(扩展名相同),可使用“filetype:”。这是个尚在测试阶段的Google特色查询,不过功能已经非常强大。最重要的文档搜索是PDF搜索。PDF是ADOBE公司开发的电子文档格式,现在已经成为互联网的电子化出版标准。目前Google检索的PDF文档大约有2500万左右。PDF文档通常是一些图文并茂的综合性文档,提供的资讯一般比较集中全面。例如,搜索关于电子商务的PDF文档,可采用“ecommerce filetype:pdf”检索式。
   若想要搜索的关键词包含在URL链接中,可用“inurl”。 “inurl”语法返回的网页链接中包含第一个关键词,后面的关键词则出现在链接中或者网页文档中。有很多网站把某一类具有相同属性的资源名称显示在目录名或者网页名称中,比如“MP3”等,于是,就可以用INURL语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具体资料。INURL语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。如:欲查微软网站上关于windows2000的安全课题资料,可采用“inurl:security:windows2000site:Microsoft.com”检索式
   要想搜索的关键词包含在网页标题中,可用“intitle”。“intitle”的用法类似于上面的inurl,只是后者对URL进行查询,而前者对网页的标题栏进行查询。网页设计的一个原则就是要把主页的关键内容用简洁的语言表示在网页标题中。因此,只查询标题栏,通常也可以找到高相关率的专题页面。
   如果想知道有多少人对某一网站做了链接,用“link”语法。如:搜索所有含指向华军软件园www.newhua.com链接的网页。可以采用 “link:www.newhua.com”检索式进行检索。但需要注意, “link”不能与其他语法相混合操作.
   查找与某个页面结构内容相似的页面,可用“related:”。例,搜索所有与中文新浪网主页相似的页面(如网易首页,搜狐首页,中华网首页等),可输入“related:www.sina.com.cn/index.shtml”.
   若想从Google服务器上缓存页面中查询信息,可用“cache:”。搜索Google服务器上某页面的缓存,通常用于查找某些已经被删除的死链接网页,相当于使用普通搜索结果页面中的“网页快照”功能。例如,查找Google缓存的中文yahoo首页,可输入“cache:www.yahoo.com.cn”。

Copyright© 吉林大学远程教育 2004-8