目錄式搜索引擎(網站):雅虎、搜狐、網易全文式搜索引擎(網頁):、百度、天網(FTP)元搜索引擎目錄索引搜索引擎的使用Yahoo!的創建原理以主題為基礎,分類主題目錄是其最大的特點,作為目錄型搜索工具的典范,Yahoo!在主題分類、目錄結構方面具有代表性。它將網絡資源按內容分為14個大類,每個總類下又鏈接多個小類,逐級鏈接,最后與網頁、新聞組等相連接。用戶可以借助高質量的主題分類目錄,選擇自己所需要的主題類目,通過點擊超級鏈接進入各層,從而找到需要的信息。““雅虎中國雅虎中國””((://)提供了一份細蜜、)提供了一份細蜜、層次豐富的中文網站分類目錄。層次豐富的中文網站分類目錄。全文搜索引擎是名副其實的搜索引擎,國外具代表性的有、國內著名的有百度(Baidu)等。它們都是通過從互聯網上提取的各個網站的信息,以網頁文字為主,搜索出與用戶查詢條件相匹配的記錄,然后按一定的排列順序將結果返回給用戶,因此他們是真正的搜索引擎。?萬緯搜索引擎是最有名的中文元搜索引擎。萬緯中文集成搜索引擎包括了5個英文搜索引擎Argos、、、、Yahoo和7個中文搜索引擎如網典、新浪、雅虎(中文)、搜狐、天網、悠游搜索。
用戶可根據需要自由選擇其中最多6個引擎進行同步搜索,搜索結果可按相關度、時間、域名和引擎分類。記得1996年夏季的時候,當我第一次接觸,便被撲面而來的魔力征服了。那種天涯咫尺的感覺,真是妙不可言。在經歷了瘋狂的WWW沖浪和如癡如醉的BBS沉迷之后,我意識到對我影響至深的還是學習方式的變遷。如何來描述這種變遷呢?當社會處于初級階段,,人們靠口傳身授、背誦記憶,尚能從容地進行知識的傳授、吸收和應用。這種學習方式造就了很多“才高八斗,學富五車”的大才子。但是,隨著社會的發展和進步,現在的世界早就不是“四書五經”的年代了,僅靠“皓首窮經,博聞強記”一類的古老的方式已無法有效地吸收所需要的知識信息人們確實非常需要一種在較短的時間內獲得較多、較全、較新的知識或信息的工具。比方說,我們到了大型的圖書館,往往有一種不知所措的感覺。目的明確的去學習,即先知道要學什么,然后有目的的去尋找答案,這種新的方式看上去才更加有效率。我們不妨把這稱為“即學式”,相應的,不過,“即學式”的實施是有前提的。首先,要求學習者擁有一個包羅萬象的信息庫,以供隨時抽取各種目的信息;其次,是需要一個強勁的信息檢索工具,以便高效率的從信息庫中提取信息。
很明顯,可以充當那個海量的信息庫能用的英文搜索引擎,而搜索引擎——則正是尋找光明之火的絕好工具。“公欲善其事,必先利其器”。只有一個,而搜索引擎則有N個。不同的搜索引擎,搜索結果不盡相同。老鳥和菜鳥的區別,往往只是在于會不會利用資源,搜索引擎是很重要的手段。別看很多老鳥好像從來不提問題,而且還能回答新人的問題,好像他們什么都懂似的,其實他們并沒那么厲害,只不過完全可以通過自己的搜索找到答案,所以不需要提問……有搜索高手說,所謂搜索,就是“在正確的地方使用正確的工具和正確的方法尋找正確的內容”。小李正在準備一份介紹海口城市概況和近幾年發展的多媒體材料,打算為國外來的同行作報告用。小李應該怎樣在網上查找呢?在沒有互聯網的時代,面對這樣的一項工作,僅僅資料的收集可能就要花上好多天的時間。但是,您千萬別以為有了網絡,有了網絡資源搜索工具,一切都會迎刃而解,萬事大吉原來,小李自以為很簡單,他在搜索引擎中使用“海口”提問關鍵詞進行了檢索,結果怎樣呢?返回的結果約有條,上百萬呢!小李簡直不敢相信自己的眼睛。他想,再試試“Yahoo”吧。他仍然利用“海口”這一提問關鍵詞在Yahoo!中進行搜索,結果會使他滿意嗎當然不會啦!小李同樣陷入幾千個相關網站和上百萬個網頁的信息沼澤之中。
這時,小李有點不知所措了,他甚至有點懷疑是否選錯了搜索引擎。網絡資源搜索的第一步不是選擇搜索引擎,而是分析提問內容,從提問內容中提取最能表達提問主題的若干個關鍵詞,再將這些提問關鍵詞組合成最適合表達提問內容的提問表達式。內容----關鍵詞---表達式網絡信息檢索小李可能也意識到返回的結果與他想得到的結果之間的巨大差距,他仔細查閱了這些返回的結果,發現其中含有大量的大學院校、醫院等眾多不需要的信息。于是,他利用這兩個搜索引擎提供的布爾邏輯功能進行檢索。在檢索中,檢索提問涉及的概念往往不止一個,而是同一個概念涉及多個同義詞或相關詞,為了準確表達檢索提問,必須使用邏輯算符將不同的檢索詞組配起來。常用布爾檢索。邏輯或檢索式邏輯“或”是并列概念關系的一種組配,通常用運算符為“OR”或“+”表示,能夠擴大檢索結果,運算結果是陰影部分邏輯檢索式A是具有概念交叉關系和限定關系的一種組配。可縮小檢索范圍,提高查咳嗽大學生心理障礙市場經濟誠信(有“市場經濟”同時有“誠信”,運算結果是陰影部分)。表明結果必須同時含有A和B才為命中,指必須出現在同一個記錄中。邏輯檢索式A表達檢索詞間的排除關系。
可縮小檢索范圍,提高查準率,運算結果是陰影部分。例:學生NOT小學生微量元素邏輯“與”(邏輯“乘”),表示為邏輯“或”(邏輯“加”),表示為邏輯“非”(邏輯“減”),表示為均為半角!但是我們可以根據需要用括號改變執行順序。例:政治經濟學于光遠政治經濟學*于光遠表示檢索出來的文獻既含“政治經濟學”同時又含“于光遠”的文獻。于光遠政治經濟學于光遠表示含有“政治經濟學”、“于光遠”“政治經濟學”和“于光遠”均為命中文提示:搜索引擎在收錄內容、檢索功能等方面各有千秋,使用者應仔細閱讀系統幫助文件,根據自己的特定檢索需求合理地選擇搜索引擎。命令式檢索使用特定的操作命令來實施檢索,一般每個系統都有自己特定的指令系統。每個搜索引擎提供的檢索功能和檢索特性是不一樣的,同一種檢索功能在每個搜索引擎中表達方式和使用方法也是不盡相同的。(確切地知曉每一種搜索引擎的檢索功能與特性,無需死記硬背。只要在使用時,查看幫助信息便是了)。檢索語法小李立即在、Yahoo中分別用:海口-大學-醫院海口NOT大學NOT醫院怎么辦呢?檢索語法看來僅僅依靠邏輯“非”功能是遠遠不能達到預期目標的,小李不得不調整檢索關鍵詞。
經過仔細分析,他覺得向國外公司的同行介紹的內容應該為海口的一般性的介紹,使用“海口”和“概況”這兩個關鍵詞也許更切合提問主題。小李立即在中輸入:海口概況結果怎么樣呢?在分析提問內容時,需細化提問內容的主題,提取多個符合提問內容的關鍵詞,這樣,可以獲得較有效的檢索結果。小李第一次搜索失敗 的原因正是在于使用了“海口"這樣一個太寬 泛的提問關鍵詞。 關鍵詞,就是您輸入搜索框中的文字,也就是您命令搜索引擎尋找的東西。 您可以命令搜索引擎尋找任何內容,所 以關鍵詞的內容可以是:人名、網站、新聞、 小說、軟件、游戲、星座、工作、購物、論 而那些對文獻主題無實質意義的詞匯,如冠詞、介詞、連詞、某些副詞以及某些形容詞 均不能做關鍵詞。(禁用詞表) 關鍵詞法一般不編關鍵詞表,而 是相反,編制“非關鍵詞表”或 稱禁用詞,如 我們了解常規搜索方式,但每個人都會搜索出不同結果,為什么?核心問題在于關鍵詞選擇 不同。 在當今互聯網上,你永遠不會愁你找不到東西,而是東西太多,你無法找到你需要的東西,因 此搜索效率便成為最重要的一環,搜索效率直 接關系到搜索的關鍵詞的選擇。
中文分詞 中文搜索引擎,跟英文搜索引擎最大的區別是分詞。因為英文的單詞與單詞之間是天然分隔的,而中文是按句 寫的,字與字之間是沒有間隔的。 例如:跳迪斯科 “迪斯科”誰說牛奶不如果汁好喝 理解了搜索引擎的分詞,了解 了用“眼鏡”很可能搜索不到 “眼鏡蛇”,用“海參”很可 能搜索不到“海參崴”,用 “異性”很可能搜不到“相異 性”,搜索者就可以更有效地 選擇關鍵詞了。 一是注意專業性: 不使用過于通俗簡單的詞語,比如,你想查找有關降雨量方面的信息,雖然它屬于天氣方面 的,但如果你輸入的是“天氣”,就會返回大 量與天氣有關的信息,而結果中充斥大量無關 的信息,但如你直接輸入“降雨量”,就會獲 得比較滿意的結果。 二是具有代表性: 要注意一詞多意的問題,很多詞具有一詞 多意的特性。比如,筆記本,可以指用來手寫 的本子,現在也作為筆記本電腦的簡稱。遇到 這類詞,可能需要在搜索框中輸入盡量減少歧 義的詞語,比如改輸入筆記本電腦。 往往同一件事情或事物,不同作者喜歡用不同的詞來表達,這就造成了龐大的同義詞,如果 偏偏你頭腦中的“同義詞”不是那么全,造成 漏檢就不足為怪了。例: 碳纖維——碳纖維、炭纖維三注意使用“同義詞” 大多數的搜索引擎都是采用相 關度來對檢索結果進行排序的, 最終結果都是與提問關鍵詞相關 程序最大的命中記錄排在前。
所 以,仔細查閱前10-20個記錄, 可以基本滿足需求。 《跨國公司經營管理研究》 社會福利等(2)注意適當控制檢索詞的內涵與外延 《跨國公司經營管理研究》如以跨國公司和經營管理作為檢索詞, 將會漏掉一些文章,因為有些文獻題名對 跨國公司經營管理的表述并沒有“經營管 理”一詞。像 跨國公司的營銷管理、 跨國公司的質量管理、 跨國公司的財務管理、 跨國公司的不動產管理、 跨國公司的流動資產管理等等, 所以“管理”一詞,則可保證最大限度的 查全率。 字段限定檢索技術(field limit) 限定檢索:為了提高檢索的查準率,縮小 檢索的范圍 ,將檢索詞限定在特定的字段 中進行檢索。限定字段通常包括: CC---分類號KW---關鍵詞 邏輯算符的組合使用方法(構造檢索提問式是計算機信息檢索的關鍵) 如檢索題“跨國公司經營管理研究”: 提問式1:(跨國公司+跨國企業+跨國經營) 檢索結果90篇提問式2:(跨國公司+跨國企業+跨國經營)管理 (1997+1996)= 檢索結果35篇 提問式1:(社會保障制度+社會保險制度)(我國 +中國)(PY=1997+PY=1996)= 檢索結果99篇 提問式2:(社會保障制度+社會保險制度+養老保險 +醫療保險+失業保障)(我國+中國) (PY=1997+PY=1996)G=中國=檢索結果160篇 擴展檢索的方法:概念的擴大;范圍的擴大;增加同義詞;年代的擴 經常有網友抱怨搜索引擎實在太爛,什么東西都找不到。
其實并不是搜索引擎有問題,而是你的使用方 法有待商妥。 常見錯誤1——輸入錯別字 當你感覺某種內容網上應該有很多相關內容,但搜索到的確是寥寥無幾的幾個時,這時你就應該看看 是不是輸入的關鍵詞有錯別字了。 如想找“星際爭霸”的相關內容,而你輸入了“星際爭吧”、“星及爭霸”、“星際爭罷”等,還有“劉得 華”、“以德制國”之類的,這樣的關鍵詞就會搜索 不到有用的資料。 濫用多義詞如我們搜索“Java”,搜索引擎 是不能象我們一樣理解多義詞的,搜索到的結果既是 太平洋上的一個島、又是一種著名的咖啡、還是一種 計算機語言,這樣得到的搜索結果就很雜亂。如果我 們用多個關鍵詞或其他詞語代替多義詞作為搜索關鍵 “爪哇印尼” “爪哇 咖啡” “Java 語言”分別來搜索我們不同 的需要,這樣就會得到比較滿意的結果。 如我們輸入“廣州到北京的列車時間表”、“廣州日報在廣州的發行情況”、“劉德華今年多大 了”等,使用這些關鍵字就好比你把搜索引擎當 成了一個服務員問話一樣,搜索引擎只是機械, 它只會把含有這個關鍵詞的網頁找出來,根本不 管你網頁上的內容是什么。 “廣州北京 列車 時刻表”、 “廣州日報發行” 一般的搜索引擎對動態內容,如:論壇和數據庫內容的網頁檢索能力較弱能用的英文搜索引擎,所以這類信息也不適合用 一般的搜索引擎搜索,而是應該去專用網站尋找。
搜索引擎并不是萬能的,有時候我們需要查找的資料找不到原因是:搜索引擎從抓取網頁、解析、索 引到提供檢索是有一定周期的,信息滯后的周期從 一周到一月不等。如每四年一次奧運會,大家最關 心的是隨時知道中國獲得了幾塊金牌,這時專業的 新聞網站才是你的正確選擇。 檢索策略的優化:細化 主題細化,或者用主題詞表、索引詞表選擇更專指的主題詞或關鍵詞 從年代和地理及語言、文獻類型上限制竅門1 竅門1 檢索策略的優化:擴展 對已確定的檢索詞進行其同義詞、同義的相關詞、縮寫和全稱檢索,保證文獻的檢全率,防 止漏檢 利用系統的助檢手段和功能,有的系統提供樹形詞表瀏覽, 使我們可以用規范詞、相關詞、 更廣義的上位詞進行擴展。 利用論文所征引的參考文獻,當找到和課題相關的論文時,可參考其所征引的參考文獻。 使用運算符OR或截詞符“*”、“?”等進行擴展檢索 竅門2 竅門2 竅門3 竅門3 用句子做關鍵詞,必須加英文引號(注意:不使用 過長的詞組或短語)。 例1:搜索《再別康橋》英文譯稿 關鍵詞要用“再別康橋+”(康橋的英文 單詞)。 注意:本例中的關鍵詞用“再別+”,這也 是查找英文譯稿或其他翻譯文章的重要方法。
例2:給關鍵詞加””(要是半角的哦),可以進行 不分散型查詢。如“伊拉克戰爭爆發”,在查詢到的 文檔中將作為一個整體出現。 什么是“檢索策略”,就是全盤計劃與方案,檢索詞可以是: 單一詞匯(簡單檢索),例如:電子商務、圖書館、mp3等。會尋找合適的檢索詞并分解到最小的 檢索點。 一個以上的詞匯(詞組檢索),會用布爾邏輯或其他策略將他們結合起來。 一句完整的話(語句檢索),如,目前全臺灣上網人口有多少?1976年歷史上發生了什么事?你 就應該? 3、選擇檢索范圍較小的字段 6、使用精確檢索,如對于固定短語來說可用 英文“”引起來。 1、選用同義詞或近義詞、相關詞 ,使用布爾邏輯 符or連接; 2、減少邏輯“與”的使用,丟掉一些太專指的 概念; 3、選擇較大檢索范圍的字段如摘要; 5、使用上位詞(如飛行器航天飛機載人航 天飛機)。 第二次世界大戰中的美國政治和軍事領導人 檢索步驟(分析主題邏輯關系): 軍事領導人2)、(政治領導人 軍事領導人)和美國 3)、(政治領導人 軍事領導人)和美國 a:未知IP地址,利用搜索引擎Yahoo,輸入http://www.Yahoo.Com (通過中國汽車行業經濟技術網http://www..ac), 查詢市場行情 價格信息; B:利用“行業協會”、學科信息門戶, 進相關網站,查市場行情,價格信息。
網絡信息檢索是一種新型的檢索手段和模式, 必須遵循一定的檢索步驟和運用有關的檢索策 略與技巧。 檢索策略與技巧:采用廣度優先檢索方法; 優先考慮權威機構提供的專題信息;善于使用在 線幫助;設法提高查準率、查全率和提高上網速 [1]襯傳夫.信息資源公共獲取的社會價值與國際研究動向.中國圖書館學報,2006(4):6 蔣永福.李京.信息公平與公共圖書館制度.國家圖書館學刊,2006(2):54 網絡信息資源評價研究綜述.大學圖書館學報, 2005(1):10 [6]范并思.信息技術沖擊下的圖書館人文思潮. [7]原宏盛.現代圖書館“虛”“實”論.中國圖書館學 報,2005(5):88 07/.html (查詢于2006-8-30) [8]傅白云.網上地方文獻資源的收集、開發與利用.國家圖書 館學刊, 2006(4:56)