一、搜索引擎概述
搜索引擎是指根據(jù)一定的策略、運用特定的計算機程序搜集互聯(lián)網(wǎng)上的信息,在對信息進(jìn)行組織和處理后,為用戶提供檢索服務(wù)的系統(tǒng)。它主要是用于檢索網(wǎng)站、網(wǎng)址、文獻(xiàn)信息等內(nèi)容。隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,各種搜索引擎層出不窮,目前流行的搜索引擎主要是幫助用戶搜索表層信息,如google、百度、雅虎等。
二、搜索引擎的分類
目前,主流的搜索引擎有如下幾類:
(一)全文索引
根據(jù)搜索結(jié)果來源的不同,全文搜索引擎可分為兩類,一類擁有自己的檢索程序(Indexer),俗稱“蜘蛛”(Spider)程序或“機器人”(Robot)程序,能自建網(wǎng)頁數(shù)據(jù)庫,搜索結(jié)果直接從自身的數(shù)據(jù)庫中調(diào)用,上面提到的Google和百度就屬于此類;另一類則是租用其他搜索引擎的數(shù)據(jù)庫,并按自定的格式排列搜索結(jié)果,如Lycos搜索引擎。
(二)目錄索引
目錄索引雖然有搜索功能,但不能稱為真正的搜索引擎,只是按目錄分類的網(wǎng)站鏈接列表而已。用戶完全可以按照分類目錄找到所需要的信息,不依靠關(guān)鍵詞進(jìn)行查詢。目錄索引中最具代表性的是Yahoo、新浪分類目錄搜索。
(三)元搜索引擎
元搜索引擎接受用戶查詢請求后,同時在多個搜索引擎上搜索,并將結(jié)果返回給用戶。著名的元搜索引擎有InfoSpace、Dogpile等。中文元搜索引擎中具代表性的是搜星搜索引擎。在搜索結(jié)果排列方面,有的直接按來源排列搜索結(jié)果,如Dogpile;有的則按自定的規(guī)則將結(jié)果重新排列組合,如Vivisimo。
三、搜索引擎使用技巧
(一)關(guān)鍵詞的選擇
目前搜索引擎不具備智能識別能力,較人腦而言還很“弱智”,往往不能很好地把握用戶到底想要什么,只會在現(xiàn)成的數(shù)據(jù)庫索引中查找相匹配的關(guān)鍵詞。因此,選擇合適的關(guān)鍵詞是成功檢索的第一步。關(guān)鍵詞的選擇雖然沒有什么定式,不過也有一些規(guī)律可循,在提取關(guān)鍵詞時力求做到規(guī)范,避免口語化,便能達(dá)到事半功倍的效果。此處用特殊實例來說明:
1.使用特定詞匯。有時輸入的關(guān)鍵詞由于過泛而沒有被收錄在搜索引擎的數(shù)據(jù)庫索引中,這時可以選擇與該主題相關(guān)且更具體的詞匯。例如,欲搜索某些期刊的投稿電子信箱,一般策略是在搜索框內(nèi)輸入“xxx雜志編輯部”,對知名度高、信息化程度高的期刊而言,一般都能搜出相應(yīng)的email,可信息化程度不高的期刊就比較難。此時可以嘗試如下兩種方法提高搜索效率:(1)同時輸入兩個關(guān)鍵詞,縮小檢索范圍,即“xxx雜志email”或“xxx雜志電子信箱”;(2)關(guān)鍵詞中加入電子信箱關(guān)鍵信息,即“xxx雜志@”。因為任何電子信箱中均有“@”,“@”成了查找電子信箱的關(guān)鍵符號。通過這兩種方法,很容易就能將期刊編輯部的電子信箱搜到。
2.使用多個含義相近的關(guān)鍵詞。對于熱門信息來說,搜索時犯愁的是返回條目太多,可對冷門事件或事物來說往往恰恰相反。此時可使用同義關(guān)鍵詞和關(guān)聯(lián)關(guān)鍵詞來檢索,以達(dá)到更全面的搜索結(jié)果。如:在學(xué)術(shù)部門的年輕人想查閱申報課題的技巧時會發(fā)現(xiàn)相關(guān)結(jié)果少,此時可用“報課題技巧”、“報項目技巧”、“課題申報經(jīng)驗”、“課題申報指南”等關(guān)鍵詞來檢索。
(二)局限于某個具體網(wǎng)站或者網(wǎng)站頻道
許多單位都會針對同一熱門事件在本單位網(wǎng)站發(fā)大量文件或文章。這些文章或文件往往名稱相同但具體內(nèi)容和要求卻不同。此時,指定網(wǎng)站或頻道的搜索功能能為我們提高搜索效率。
(三)按文件類型查找
如需要查找簡歷模版時可以構(gòu)建如下檢索式:“簡歷模版filetype:
doc”,此時能搜到word格式的簡歷模版。此處的filetype:doc是限定檢索文件的類型,該字段必須在英文狀態(tài)下錄入,而“簡歷模版”是檢索的關(guān)鍵詞。兩個字段之間必須用空格隔開。同理,如果需要檢索市場營銷的教案也可以構(gòu)造“市場營銷教案filetype:ppt”的檢索式,檢索結(jié)果為ppt格式的市場營銷教案。該檢索式支持txt,ppt,xls,pdf,mp3,swf等常見文件類型。
(四)巧用快照
有時會搜到訪問不了的“死鏈網(wǎng)頁”和過期文件,而看其內(nèi)容摘要很符合需要。此時可利用搜索引擎提供的網(wǎng)頁快照功能查閱此類文獻(xiàn)。
(五)使用不同的搜索引擎
不同的搜索引擎,其信息覆蓋范圍有差異,我們平時搜索信息時僅集中于某一家搜索引擎是不明智的,因為再好的搜索引擎也有局限性,而使用優(yōu)秀的搜索引擎可以達(dá)到事半功倍的效果。
(六)留意搜索引擎返回的結(jié)果
由于競價排名業(yè)務(wù)的推廣,搜索引擎返回的Web站點順序會影響人們的訪問。所以,為了增加Web站點的點擊率,一些Web站點會付費給搜索引擎,以在相關(guān)Web站點列表中顯示在靠前的位置。好的搜索引擎會鑒別Web站點的內(nèi)容,并據(jù)此安排它們的順序,但許多搜索引擎無法鑒別。
四、結(jié)語
隨著信息技術(shù)的發(fā)展,網(wǎng)絡(luò)信息的高速膨脹,查找高相關(guān)的信息猶如大海撈針。為了提高檢索質(zhì)量,為了提高工作效率,我們應(yīng)該對搜索引擎多一些了解。俗話說“工欲善其事,必先利其器”,只有熟練掌握搜索工具和靈活運用檢索技巧才能在網(wǎng)絡(luò)檢索中有的放矢、事半功倍。
heet://m.wz818.com
地 址:北京市海淀區(qū)建材城中路12號院17號樓1層119室
武漢分公司地址:湖北省武漢市洪山區(qū)南國雄楚廣場A4棟2011室
鄭州分公司地址:河南鄭州金水區(qū)東風(fēng)路科技市場對面米蘭陽光6號樓917室
郵 箱:haidanet@163.com
24小時聯(lián)系電話: 15201609116 13651084380