- 相關(guān)推薦
搜索引擎工作原理論文
■ 全文搜尋引擎
在搜尋引擎分類(lèi)部份咱們提到過(guò)全文搜尋引擎從網(wǎng)站提守信息樹(shù)立網(wǎng)頁(yè)數(shù)據(jù)庫(kù)的概念。搜尋引擎的自動(dòng)信息收集功能分兩種。1種是按期搜尋,即每一隔1段時(shí)間(比如Google1般是二八天),搜尋引擎主動(dòng)派出“蜘蛛”程序,對(duì)于必定IP地址規(guī)模內(nèi)的互聯(lián)網(wǎng)站進(jìn)行檢索,1旦發(fā)現(xiàn)新的網(wǎng)站,它會(huì)自動(dòng)提取網(wǎng)站的信息以及網(wǎng)址加入自己的數(shù)據(jù)庫(kù)。
另外一種是提交網(wǎng)站搜尋,即網(wǎng)站具有者主動(dòng)向搜尋引擎提交網(wǎng)址,它在必定時(shí)間內(nèi)(二天到數(shù)月不等)定向向你的網(wǎng)站派出“蜘蛛”程序,掃描你的網(wǎng)站并將有關(guān)信息存入數(shù)據(jù)庫(kù),以備用戶查詢。因?yàn)樽罱鼛啄陙?lái)搜尋引擎索引規(guī)則產(chǎn)生了很大變化,主動(dòng)提交網(wǎng)址其實(shí)不保證你的網(wǎng)站能進(jìn)入搜尋引擎數(shù)據(jù)庫(kù),因而目前最佳的辦法是多取得1些外部鏈接,讓搜尋引擎有更多機(jī)會(huì)找到你并自動(dòng)將你的網(wǎng)站收錄。
當(dāng)用戶以癥結(jié)詞查找信息時(shí),搜尋引擎會(huì)在數(shù)據(jù)庫(kù)中進(jìn)行搜索,如果找到與用戶請(qǐng)求內(nèi)容符合的網(wǎng)站,便采取特殊的算法——通常依據(jù)網(wǎng)頁(yè)中癥結(jié)詞的匹配程度,呈現(xiàn)的位置/頻次,鏈接質(zhì)量等——計(jì)算出各網(wǎng)頁(yè)的相干度及排名等級(jí),然后依據(jù)關(guān)聯(lián)度高下,按順序?qū)⑦@些網(wǎng)頁(yè)鏈接返回給用戶。
■ 目錄索引
與全文搜尋引擎相比,目錄索引有許多不同的地方。
首先,搜尋引擎屬于自動(dòng)網(wǎng)站檢索,而目錄索引則完整依賴手工操作。用戶提交網(wǎng)站后,目錄編纂人員會(huì)親身閱讀你的網(wǎng)站,然后依據(jù)1套自定的評(píng)判標(biāo)準(zhǔn)乃至編纂人員的主觀印象,抉擇是不是接納你的網(wǎng)站。
其次,搜尋引擎收錄網(wǎng)站時(shí),只要網(wǎng)站自身沒(méi)有背反有關(guān)的規(guī)則,1般都能登錄勝利。而目錄索引對(duì)于網(wǎng)站的請(qǐng)求則高患上多,有時(shí)即便登錄屢次也不必定勝利。特別象Yahoo!這樣的超級(jí)索引,登錄更是難題。(因?yàn)榈卿沋ahoo!的難度最大,而它又是商家網(wǎng)絡(luò)營(yíng)銷(xiāo)必爭(zhēng)之地,所以咱們會(huì)在后面用專門(mén)的篇幅介紹登錄Yahoo雅虎的技能)
另外,在登錄搜尋引擎時(shí),咱們1般不用斟酌網(wǎng)站的分類(lèi)問(wèn)題,而登錄目錄索引時(shí)則必需將網(wǎng)站放在1個(gè)最適合的目錄(Directory)。
最后,搜尋引擎中各網(wǎng)站的有關(guān)信息都是從用戶網(wǎng)頁(yè)中自動(dòng)提取的,所以用戶的角度看,咱們具有更多的自主權(quán);而目錄索引則請(qǐng)求必需手工此外填寫(xiě)網(wǎng)站信息,而且還有各種各樣的限制。更有甚者,如果工作人員認(rèn)為你提交網(wǎng)站的目錄、網(wǎng)站信息不適合,他可以隨時(shí)對(duì)于其進(jìn)行調(diào)劑,固然事前是不會(huì)以及你磋商的。
目錄索引,顧名思義就是將網(wǎng)站分門(mén)別類(lèi)地寄存在相應(yīng)的目錄中,因而用戶在查詢信息時(shí),可選擇癥結(jié)詞搜尋,也可按分類(lèi)目錄逐層查找。如以癥結(jié)詞搜尋,返回的結(jié)果跟搜尋引擎1樣,也是依據(jù)信息關(guān)聯(lián)程度排列網(wǎng)站,只無(wú)非其中人為因素要多1些。如果按分層目錄查找,某1目錄中網(wǎng)站的排名則是由標(biāo)題字母的前后順序抉擇(也有例外)。
目前,搜尋引擎與目錄索引有互相融會(huì)滲入的趨勢(shì)。原來(lái)1些純潔的全文搜尋引擎現(xiàn)在也提供目錄搜尋,如Google就借用Open Directory目錄提供分類(lèi)查詢。而象 Yahoo! 這些老牌目錄索引則通過(guò)與Google等搜尋引擎合作擴(kuò)展搜尋規(guī)模。在默許搜尋模式下,1些目錄類(lèi)搜尋引擎首先返回的是自己目錄中匹配的網(wǎng)站,如國(guó)內(nèi)搜狐、新浪、網(wǎng)易等;而此外1些則默許的是網(wǎng)頁(yè)搜尋,如Yahoo。
【搜索引擎工作原理論文】相關(guān)文章:
搜索引擎工作原理05-01
地源熱泵工作原理論文04-28
微機(jī)原理及應(yīng)用結(jié)業(yè)論文04-30
熱脹冷縮原理的論文04-28
磁保持繼電器工作原理與開(kāi)發(fā)困境論文05-01
剛性樓板假定的工作原理及其選用方法的工學(xué)論文05-01
VFD工作原理05-01
水泵工作原理04-30
差速器的工作原理05-01