搜尋引擎的工作原理可分為三個過程:首先在網際網路中發現、搜集網頁信息,其次對信息進行提取和組建索引庫,最後再由檢索器根據用戶輸入的關鍵詞,在索引庫中快速找到文檔,進行文檔與查詢的相關度評價,對輸出的結果進行排序,並將查詢結果呈現給用戶。
搜尋引擎不能真正理解網頁上的內容,他只是機械地匹配網頁上的文字,而真正意義上的搜尋引擎通常指是收集了網際網路上幾千萬到幾十億個網頁並對網頁中的每一個字進行索引,從而建立索引資料庫的全文搜尋引擎。
典型的搜尋引擎由三個模塊組成:
1.信息採集模塊:信息採集器是一個可以瀏覽網頁的程序,它在進入到一個網頁後會把該網頁的連結作為瀏覽的起始地址,把被連結的網頁獲取過來,抽取網頁中出現的連結,並通過一定的算法決定下一步要訪問哪些連結。
2.查詢表模塊:查詢表模塊就是一個全文索引資料庫。
3.檢索模塊:檢索模塊是實現檢索功能的程序,其作用是將用戶輸入的檢索表達式拆分為具有表達意義的字或者詞,通過一定的算法獲得相應的檢索結果。
- 生活問答
- 答案列表
索引是什麼意思?索引的原理是什麼[朗讀]
加入收藏