
文章插圖
正向索引可以簡稱為索引 。
索引就是關鍵詞與網頁文件之間的一種對應關系 。 所以就存在兩種索引:正向索引和倒排索引 。 我們知道搜索引擎中使用的是倒排索引 , 有不少朋友并不理解什么叫倒排索引 。 這里先來介紹—下正向索引 。 當用戶進行査詢時 , 如果對本地文件全面掃描用戶所提交的關鍵詞 , "查詢"的工作量就太大了 , 而且也是很消耗服務器資源的 , 所以搜索引攀會把已經處理過的網頁先進行索引 , 放到數據庫中等待網民的搜索査詢請求 。
一個網頁被搜索引擎經過以上處理后 , 就只剩下能夠體現網頁主體內容的文本了 , 此時就可以對該網頁進行索引了 。 正向索引指的是文件對應關鍵詞的形式
【什么是正向索引?具體形式是什么樣的?】 正向索引是以關鍵字為主碼 , 查詢時需要遍歷每一個文件 。 每個文件都對應一個文件ID , 文件內容被表示為一串關鍵詞的集合 。 實際上在搜索引擎索引庫中 , 關鍵詞也已經轉換為關鍵詞ID 。 這樣的數據結構就稱為正向索引 。
相關經驗推薦
- 筆記本電腦突然黑屏是什么原因
- 油性皮膚是怎么回事?揪出油性皮膚的真相
- 檢查一下你的文胸穿得是否合適
- 小米科技|主板電池的作用?它和bios有關聯嗎?什么是cmos rom、EEPROM?
- 內褲晾曬有講究
- 戒煙后肺是否能恢復正常 清肺食物幫你恢復受傷的肺
- 法正雖然品性不好 但是出了名的聰明 很有謀略 是讓諸葛亮都自嘆不如的奇才
- 摩羯座時間幾月到幾月份 12月出生的摩羯座女生,12月是什么星座
- 寶寶明明很困,但就是睡不著是什么原因
- 河南六大美食,你都吃過嗎?,河南最有名的吃的是什么
