4、較重視絕對地址的鏈接
百度在收錄網(wǎng)頁時比較重視絕對地址的收錄,百度提供的網(wǎng)頁快照功能也沒有解析相對地址的絕對路徑,不知這是百度技術(shù)的疏忽還是其偏好的一大體現(xiàn)。
5、較重視收錄日期
百度對網(wǎng)頁的收錄日期非?粗,也是其搜索結(jié)果排名的參考點,被收錄得越早排名會較高,有時甚至不考慮相關(guān)性地把它認為比較重要的內(nèi)容放在首位,而點擊進入之后才發(fā)現(xiàn)是早已過時的信息或者垃圾信息。這是百度需要改進的技術(shù)。
百度使用的技術(shù):
百度使用以下技術(shù):“一種互聯(lián)網(wǎng)上鏡像和準鏡像網(wǎng)站的識別方法”,這個方法解決了搜索引擎對雷同信息的重復(fù)獲取,節(jié)省網(wǎng)絡(luò)資源和本地資源,提高系統(tǒng)服務(wù)的質(zhì)量和效率;“一種基于詞匯的計算機索引和檢索方法”,該方法對一段連續(xù)的文字信息,經(jīng)過詞匯分析處理后,通過添加隱形詞匯的手段,實現(xiàn)對基于詞匯索引和檢索系統(tǒng)的檢索質(zhì)量提升,使用戶獲得更加準確的檢索結(jié)果;“一種使用快照的方式實現(xiàn)對網(wǎng)上信息進行記錄和分析的方法”,該方法是通過對互聯(lián)網(wǎng)上一個特定信息,多次進行快照的方式,將信息當時的狀態(tài)進行保留。并通過對一系列快照信息的分析,得到有效數(shù)據(jù),方便地得到網(wǎng)上信息的變動情況。
|