搜索引擎蜘蛛爬行網(wǎng)頁(yè)的方式,網(wǎng)絡(luò)蜘蛛一般有兩種策略:廣度優(yōu)先和深度優(yōu)先。下面啟邁
合肥網(wǎng)站建設(shè)對(duì)搜索引擎蜘蛛爬行網(wǎng)頁(yè)的廣度優(yōu)先和深度優(yōu)先解析:
搜索引擎蜘蛛爬行網(wǎng)頁(yè)的方式一:廣度優(yōu)先是指網(wǎng)絡(luò)蜘蛛會(huì)先抓取起始網(wǎng)頁(yè)中鏈接的所有網(wǎng)頁(yè),然后再選擇其中的一個(gè)鏈接網(wǎng)頁(yè),繼續(xù)抓取在此網(wǎng)頁(yè)中鏈接的所有網(wǎng)頁(yè)。這是最常用的方式,因?yàn)檫@個(gè)方法可以讓網(wǎng)絡(luò)蜘蛛并行處理,提高其抓取速度。如:很多優(yōu)化人員在網(wǎng)站地圖上放上網(wǎng)站的所有鏈接。
搜索引擎蜘蛛爬行網(wǎng)頁(yè)的方式二:深度優(yōu)先是指網(wǎng)絡(luò)蜘蛛會(huì)從起始頁(yè)開(kāi)始,一個(gè)鏈接一個(gè)鏈接跟蹤下去,處理完這條線路之后再轉(zhuǎn)入下一個(gè)起始頁(yè),繼續(xù)跟蹤鏈接。這個(gè)方法有個(gè)優(yōu)點(diǎn)是網(wǎng)絡(luò)蜘蛛在設(shè)計(jì)的時(shí)候比較容易。
兩種策略的區(qū)別,用圖來(lái)進(jìn)行說(shuō)明。搜索引擎蜘蛛抓取策略由于不可能抓取所有的網(wǎng)頁(yè),有些網(wǎng)絡(luò)蜘蛛對(duì)一些不太重要的網(wǎng)站,設(shè)置了訪問(wèn)的層數(shù)。
例如,在上圖中,A為起始網(wǎng)頁(yè),屬于1層,B、C、D屬于第2層,E、F、G屬于第3層,H屬于第4層。如果網(wǎng)絡(luò)蜘蛛設(shè)置的訪問(wèn)層數(shù)為3的話,網(wǎng)頁(yè)H是不會(huì)被訪問(wèn)到的。這也讓有些網(wǎng)站上一部分網(wǎng)頁(yè)能夠在搜索引擎上搜索到,另外一部分不能被搜索到。對(duì)于網(wǎng)站優(yōu)化人員來(lái)說(shuō),扁平化的網(wǎng)站結(jié)構(gòu)設(shè)計(jì)有助于搜索引擎抓取其更多的網(wǎng)頁(yè)。