一個(gè)規范的網(wǎng)站,網(wǎng)站地圖肯定是少不了的。一個(gè)單獨的網(wǎng)站地圖頁(yè)面不僅可以讓用戶(hù)對整個(gè)網(wǎng)站的目錄結構及內容有一個(gè)很好的認識且一目了然,而且方便百度蜘蛛跟蹤連接爬行到網(wǎng)站所有主要部分內容。
網(wǎng)站地圖主要有兩種:
HTML網(wǎng)站地圖
下面我們一個(gè)個(gè)來(lái)學(xué)習這兩種網(wǎng)站地圖。
HTML網(wǎng)站地圖
HTML版本的網(wǎng)站地圖主要是給用戶(hù)看的,主要列出了網(wǎng)站上所有主要連接的頁(yè)面。特指HTML版本網(wǎng)站地圖英文是sitemap,其中s需要小寫(xiě)。
小規模網(wǎng)站,其網(wǎng)站地圖可以列出網(wǎng)站上所有的頁(yè)面。
規模稍大的網(wǎng)站,一個(gè)網(wǎng)站地圖列出所有頁(yè)面不是很現實(shí)??梢灾涣谐鼍W(wǎng)站上主要連接(一級分類(lèi),二級分類(lèi))。也可以將網(wǎng)站地圖分成多個(gè)文件,主網(wǎng)站地圖列出通往次級網(wǎng)站地圖的連接,次級網(wǎng)站地圖在列出一部分頁(yè)面連接。這樣,多個(gè)網(wǎng)站地圖頁(yè)面加一起,就可以列出所有或絕大部分重要頁(yè)面了。
如果有一個(gè)良好的導航系統或者鏈接結構的網(wǎng)站,不一定要列出完整所有頁(yè)面的網(wǎng)站地圖。其實(shí),網(wǎng)站地圖和分類(lèi)結構大同小異。
XML版本網(wǎng)站地圖主要是給搜索引擎看的,由XML標簽組成,該文件必須是utf8編碼。實(shí)際上,就是列出網(wǎng)站要被收錄的頁(yè)面鏈接。特指XML版本網(wǎng)站地圖英文是Sitemap,其中s通常是大寫(xiě)。
簡(jiǎn)單的可以是一個(gè)文本文件,列出頁(yè)面的鏈接,一行一個(gè),這樣搜索引擎就能理解和抓取文件的內容了。
標準的文件如下:
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
<url>
<loc>http://wxlpsy.com/category-2.html</loc>
<lastmod>2016-11-07</lastmod>
<changefreq>weekly</changefreq>
<priority>0.4</priority>
</url>
</urlset>
標簽解讀
urlset:聲明文件所使用的Sitemap協(xié)議版本,是必須要的標簽
url:是它下面所有網(wǎng)址的母標簽,是必須要的標簽
loc:列出頁(yè)面完整的url,是必須要的標簽
lastmod:表示頁(yè)面最后一次更新時(shí)間,此標簽可選。
priority:可選標簽,表示鏈接的相對重要程度
changefreq:代表文件的更新頻率,是可選標簽??梢杂幸韵轮担?
changefreq標簽值
always:表示一直變動(dòng),指每次訪(fǎng)問(wèn)頁(yè)面內容都不同
hourly:每小時(shí)
daily:每天
weekly:每周
monthly:每月
yearly:每年
never:從不改變
設置頻率更新值是給搜索引擎一個(gè)參考。但是,搜索引擎不一定就認為更新頻率就如站長(cháng)設置的一樣。
最多可以列出5w個(gè)URL,且文件大小不能超過(guò)10MB。
如果網(wǎng)站要收錄的URL太多,可以分成多個(gè)網(wǎng)站地圖文件。
一個(gè)網(wǎng)站最多可以有1000個(gè)文件,可以列出5000w個(gè)網(wǎng)址。
可以通過(guò)站長(cháng)工具后臺提交,百度、360、google都支持該功能。另一種可以放到robots.txt 文件了通知搜索引擎,如下:
Sitemap: http://www.ykygy.cn/sitemap.xml
主流的搜索引擎都支持robots文件制定網(wǎng)站地圖文件位置。