可能還有些朋友不知道什么叫網(wǎng)站日志,我們怎么去看網(wǎng)站日志,這里我簡單的說一下。畢竟我們今天的重點還是如何通過分析我們的網(wǎng)站日志,結(jié)合我們的SEO知識來提高我們的網(wǎng)站收錄與蛛蛛爬取這個才是重要的。
網(wǎng)站日志他其它是一個.log的文本文件,一般都是以天為統(tǒng)計成一個文本。如果你是買的虛擬機,我們可以通過虛擬機的后臺設(shè)置來生成.log日志文件。這個文件一般會在你的根目錄下的log 文件目錄下。在這個文件目錄下我們就可以看到每日生成的日志文件了,它的作用也就是記錄下當天的網(wǎng)站訪問情況。
我們來看一段代碼:2010-08-03 00:09:12 W3SVC962713505 203.171.226.111 GET /index.html – 80 – 61.135.168.39 Baiduspider
( http://www.baidu.com/search/spider.htm) 200 0 64
上面的這個是大家經(jīng)常會看到網(wǎng)站日志代碼,我簡單的給大家說一下他大概的意思,2010年08月03日00點09分12秒IP為61.135.168.39的百度蛛蛛爬蟲通過80端口有效的訪訪問了IP地址為203.171.226.111W3SVC962713505目錄的index.html文件。這個是這段日志的譯文。當然在我們的日志文件里,類似這樣的信息應(yīng)該會有比較多,如果你的站確實比較受歡迎的,那么一個小時內(nèi)來十幾次都是有可能的。
通過我們分析網(wǎng)站的日志,我們是不是不難發(fā)現(xiàn)。百度蛛蛛對于我們的網(wǎng)站首頁的爬取率是最高的(權(quán)重頁),這個也不難理解,因為做為網(wǎng)站來說更新的最快的,而且我們做錨文本鏈接的時候幾乎都是以首頁為主。那么結(jié)合著來說,我們的好些欄目頁的蛛蛛爬取大多數(shù)是通過我們首頁給他做的鏈接誘餌,引導(dǎo)蛛蛛來爬取我們的欄目從而收錄。
特別是我們做企業(yè)站與商城的時候,我們會發(fā)現(xiàn)有些個頁面非常難收錄,在我們減少了網(wǎng)站的重復(fù)率來提高網(wǎng)站收錄。那么我們能不能通過自己我的網(wǎng)站來做一個有效的引導(dǎo)呢。因為只有蛛蛛來爬過了我們的網(wǎng)頁才有可能被收錄。所以結(jié)合網(wǎng)站日志來提高網(wǎng)站收錄的一個比較重要的思路:利用那些蛛蛛爬取頻率比較高的頁面上來做鏈接誘餌,來引導(dǎo)蛛蛛爬取我們的內(nèi)頁,從而達到網(wǎng)站收錄量提高的這么一個目的。
本文由寧波SEO何濤提供,網(wǎng)址http:www.nb-seoer.com