SEO怎么分析網站日志這些細節問題

閱讀 ?·? 發布日期 2020-12-31 09:36 ?·? admin
 作為一名SEO優化人員,對網站日志分析是必須要掌握的一項基本的技能,通過日志分析可以分析爬蟲抓取頁面有效性,通過日志分析蜘蛛返回的狀態碼能及時發現網站里面是否存在錯誤或者蜘蛛無法爬取的頁面,網站建設排查網站頁面中存在的404錯誤頁面等。網站日志既可使用工具,也可直接在看。直接在看源文件,信息會更加完整。那么網站日志要分析哪些數據呢?
<a href='http://krq623.cn' target='_blank'><u>網站優化</u></a>
 
  1、訪問次數、停留時間、抓取量
 
  從這些項數據中可以得知: 平均每歡抓取頁面數、單頁抓取停留時間和平均每次停留時間。平均每次抓取頁面數=總抓取量/訪問次數,單頁面抓取停留時間=每次停留/每次抓取,平均每次停留時間=總停留時間訪問次數。
 
  2、目錄抓取統計
 
  通過日志分析我們可以看到網站哪些目錄受蜘蛛喜歡、抓取目錄深度、重要頁面目錄抓取狀況、無效頁面目錄抓取狀況等。通過對比目錄下頁面抓取及收錄情況,我們可以發現更多問題。對于重要目錄,我們需要通過內外調整增加權重及爬取; 對于無效頁面,在Robots.TXT 中進行屏蔽。
 
  3、蜘蛛爬取路徑
 
  在網站日志中我們可以跟蹤到特定IP 的訪問路徑,網站建設如果我們跟蹤特定蜘蛛的訪問路徑就能發現對于本網站結構下蜘蛛的爬取路徑偏好。由此,我們可以適當地引導蜘蛛的爬取路徑,讓蜘蛛更多地爬取重要、有價值、新更新頁面。其中,爬取路徑中我們又可以分析頁面物理結構路徑偏好以及URL 邏輯結構爬取偏好。通過這些,可以讓我們從搜索引擎的視角去審視自己的網站。
 
  4、頁面抓取
 
  在網站日志分析中,我們可以看到具體被蜘蛛爬取的頁面。在這些頁面中,我們可以分析出蜘蛛爬取了哪些需要被禁止爬取的頁面、爬取了哪些無收錄價值頁面、爬取了哪些重復頁面URL等。為充分利用蜘蛛資源,我們需要將這些地址在Robots.txt中禁止爬取。
 
      5、訪問狀態碼
 
  蜘蛛經常出現的狀態碼包括301、404等。出現這些狀態碼要及時處理,以避免對網站造成壞的影響。
 
  6、抓取時間段
 
  通過分析對比多個單日蜘蛛小時爬取量,可以了解到特定蝴蛛對于本網站在特定時間的活躍時段。通過對比周數據,可以看到特定蜘蛛在一周中的活躍周期。
 
  7、蜘蛛訪問IP
 
  通過蜘蛛的IP段和前三項數據來判斷網站的降權情況,IP分析的更多用途是判斷是否存在采集蜘蛛、假蜘蛛、惡意點擊蜘蛛等,從而對那些訪問來源進行屏蔽、禁止訪問處理,以節省帶寬資源及減輕服務器壓力,留給訪客及蜘蛛更好的訪問體驗。
 
     做優化時,一些細節問題可能也會關系到我們整個SEO優化的好壞結果,所以細節問題我們也不能忽視它。
 
       1、網站圖片是否清晰明了?
 
       拿眾多企業網站來舉例,好多的企業網站中的圖片都存在或多或少的問題,具體如下:大小不一,規格不一,圖片清晰度極差,圖片表現力說服力不強等等的缺點。
 
       2、網站圖片是否為原創
  
       說到這可能很多朋友會抱怨了。現在網站內容要求原創已經夠費力了,怎么網站圖片也要求原創?其實從搜索引擎結果展現圖文并茂的形式可以看出,搜索引擎對網站圖片的識別已經越來越智能化了。
 
       3、圖片與文章的相關性
 
       如果想要搜索結果以圖文并茂的形式展現,必須為該頁面配備符合主題的相關圖片才能給予展現。除了這方面外,從網站內容而言,網站建設如果網站圖片和網站內容毫無關聯性,試問你又能否給予網站訪客一個好的用戶體驗呢?所以網站圖片優化也要注重相關性。
 
       4、圖片的格式和大小
 
       眾所周知,網站圖片的格式有jpg、gif、png常見的三種格式。那么到底何種網站的圖片是百度最喜歡的呢?很簡單,我們可以看看百度官方發布的一些帶圖的文章,就不難發現png的格式就是更佳的格式。