2020年Google SEO排名影響因素有哪些?

閱讀 ?·? 發布日期 2020-05-12 06:29 ?·? admin

2020年Google SEO排名影響因素有哪些?做SEO的難點之一是,搜索算法不斷更新,本來我們就很難知道算法細節,再加上幾乎每天都有變化,就使得SEO不僅像是瞄準移動的目標,有時候簡直就是看不見目標。所以有幾個公司經常大規模統計關鍵詞排名與頁面特征,試圖找到其中的聯系,在一定程度上反向工程搜索算法。谷歌標榜的雖然演過其實,但對比X度的一切向前看,確實顯得良心不少。網站建設網站設計網站制作★網頁設計-599元全包;企業網絡推廣☆網站優化seo☆關鍵詞排名☆百度快照-2200元全年展示;做網站優化排名-網站建設公司

2020年Google SEO排名影響因素有哪些

  谷歌搜索算法

  編輯谷歌算法始于PageRank,這是1997年拉里·佩奇(Larry Page)在斯坦福大學讀博士學位時開發的。佩奇的創新性想法是:把整個互聯網復制到本地數據庫,然后對網頁上所有的鏈接進行分析。基于入鏈接的數量和重要性、及錨文本對網頁的受歡迎程度進行評級,也就是通過網絡的集體智慧確定哪些網站最有用。隨著谷歌迅速成為互聯網上最成功的搜索引擎,佩奇和谷歌的另一名創始人塞吉·布林(Sergey Brin)將PageRank這一簡單概念看做谷歌的最根本創新。PageRank具有其優勢,為帶來高質量的搜索結果做出了貢獻。但這種過度依靠外鏈分析單一算法也具有弊端,那就是很多站長采取作弊手法來增加網站的外鏈,因此網絡上有很多垃圾外鏈。為了應對這種情況谷歌13年更新了其核心算法,那就是蜂鳥算法(Hummmingbird)。在此套算法中,PageRank仍舊起很大作用,但是已經不是唯一的排名機制!隨著時間的推移,外鏈在排名中所起的作用將逐漸衰落!

  算法簡介編輯

  谷歌搜索算法

  這是一個很普通的搜索,谷歌每天要處理成千上萬的這種搜索。但事實上這一搜索過程十分復雜,可能使一些搜索引擎誤解。如果把這些單詞輸入到必應,第一個結果是美國國家橄欖球聯盟的歷年球員名單,其中有一個名叫Lawyer Milloy。搜索結果中的下面幾頁,也沒有與律師Siwek相關的內容。

  這一對比顯示出谷歌算法的強大,甚至可以說是智能,而這是通過反復的修正實現的。看起來谷歌擁有解讀用戶需求的神奇力量——不論是多么生僻的搜索,或是有拼寫錯誤。谷歌將這種能力稱為搜索質量,并且多年來一直竭力完善算法,以產生精確的搜索結果。

  2013年9月27日,谷歌公布已推出“蜂鳥”(Hummingbird)算法,徹底革新代替舊版搜索算法,以應對來自網絡用戶更長、更復雜的查詢。 [1-2]

  算法創始編輯

  但這并不是故事的全部。人們信賴PageRank是因為它是可以進行確認的,但要提供最有用的結果還需要其他技術。這涉及對某些信號、上下文的利用,這樣對于任何查詢,搜索引擎都能將最有用的結果排在最前面。

  背景知識編輯

  網絡搜索是一個多方過程。首先,谷歌機器人獲取每個可訪問網站的內容。這些數據將被分解成一個索引(通過文字進行組織,就像書本的目錄),這樣就可以根據內容找到任何頁面。每當用戶鍵入一個查詢,谷歌就會在索引中搜尋相關頁面,然后返回一個包含多達數百萬頁面的列表。最復雜的是對列表進行排序,也就是決定哪些頁面應該出現在最上面。

  此時,上下文便有了用武之地。所有搜索引擎都會引入上下文,但沒有一個像谷歌那樣引入得那樣多、應用那樣自如。PageRank本身也是一個信號,同時也是頁面的一個屬性(指其相對于其他網頁的重要性),該屬性可以幫助確定其與查詢內容的相關性,其中的一些信號在現在看來是顯而易見的。

  優化搜索編輯

  一直以來,谷歌算法都對頁面的標題給與特別的關注,因此標題成為確定相關性的重要信號。另一個重要技術是錨文本,指的是超鏈接中的可見文本。因此, “當你進行搜索時,搜索引擎總能給出正確的頁面,即使該頁面中沒有你找的關鍵詞。”這是谷歌早期架構師斯科特·哈桑(Scott Hassa)的觀點,他曾與佩奇和布林一起在斯坦福工作。之后,搜索引擎關注的信號還包括新鮮度(對于一些查詢,新近的頁面比較早的頁面更有價值)和地理位置(谷歌知道搜索者的大致地理坐標,會將本地信息排在前面)等。谷歌目前使用200多種信號來幫助確定搜索結果的排序。

  谷歌工程師發現,一些最重要的信號可能來自谷歌本身。PageRank將受歡迎程度植入了搜索引擎:成千上萬的網站民主地決定將鏈接指向哪些網站。但辛格表示,谷歌工程師還利用了另一種民主 ——成千上萬使用谷歌搜索的用戶。用戶在搜索過程中產生的數據被證明同樣很有價值,這些數據包括他們點擊哪些結果、不滿意時對關鍵詞的更改、查詢關鍵詞與所處地理位置的關系等。這一過程的最直接例子就是谷歌所說的“個性化搜索”——這是一個可選功能,利用用戶的搜索歷史和地理位置來確定他想要找的內容(使用這項功能需要先登錄谷歌賬號)。更通常的方法是,谷歌利用其收集的大量數據支持其算法,谷歌對此有極深的理解,可以解讀隱秘查詢的復雜意圖。

  SEMrush排名因素2.0

  SEMrush的結果基于60萬關鍵詞的首100位結果,統計了頁面因素、外鏈和流量數據,得到一些有參考價值的發現:

  網站安全(https的使用)

  高查詢量的關鍵詞前3位,65%使用了https。雖然https不是很大的排名因素,不過是大勢所趨,還是盡快把網站轉為https比較好。

  內容長度

  無論關鍵詞查詢數量大小,通常內容長度與排名是正相關的,前3位結果頁面內容長度平均比第30位長了45%。長尾關鍵詞排名好的頁面比頭部關鍵詞長了20%。

  以前還看到過統計數字,Google前10位結果的平均長度是2000個單詞,這比我當年開始做網站時流行的400-600單詞長多了。

  關鍵詞

  幾個有趣的發現:

  高查詢量關鍵詞,排在前面的頁面有35%頁面標題中沒有包含關鍵詞。這說明Google算法對于理解上下文和搜索意圖有了很大進步,或者標題標簽包含關鍵詞已經不再是重要的排名因素,也可能兩者都是原因。

  鏈接錨文字很少包含關鍵詞,即使高查詢量的關鍵詞,排前面的頁面也只有8%的鏈接包含關鍵詞。可能鏈接錨文字沒那么重要了,也可能大家建設外鏈沒那么刻意了。

  網站流量

  SEMrush研究了網站流量對排名的影響,發現訪問用戶數對高查詢量的關鍵詞是很重要的因素,低查詢量的詞影響不大。而且,搜索流量對排名貌似沒影響,但直接流量對排名是有影響的。

  用戶信號

  跳出率:前3位跳出率比較低,往下跳出率升高。這個中國的SEO們肯定都很熟悉了。

  訪問深度(每次訪問頁面數):也與排名正相關。

  前幾個月就寫過用戶體驗影響搜索排名的統計和我自己的實驗,不過用戶體驗信號是否是直接的排名因素一直有爭議,通常認為不是,但至少會間接影響排名。

  鏈接

  高質量外鏈還是超級重要的,包括外鏈總域名數和follow的鏈接數。第一位結果的外鏈總域名數平均比第10位多一倍,follow的鏈接也類似。

  最重要的因素

  SEMrush的發現是,用戶信號和網站直接流量與排名是最相關的。但正像以前帖子重復很多遍的,相關性不一定意味著因果性。

  通用排名因素已經過時

  Searchmetrics這次研究的是通用排名因素(適用于各領域網站的排名因素)和各個行業/利基市場的排名因素趨勢。有些排名因素是通用的,對各行業都一樣,有些特定行業或利基領域,某些排名因素的權重會有些不同。

  通用因素

  頁面打開速度。2016年排前10位的頁面平均打開時間是7.8秒,2020年縮短到3.8秒。

  和SEMrush一樣,Searchmetrics也發現標題中包含關鍵詞沒那么重要了。現在排第一的頁面只有48%包含關鍵詞,2016年這個比例是55%,2015年時是75%。

  排名好的頁面總字數在增長中,排前10的頁面總字數是1900單詞,2018年是1600詞,2015年是1300個詞。也和SEMrush結論一樣。

  只適用于特定行業的排名趨勢

  Searchmetrics發現有些排名因素的權重隨著查詢詞本身的不同而不同,所以他們研究了不同行業的排名因素,包括電商、金融、健康、媒體和旅游,看看這些行業的排名因素與平均水平有什么區別,得到一些發現。

  比如,https對金融行業更重要,這個行業安全、信任更重要,而對旅游行業就沒那么重要。圖片使用,對金融網站沒那么重要,對旅游網站就影響更大,排前10位的旅游網站頁面平均使用2.15張圖片,金融網站只用了0.92張。旅游網站排前10的頁面總字數2700,金融網站1800詞,嗯,游記、旅游攻略一般都挺長。

  只適用于特定利基市場的排名趨勢

  研究了約會網站、SEO服務和菜譜網站,有類似的現象,不同利基市場網站排名因素權重不同。比如,https的使用對SEO網站重要,68%的SEO網站用了https,對約會或菜譜網站沒那么重要。結構化數據和schema.org標簽對菜譜網站很重要。

  不同行業、市場網站的排名因素權重差別還挺大的,所以不能寬泛地考慮優化重點,要看是什么行業和用戶需要什么。比如,健康相關網站排前面的頁面很多使用了視頻,賣家具的就幾乎沒有,但賣家具的大量使用圖片。

  如何應對?

  對我來說,重點是怎樣排查出問題,知道問題所在,怎樣處理不是明擺著的嗎?比如,網站被黑了,重要的是怎樣知道被黑了,被黑的原因大致是什么,表面上看不出被黑了又該查些什么,至于怎樣處理,那還用說嗎?清理代碼、打補丁啊。

  再比如,統計顯示https重要,怎樣應對?網站換https啊。頁面打開速度重要,怎樣應對?提高頁面打開速度啊。

  有人也許又會質疑,人家問的就是怎樣清理代碼?怎樣換https?怎樣提高頁面打開速度?這恐怕不是同一篇帖子都能講到的了,你得看其它帖子、文章,甚至整本書。清理代碼得涉及網站安全,這得寫幾本書。怎樣換https得涉及服務器設置、證書安裝、網址轉向、URL批量修改等等。提高頁面打開速度,你寫要壓縮圖片,可能又有人問具體怎樣壓縮圖片啊?這樣問下去是沒完沒了的。

  所以,一篇帖子只能講一個問題。里面又會牽扯到更多問題,也許順著鏈接能找到答案,這就是超鏈接之所以被發明出來的原因。

  這些最新的SEO排名因素,不少是和人工智能的應用有關系的。

  三年前,Googled的AlphaGo橫空出世時,我寫了《AlphaGo、深度學習及SEO》這篇帖子,在那之后,我一直非常關注人工智能與搜索算法的進展。

  我不知道搜索算法什么時候會大規模以AI為基礎,也不知道目前AI技術在搜索算法中應用到了什么程度。由于目前人工智能技術的不可解釋性,搜索引擎以AI作為算法基礎會是非常謹慎的,不然很不容易debug。

  不過算法中的一些模塊應用AI是肯定的,以前介紹過百度的DNN模型和Google的RankBrain算法,都是AI在搜索算法中的應用。

  那么完全以人工智能為基礎的搜索算法是什么樣的?工作原理和流程是什么?簡單說一下我的理解。

  人工智能的優勢與搜索

  目前實現人工智能的主流方法是機器學習中的深度學習分支,在這篇帖子里就不加嚴格區分了。

  簡單說,人工智能是給予系統大量訓練數據,人工智能自己從中尋找模式和規律。給予AI系統的數據是打了標簽的,或者說是告訴了AI系統結果。比如,在圍棋中,AI系統有了大量歷史棋局數據(后來的Alpha連歷史棋局都不需要了,自我對局的數據就行了),以及這些棋局的輸贏結果,這個結果就是標簽。然后AI系統自我學習棋局盤面與結果(輸贏)之間的關系。

  在搜索中,AI系統有了頁面的大量數據,也就是搜索引擎本身的索引庫,還需要標簽,也就是要知道哪些頁面是高質量的?針對一個查詢詞,哪些搜索結果是用戶滿意的?然后AI算法自己學習頁面特征(也就是排名因素)和排名之間的關系。

  傳統的搜索算法是搜索工程師人工選擇排名因素,人工給予排名因素一定的權重,根據給定公式,計算出排名。這種方法的弊端是,當數據量大了,排名因素多了的時候,調整排名因素的權重是件很困難的事。最初的權重很可能就是根據常識,再加上拍腦袋,具有很大的主觀隨意性。當有幾百個因素,這些因素又互相影響時,調整這些因素的權重就變成混亂、無法預見結果的事了。

  而從海量數據中找模式正是AI的擅長。AI可以快速尋找可能的排名因素,調整排名因素權重,自動迭代計算,擬合出排名因素和用戶滿意的搜索結果之間的計算公式。

  通過訓練數據訓練出來的計算公式就是AI搜索算法,可以應用于用戶更多的搜索了。

  誰來打標簽?

  既然訓練AI搜索算法時需要打了標簽的數據,那么這些標簽數據是從哪來的?這就是搜索引擎質量評估員的作用了。

  前不久Google質量評估指南帖子里詳細介紹了質量評估員的工作。這些真實用戶(他們不是Google員工),在學習質量評估指南后,Google在評估系統中給評估員真實網站、真實查詢詞數據,評估員進行相關評估,最主要的就是:

  給頁面質量打分

  給特定查詢詞的搜索結果打分

  Google的質量評估員很早就存在了,應該不是為了開發AI算法招募的,而是用來評估傳統算法質量的。但他們的評估數據剛好可以被人工智能系統有效使用。

  這樣,AI系統就知道,針對某個查詢詞,用戶滿意的搜索結果是哪些頁面,是按什么順序排名的。

  現在,AI系統有了海量頁面特征數據,也知道什么樣的搜索結果是真實用戶滿意的,下一步就是訓練系統,尋找頁面特征和搜索排名之間的關系。

  訓練人工智能搜索算法

  搜索引擎可以把打了標簽的搜索結果數據分成兩組。一組訓練用,一組驗證用。

  AI算法檢查訓練組搜索結果中的頁面有哪些特征,這些特征又應該給予什么樣的權重,根據什么樣的計算公式,才能計算出用戶滿意的(打過標簽的)搜索結果。

  與傳統算法不同的是,需要哪些特征(排名因素),這些特征給予多少權重,不是工程師決定的,是AI系統自己尋找和評估的。這些因素也許是工程師想得到、早就在用的,比如:

  頁面的關鍵詞密度

  頁面內容長度

  頁面上有沒有廣告

  頁面有多少外部鏈接

  頁面有多少內部鏈接

  頁面有多少以查詢詞為錨文字的鏈接

  頁面所在域名有多少外鏈

  頁面打開速度多快

  等等等等,可能有幾百上千個

  也許是工程師壓根兒沒想過的,也許有些是表面上看起來毫無關系、毫無道理的,比如:

  頁面正文用的幾號字

  文章作者名字是三個字

  頁面第一次被抓取是星期幾

  頁面外鏈數是單數偶數

  以上只是舉例,為了說明,AI尋找的不是因果關系,而是相關關系。只要AI看到排名好的頁面有哪些特征就夠了,至于把這些特征與排名聯系起來是不是看著有道理,并不是AI關心的,也是不必要關心的。

  當然,有些因素可能是負面的,比如域名長度,很可能與高排名是負相關的。

  AI系統被訓練的過程就是找到這些排名因素(無論人類看著是否有道理),給予這些因素一定權重,擬合出一個計算公式,剛好能排出用戶滿意的那個搜索結果。這個擬合過程應該是迭代的,一個權重數值、一個公式不行,自動調整,再次計算,直到比較完美擬合出評估員打過標簽的搜索結果。這個訓練過程也許要幾天,也許幾個星期,要看數據量。

  AI搜索算法驗證

  被訓練過的AI搜索算法就可以應用于其它沒在訓練數據里的查詢詞了。

  首先用前面提到的驗證組數據驗證一下,如果新訓練出來的算法給出的搜索結果與驗證組數據(同樣是評估員打過標簽的)吻合,說明算法不錯,可以上線了。如果AI算法給出的搜索結果與驗證組搜索結果里的頁面不同,或者頁面基本相同但排序差別很大,可能就要重新訓練AI系統了。

  當然,要做到所有查詢詞,AI算法給出的搜索結果與評估員打過最滿意標簽的搜索結果完全一樣,是不大可能的。估計只要排在前面,比如前20名的頁面順序差異在一定的容錯范圍內就可以了。排在越前面,需要越低的容錯率,比如排在第一第二的頁面不對,比排在第三頁之后的頁面不對嚴重多了。

  驗證過的算法就可以上線,接受真實用戶的檢驗了。這里很可能牽扯到一個SEO們普遍認為與排名有關、但搜索引擎一直否認的排名因素:用戶體驗數據是否是排名因素?

  很多SEO排名因素統計表明,頁面點擊率、跳出率、用戶停留時間、訪問深度與排名有很高的相關性,但Google一直明確否認這些數據是排名因素。當然,對百度來說,點擊率顯然是排名因素。

  原因很可能就是,搜索引擎需要用這些用戶體驗數據驗證搜索算法質量,如果用戶普遍點擊率降低、跳出率提高,說明新上線的算法有問題,需要調整。雖然搜索引擎沒有直接使用用戶數據來排名,但算法的目標就是提高用戶數據,使得這兩者之間高度相關。

  新的AI算法上線后,搜索引擎監控的用戶數據說明用戶滿意,算法就成功了,等待下一輪的優化。

  以上猜測很可能成為未來的現實,讓我們拭目以待。

  谷歌SEO自然排名是鏗努科技的核心業務,自然排名才能持久和可持續發展。我們并不建議客戶花大錢做廣告,只有在必須盡快上首頁的場合才做。鏗努客戶 專業SEO服務,純白帽,安全可靠。