Google 機密文件外洩,搜尋專家開撕演算法黑盒子】
── 2,500 份技術文件、14,014 個排名屬性,匿名 Google 員工爆料
有個退出 SEO 界 6 年,卻始終引領 SEO 潮流的男人,名叫 Rand Fishkin。
Rand 曾鑽研出各種搜尋技巧、排名概念:
- 網站權重(DA)
- 10x 十倍內容法
- 子網域、子資料夾的明顯優勢
- 現場展示「點擊」對「排名」的直接影響
還有無數深度文章、影片、分析工具等。
但 Google 卻一再貶損他的心血結晶。
包含宣稱從不使用任何「點擊、權重」作為排名依據,點擊率全是胡說八道等等⋯⋯
雖然 Rand 已退出多年,但他對搜尋界的貢獻,甚至連 Google 員工都高度認可。
所以,爆料人指定把資料流傳給 Rand、由 Rand 來分析和處置。
資料內容是上千份機密技術文件、裡面有無數條編碼。
爆料者指出這些文件來自 Google 搜尋內部,而且經過多名員工確認「有料」。
Rand 又委託知名的技術面 SEO 專家 Mike King,花了整個連假週末時間梳理。
他們寫出分別 7,000、5,000 字的「初步」分析,才剛釋出。
▋Google 的謊言、還 Rand 清白
這些外洩內容,對於「廣泛行銷」的人來說可能不太緊要:「不是本來就這樣嗎?」
但對 SEO 專家可是天差地別。
確認一項操作「到底能否對 SEO 有效」,可分成 3 種面向:
- Google 官方說詞
- 權威 SEO 專家研究
- 實戰測試、各家觀點
當 1 和 2 衝突的時候,就麻煩大了。
如果只是小規模「優化」,你可以憑感覺。有效做做看、沒效就放棄。
但言論或研究能影響上千、上萬行銷人,甚至整個搜尋品質時,事態就嚴重多了。
Rand 當時就站在搜尋界的頂峰,他提出的許多猜想、意見,直到現在才被一一證實。
Google 當時多次透過公開言論,大力否認 Rand 的研究。
而這波外洩資料有極清楚的標籤,證明 Rand 驚人的分析能力和遠見。
例如 Google 多次否認使用「Chrome 瀏覽器點擊數據」幫助搜尋。
而內部資料卻有全然相反的線索。
Rand 也因此承受多年冤屈、遭受各界撻伐。
▋14,014 個排名屬性
文件當中揭露出超過 1 萬 4 千個排名屬性標籤(attribute)。
有這些標記不代表搜尋引擎就 100% 會使用它們判斷排名。
但這可信程度已經比「研究 Google 專利、聽信 Google 說詞」還要來得強大。
從這些繁雜的資料裡,Rand 和 Mike 花了整個週末的時間,就已經推測出驚人資訊量。
但剩下的,還需要交給其他專家去挖掘。
以下,是 Google 並未承認(甚至否認),但演算法機密文件釋出後幾乎確定的「部分」項目。
▋網站權重
Google 多次否認,說他們從來不用「網站權重」或類似東西。
但文件裡卻有這明顯標記:「siteAuthority」(站的權重)
網站權重(Domain Authority)剛好和 Rand 創辦公司所研發出的知名指標同名。
所以 Google 就借用這樣的「雙關」說:「沒有欸,我們根本不用『DA』。」
雖然能理解 Google 是為了避免有心人濫用搜尋演算法、操縱排名,所以蓄意不承認部分的排名機制,但這種誤導對 Rand 本人和他的名譽傷害很大。
從這次機密文件裡,幾乎可以定調「Google 在說謊」。
Google「有」衡量網站權重的機制。
▋搜尋沙盒(剛註冊,先關 SEO 小黑屋)
沙盒(sandbox),簡單來說就是「關進小黑屋」。
你現在如果去新創個全新網站,排名要等很久才會開始有訊號。
相比之下,你如果在已經註冊好的舊網域經營,排名會快很多。
Google 的搜尋分析師 John Mueller 曾直截了當的說:「我們沒有沙盒!」
外洩文件的標籤卻清楚寫著「hostAge」,也就是註冊年份。
這是為了要延緩可能被拿來濫用的全新站,讓它們晚一點才能「出關」。
▋使用 Chrome 瀏覽器的數據判斷排名
這其實算公開認證的資訊了。
在 2023 年底的反托拉斯法官司當中,美國司法部(DOJ)要求 Google 交出的簡報裡面,就被挖到有機密文件指出使用者點擊資訊「會直接」影響排名。
這次的文件更明顯。
標籤名稱叫做「chromeInTotal」,Chrome 的總時長。
基本上用力打臉前搜尋分析師 Matt Cutts 和現任分析師 John Muller。
他們兩位都曾代表 Google「大力否認」有用任何相關的資訊來判斷排名。
▋連結優先度
簡單來說,越容易被點擊的連結,它能傳遞的排名訊號就越強。
這件事,我自己印象最深刻的是從黑帽 SEO 專家 Jerry 聽到。
他用「肉身實測」就推測「越容易被按的連結,排名提升效果越好」。
文件上有資訊指出:字體越大的連結,作用就傾向越高。
(備註寫著:連結文字的平均字體大小)
Google 還有「連結的 3 種層級」:
低品質、中品質、高品質。
使用者的點擊數據也會作為連結品質的判定依據。
合理推測,常被點的連結當然要給予更高權重。
▋日期超級重要
你在搜尋的時候,有看過那種「每天都顯示剛剛更新,點進去卻是超級舊文」的經驗嗎?
為什麼網站管理人要故意這樣「刷」?
很可能是他們發現:越新的內容排名越好。
這個「感覺」看來極可能正確。
文件屬性裡,有 3 種和排名有關的日期標記:
- 編碼的日期 bylineDate(工程師寫)
- 網址或標題的日期 syntacticDate(產文章的時候寫)
- 內容本體上的日期 semanticDate(隨時都可以打字寫)
Google 重視「新鮮」的內容。
專家 Mike King 歸納:你最好 3 種日期都保持一致,不要出現各種日期彼此矛盾的現象。
▋「要錢還是要命」的關鍵字有分數
要錢要命就是 Your Money Your Life,也就是和投資、醫療有關的主題。
文件的屬性有特別針對 YMYL 分類進行評分。
▋小網站的「遊玩難度」可能更高
在文件裡,專家有挖出一個標記叫「小型個人站(small personal site)」。
目前不知道為什麼要特別設計這標籤。
但合理推測,很可能是讓有這標記的網站,也就是小型個人站增加排名難度。
▋專家聲明
不管 Rand 或 Mike 都強調:「欸欸,連假週末趕工看上千份文件,做到這樣已經很硬了。」
所以不管是標籤、屬性、排名訊號的辨識或推論,都只是在相對粗淺的程度。
他們還需要更多時間去細細分析、歸納可能的排名效果。
現在先整理發布,是為了讓整個搜尋界看到更透明、清楚的資訊。
爆料的 Google(前任/現任)不具名人士也抱持著同樣的精神。
他們希望 Google 能為「自己公開說詞明顯違背內部文件」的矛盾狀況擔起責任。
Mike 也在社群表示:我覺得禮拜二早上醒來(和台灣有時差),Email 應該會看見一些「言重」的來信。
▋你該注意的優化事項、SEO 專家總結
如果你很重視 SEO,以下是我讀完兩篇分析長文之後,擷取下來的重點建議。
▍品牌,比其他一切都重要太多(Rand Fishkin)
已經有太多證據指出,Google 的排名傾向用心經營的品牌。
認真經營聲譽良好、有流量、被廣泛認可的品牌,是 Rand 給廣大行銷人的萬用建議。
▍對 Google 說詞抱著更深的懷疑(Mike King)
對貢獻搜尋界量多、至今仍抱持善良心境的 Rand 致上敬意。
▍創作高品質內容、認真推廣(Mike King)
「好內容造就高排名。」
這是搜尋引擎、外洩文件、SEO 專家們,基本上沒有疑義的地方。
Mike 說:「讀完文件可以明顯知道,創作高品質內容,然後妥善宣傳,從長期來看是最高勝率的贏家策略。」
▍測試、學習(Mike King)
別盡信 SEO 專家們的意見。
你應該抱持辯證、懷疑的態度,把你學到的知識親自實踐驗證。
只看其他人的分析,然後就深信這是「搜尋引擎運作原理」是遠遠不夠的。
摘錄自:
An Anonymous Source Shared Thousands of Leaked Google Search API Documents with Me; Everyone in SEO Should See Them – Rand Fishkin
Secrets from the Algorithm: Google Search’s Internal Engineering Documentation Has Leaked – Mike King
https://www.nownews.com/news/6438932
[ Google海量內部文件洩露!SEO搜尋黑盒子大解密 被質疑長期說謊 ]
日前多達2500頁Google內部文件遭到洩漏,海量文件曝光讓外界第一次有機會得窺Google SEO的法則,同時也驚訝地發現,許多內容竟跟Google長期以來所宣稱的原則相左。
日前多達2500頁Google內部文件遭到洩漏,海量文件曝光讓外界第一次有機會得窺Google SEO的法則,同時也驚訝地發現,許多內容竟跟Google長期以來所宣稱的原則相左。
根據《Verge》報導,在SEO領域工作了十多年的資深SEO專家菲什金(Rand Fishkin)表示,這些文件是來自一位Google內部的「吹哨者」,這位消息人士分享海量Google內部文件,就是為了讓外界能夠更了解Google SEO的原理,同時也戳破Google長期以來所宣稱的謊言。
菲什金整理出一些重點,質疑Google過去長期以來的說明並不符合事實。比如說,Google否認有使用Google Chrome瀏覽器數據來判斷搜尋排名,但在文件中卻有標記為「chromeInTotal」的排名屬性標籤。
對於菲什金透過這些洩露的內容來推測搜尋排名演算法的公式,Google則回應稱,「不要根據斷章取義、過時或不完整的資訊做出不準確的假設」。Google強調,已經大量和大眾分享搜尋排名系統的運作原則,不過公司也必須保護搜尋結果不會遭到有心人士操縱。