Google 演算法黑盒子

Google 演算法黑盒子

Google 機密文件外洩,搜尋專家開撕演算法黑盒子】
── 2,500 份技術文件、14,014 個排名屬性,匿名 Google 員工爆料

有個退出 SEO 界 6 年,卻始終引領 SEO 潮流的男人,名叫 Rand Fishkin。

Rand 曾鑽研出各種搜尋技巧、排名概念:

  • 網站權重(DA)
  • 10x 十倍內容法
  • 子網域、子資料夾的明顯優勢
  • 現場展示「點擊」對「排名」的直接影響

    還有無數深度文章、影片、分析工具等。

    但 Google 卻一再貶損他的心血結晶。

    包含宣稱從不使用任何「點擊、權重」作為排名依據,點擊率全是胡說八道等等⋯⋯

    雖然 Rand 已退出多年,但他對搜尋界的貢獻,甚至連 Google 員工都高度認可。

    所以,爆料人指定把資料流傳給 Rand、由 Rand 來分析和處置。

    資料內容是上千份機密技術文件、裡面有無數條編碼。

    爆料者指出這些文件來自 Google 搜尋內部,而且經過多名員工確認「有料」。

    Rand 又委託知名的技術面 SEO 專家 Mike King,花了整個連假週末時間梳理。

    他們寫出分別 7,000、5,000 字的「初步」分析,才剛釋出。

    ▋Google 的謊言、還 Rand 清白

    這些外洩內容,對於「廣泛行銷」的人來說可能不太緊要:「不是本來就這樣嗎?」

    但對 SEO 專家可是天差地別。

    確認一項操作「到底能否對 SEO 有效」,可分成 3 種面向:
  1. Google 官方說詞
  2. 權威 SEO 專家研究
  3. 實戰測試、各家觀點

    當 1 和 2 衝突的時候,就麻煩大了。

    如果只是小規模「優化」,你可以憑感覺。有效做做看、沒效就放棄。

    但言論或研究能影響上千、上萬行銷人,甚至整個搜尋品質時,事態就嚴重多了。

    Rand 當時就站在搜尋界的頂峰,他提出的許多猜想、意見,直到現在才被一一證實。

    Google 當時多次透過公開言論,大力否認 Rand 的研究。

    而這波外洩資料有極清楚的標籤,證明 Rand 驚人的分析能力和遠見。

    例如 Google 多次否認使用「Chrome 瀏覽器點擊數據」幫助搜尋。

    而內部資料卻有全然相反的線索。

    Rand 也因此承受多年冤屈、遭受各界撻伐。

    ▋14,014 個排名屬性

    文件當中揭露出超過 1 萬 4 千個排名屬性標籤(attribute)。

    有這些標記不代表搜尋引擎就 100% 會使用它們判斷排名。

    但這可信程度已經比「研究 Google 專利、聽信 Google 說詞」還要來得強大。

    從這些繁雜的資料裡,Rand 和 Mike 花了整個週末的時間,就已經推測出驚人資訊量。

    但剩下的,還需要交給其他專家去挖掘。

    以下,是 Google 並未承認(甚至否認),但演算法機密文件釋出後幾乎確定的「部分」項目。

    ▋網站權重

    Google 多次否認,說他們從來不用「網站權重」或類似東西。

    但文件裡卻有這明顯標記:「siteAuthority」(站的權重)

    網站權重(Domain Authority)剛好和 Rand 創辦公司所研發出的知名指標同名。

    所以 Google 就借用這樣的「雙關」說:「沒有欸,我們根本不用『DA』。」

    雖然能理解 Google 是為了避免有心人濫用搜尋演算法、操縱排名,所以蓄意不承認部分的排名機制,但這種誤導對 Rand 本人和他的名譽傷害很大。

    從這次機密文件裡,幾乎可以定調「Google 在說謊」。

    Google「有」衡量網站權重的機制。

    ▋搜尋沙盒(剛註冊,先關 SEO 小黑屋)

    沙盒(sandbox),簡單來說就是「關進小黑屋」。

    你現在如果去新創個全新網站,排名要等很久才會開始有訊號。

    相比之下,你如果在已經註冊好的舊網域經營,排名會快很多。

    Google 的搜尋分析師 John Mueller 曾直截了當的說:「我們沒有沙盒!」

    外洩文件的標籤卻清楚寫著「hostAge」,也就是註冊年份。

    這是為了要延緩可能被拿來濫用的全新站,讓它們晚一點才能「出關」。

    ▋使用 Chrome 瀏覽器的數據判斷排名

    這其實算公開認證的資訊了。

    在 2023 年底的反托拉斯法官司當中,美國司法部(DOJ)要求 Google 交出的簡報裡面,就被挖到有機密文件指出使用者點擊資訊「會直接」影響排名。

    這次的文件更明顯。

    標籤名稱叫做「chromeInTotal」,Chrome 的總時長。

    基本上用力打臉前搜尋分析師 Matt Cutts 和現任分析師 John Muller。

    他們兩位都曾代表 Google「大力否認」有用任何相關的資訊來判斷排名。

    ▋連結優先度

    簡單來說,越容易被點擊的連結,它能傳遞的排名訊號就越強。

    這件事,我自己印象最深刻的是從黑帽 SEO 專家 Jerry 聽到。

    他用「肉身實測」就推測「越容易被按的連結,排名提升效果越好」。

    文件上有資訊指出:字體越大的連結,作用就傾向越高。

    (備註寫著:連結文字的平均字體大小)

    Google 還有「連結的 3 種層級」:

    低品質、中品質、高品質。

    使用者的點擊數據也會作為連結品質的判定依據。

    合理推測,常被點的連結當然要給予更高權重。

    ▋日期超級重要

    你在搜尋的時候,有看過那種「每天都顯示剛剛更新,點進去卻是超級舊文」的經驗嗎?

    為什麼網站管理人要故意這樣「刷」?

    很可能是他們發現:越新的內容排名越好。

    這個「感覺」看來極可能正確。

    文件屬性裡,有 3 種和排名有關的日期標記:
  4. 編碼的日期 bylineDate(工程師寫)
  5. 網址或標題的日期 syntacticDate(產文章的時候寫)
  6. 內容本體上的日期 semanticDate(隨時都可以打字寫)

    Google 重視「新鮮」的內容。

    專家 Mike King 歸納:你最好 3 種日期都保持一致,不要出現各種日期彼此矛盾的現象。

    ▋「要錢還是要命」的關鍵字有分數

    要錢要命就是 Your Money Your Life,也就是和投資、醫療有關的主題。

    文件的屬性有特別針對 YMYL 分類進行評分。

    ▋小網站的「遊玩難度」可能更高

    在文件裡,專家有挖出一個標記叫「小型個人站(small personal site)」。

    目前不知道為什麼要特別設計這標籤。

    但合理推測,很可能是讓有這標記的網站,也就是小型個人站增加排名難度。

    ▋專家聲明

    不管 Rand 或 Mike 都強調:「欸欸,連假週末趕工看上千份文件,做到這樣已經很硬了。」

    所以不管是標籤、屬性、排名訊號的辨識或推論,都只是在相對粗淺的程度。

    他們還需要更多時間去細細分析、歸納可能的排名效果。

    現在先整理發布,是為了讓整個搜尋界看到更透明、清楚的資訊。

    爆料的 Google(前任/現任)不具名人士也抱持著同樣的精神。

    他們希望 Google 能為「自己公開說詞明顯違背內部文件」的矛盾狀況擔起責任。

    Mike 也在社群表示:我覺得禮拜二早上醒來(和台灣有時差),Email 應該會看見一些「言重」的來信。

    ▋你該注意的優化事項、SEO 專家總結

    如果你很重視 SEO,以下是我讀完兩篇分析長文之後,擷取下來的重點建議。

    ▍品牌,比其他一切都重要太多(Rand Fishkin)

    已經有太多證據指出,Google 的排名傾向用心經營的品牌。

    認真經營聲譽良好、有流量、被廣泛認可的品牌,是 Rand 給廣大行銷人的萬用建議。

    ▍對 Google 說詞抱著更深的懷疑(Mike King)

    對貢獻搜尋界量多、至今仍抱持善良心境的 Rand 致上敬意。

    ▍創作高品質內容、認真推廣(Mike King)

    「好內容造就高排名。」

    這是搜尋引擎、外洩文件、SEO 專家們,基本上沒有疑義的地方。

    Mike 說:「讀完文件可以明顯知道,創作高品質內容,然後妥善宣傳,從長期來看是最高勝率的贏家策略。」

    ▍測試、學習(Mike King)

    別盡信 SEO 專家們的意見。

    你應該抱持辯證、懷疑的態度,把你學到的知識親自實踐驗證。

    只看其他人的分析,然後就深信這是「搜尋引擎運作原理」是遠遠不夠的。

摘錄自:

An Anonymous Source Shared Thousands of Leaked Google Search API Documents with Me; Everyone in SEO Should See Them – Rand Fishkin

Secrets from the Algorithm: Google Search’s Internal Engineering Documentation Has Leaked – Mike King

https://www.nownews.com/news/6438932

[ Google海量內部文件洩露!SEO搜尋黑盒子大解密 被質疑長期說謊 ]

日前多達2500頁Google內部文件遭到洩漏,海量文件曝光讓外界第一次有機會得窺Google SEO的法則,同時也驚訝地發現,許多內容竟跟Google長期以來所宣稱的原則相左。

日前多達2500頁Google內部文件遭到洩漏,海量文件曝光讓外界第一次有機會得窺Google SEO的法則,同時也驚訝地發現,許多內容竟跟Google長期以來所宣稱的原則相左。

根據《Verge》報導,在SEO領域工作了十多年的資深SEO專家菲什金(Rand Fishkin)表示,這些文件是來自一位Google內部的「吹哨者」,這位消息人士分享海量Google內部文件,就是為了讓外界能夠更了解Google SEO的原理,同時也戳破Google長期以來所宣稱的謊言。

菲什金整理出一些重點,質疑Google過去長期以來的說明並不符合事實。比如說,Google否認有使用Google Chrome瀏覽器數據來判斷搜尋排名,但在文件中卻有標記為「chromeInTotal」的排名屬性標籤。

對於菲什金透過這些洩露的內容來推測搜尋排名演算法的公式,Google則回應稱,「不要根據斷章取義、過時或不完整的資訊做出不準確的假設」。Google強調,已經大量和大眾分享搜尋排名系統的運作原則,不過公司也必須保護搜尋結果不會遭到有心人士操縱。

A Google documentary | Trillions of questions, no easy answers
谷歌紀錄片 |數萬億個問題,沒有簡單的答案


這部Google紀錄片從一個佈滿灰塵的地下室開始,裡面放著一箱箱舊鏡頭,就像一部典型的家庭電影。 2019 年的一些對話、對資料中心的實地考察以及後來在五金店的意外停留,這些都匯集了一個故事——我們的故事。就像所有家庭電影一樣,很可能唯一會被它迷住的人就是裡面的人。但是,如果您曾經想知道搜尋是如何運作的,或者好奇地了解幕後發生的事情,這裡可能也有適合您的東西。