Googleの検索アルゴリズムの内幕が明らかになり、2,500ページに及ぶ文書が実名で流出！検索ランキングの嘘が暴露される-AI-php.cn

1. ユーザーのクリックデータの使用

Google の代表者は、ページのランク付けに Chrome データを使用していないと何度も述べていますが、流出した文書では、Chrome の検索でのサイトの表示方法に関するセクションで具体的に言及しています。

3. 深刻なトピックのホワイトリストを作成する

ホームページ

テクノロジー周辺機器

Googleの検索アルゴリズムの内幕が明らかになり、2,500ページに及ぶ文書が実名で流出！検索ランキングの嘘が暴露される

PHPz

Jun 11, 2024 am 09:14 AM

データ電車

最近、Google の内部文書 2,500 ページが流出し、「インターネットの最も強力な裁定者」である検索がどのように機能するかが明らかになりました。

SparkToro の共同創設者兼 CEO は匿名の人物で、個人ウェブサイトにブログ投稿を公開し、「匿名の人物が何千ページもの Google Search API ドキュメントの漏洩を私と SEO 関係者全員に共有してくれた。皆さんもぜひ見てください！」

Googleの検索アルゴリズムの内幕が明らかになり、2,500ページに及ぶ文書が実名で流出！検索ランキングの嘘が暴露される

長年にわたり、ランド・フィッシュキンはSEO（検索エンジン最適化、検索エンジン最適化）の分野でトップのスポークスマンを務めてきました。「ウェブサイトオーソリティ」（ドメイン評価）の概念は彼の提案です。

彼はこの分野で非常に尊敬されているため、ランド・フィッシュキンは当然のことながら、ニュースを発表する前にこの未知の匿名人物を慎重にチェックする必要がありました。

先週の金曜日、何度かメールを送った後、ランド・フィッシュキンは謎の男とビデオ通話をした、もちろん相手は顔を見せなかった。

Googleの検索アルゴリズムの内幕が明らかになり、2,500ページに及ぶ文書が実名で流出！検索ランキングの嘘が暴露される

この呼び出しにより、Rand は漏洩した文書についてさらに知ることができました。これは 2,500 ページを超える API 文書であり、14,014 のプロパティが含まれています。これらのプロパティは、Google の内部部分である「Content API Warehouse」に似ています。

ドキュメントのコミット履歴によると、コードは 2024 年 3 月 27 日に GitHub にアップロードされ、2024 年 5 月 7 日まで削除されませんでした。

電話の後、ランド氏は匿名の人物の職歴とマーケティング界の共通の知人を確認した。同氏は、リーク情報を共有し、「Google従業員が何年にもわたって広めてきた嘘の一部」に反論する記事を公開することで、Anonymousの期待に応えることにした。

Googleの検索アルゴリズムの内幕が明らかになり、2,500ページに及ぶ文書が実名で流出！検索ランキングの嘘が暴露される

Matt Cutts、Gary Ilyes、John Mueller は、Google が何年もクリックベースのユーザーデータをランキングに使用してきたことを否定しています

ランドの記事では、サンドボックス、クリックスルー率、滞在時間などについて語っています。それはSEO要素に影響を与えるが、Googleはこれまで強く否定してきた。

この記事が公開されるとすぐに、世論、特に SEO 界隈で大騒ぎを引き起こしました。

Googleの検索アルゴリズムの内幕が明らかになり、2,500ページに及ぶ文書が実名で流出！検索ランキングの嘘が暴露される

別のSEO専門家マイク・キングも、「Googleのアルゴリズムの秘密」を明らかにする記事を公開した。

Googleの検索アルゴリズムの内幕が明らかになり、2,500ページに及ぶ文書が実名で流出！検索ランキングの嘘が暴露される

マイク・キング氏は、「流出した文書には、Googleがどのようなデータを収集して使用しているか、Googleが選挙などの機密性の高いトピックを宣伝しているWebサイト、小規模Webサイトやその他のトピックをGoogleがどのように扱っているかなどが含まれている」と述べた。情報によると、Google は長年にわたり完全に真実を報告していない、「文書内の一部の情報は Google の代表者による公式声明と矛盾しているようです

」この爆発的な漏れ。

本当のオーナーは声を上げなかったが、代わりに以前匿名で情報を提供していた謎の人物が現れた。 5月28日、謎の男はついに名乗り出る決意をし、自身の身元を明かす動画を公開した。

彼の名前は Erfan Azimi で、SEO 実践者であり、EA Eagle Digital の創設者でもあります。

それで、Erfan Azimi によって提供された文書は Google 内部の「Content API Warehouse」からのものであるため、Google API Content Warehouse とは何なのか、そしてこの文書は正確に何を漏洩するのかを理解する必要があります。

Google で「ブラックボックス」を検索

Googleの検索アルゴリズムの内幕が明らかになり、2,500ページに及ぶ文書が実名で流出！検索ランキングの嘘が暴露される

このリークは GitHub から来ているようで、最も信頼できる説明は通話中に Erfan Azimi が Rand に語った内容と一致しています。ドキュメント内のリンクの多くがプライベート GitHub リポジトリや、特定の認証ログインを必要とする Google 企業 Web サイトの内部ページにつながっていたため、誤って一時的に公開されました。

2024 年 3 月から 5 月までの偶発的な公開期間中に、API ドキュメントは Hexdocs (インデックス付き公開 GitHub リポジトリ) に拡散され、そこで他の人によって発見され、拡散されました。

ランドを困惑させているのは、他の人もコピーを持っていると彼が確信していることですが、この暴露がなされるまで、この文書は公に議論されていませんでした。

元 Google 開発者によると、ほぼすべての Google チームは、プロジェクト担当者が利用可能なデータ要素に慣れるのに役立つ、さまざまな API プロパティとモジュールを説明するこのようなドキュメントを持っています。

この漏洩情報は、同じ表記スタイル、形式、さらにはプロセス/モジュール/関数の名前と参照を使用して、GitHub パブリックリポジトリおよび Google Cloud API ドキュメント内の他の情報と一致します。

「API コンテンツウェアハウス」というと専門用語のように聞こえますが、Google 検索エンジンチームのメンバー向けのガイドと考えることができます。

これは図書館の本のカタログのようなもので、Google は従業員にどのような本があり、どのように入手できるかを従業員に伝えるために使用しています。

しかし、違いは、図書館は公開されているのに対し、Google 検索は世界で最も謎めいて厳重に守られているブラックボックスの 1 つであるということです。過去 20 年以上にわたり、Google の検索部門からこれほどの規模または詳細な情報が漏洩したことはありません。

「漏洩」とは何ですか？

1. ユーザーのクリックデータの使用

ドキュメント内の一部のモジュールでは、「goodClicks」、「badClicks」、「lastLongestClicks」、インプレッション数、squashed、unsquashed、unicorn クリックおよびその他の機能について言及しています。これらはすべて Navboost と Glue に関連しており、Google の司法省の証言を読んだことがある人は、これら 2 つの用語に精通しているかもしれません。 Googleの検索アルゴリズムの内幕が明らかになり、2,500ページに及ぶ文書が実名で流出！検索ランキングの嘘が暴露される

以下は、司法省弁護士 Kenneth Dintzer による、検索品質チームの検索担当副社長である Pandu Nayak に対する反対尋問からの関連抜粋です:

Q. 念のために言っておきますが、Navboost の歴史は 2005 年に遡りますか?

A. この範囲内では、もしかしたらもっと早いかもしれません。

Q. アップデートされましたが、以前の Navboost ではなくなりましたか?

A.もうありません

Q.接着剤というものもありますよね？

A. グルーは、ページ上の他のすべての機能を含む Navboost の別名です。

Q.それについては後で話すつもりでしたが、今話してもいいでしょう。先ほど説明したように、Navboost は Web 結果を生成できますよね?

A.はい。

Q. Glue は、Web 結果ではないページ上のすべてのコンテンツも処理できますよね?

A そうです。

Q. 一緒に、最終的に検索結果ページに表示されるコンテンツの検索とランク付けに役立ちますか?

A そうです。はい、それらはすべてその兆候です。

この流出した API 文書は Nayak 氏の証言を裏付けており、Google のウェブサイト品質特許と一致しています。

Googleには、ランキングシステムにカウントされたくないクリックを除外し、カウントしたいクリックをランキングシステムに含める方法があるようです。

ポゴスティッキング (検索者が結果をクリックした後、見つけた答えに満足できずにすぐに戻るボタンをクリックすること) とインプレッションも測定しているようです。

2. Chrome のクリックストリームをコマンド化する

Google の代表者は、ページのランク付けに Chrome データを使用していないと何度も述べていますが、流出した文書では、Chrome の検索でのサイトの表示方法に関するセクションで具体的に言及しています。

この文書を漏洩した匿名の情報源は、Google は 2005 年の時点で数十億のインターネットユーザーの完全なクリックストリームを取得したいと考えており、Chrome ブラウザを通じてその望みを達成したと述べました。

API ドキュメントには、Google が Chrome を使用して個々のページとドメイン全体に関連するいくつかのカテゴリの指標を計算できることが示されています。

このドキュメントでは、Google がサイトリンク関連の機能をどのように作成するかについて紹介しますが、これは特に興味深いものです。

これは、topUrl と呼ばれる呼び出しを示しています。つまり、「最高の two_level_score、つまり chrome_trans_clicks を持つ上位 URL のリスト」です。

Google がこの Web ページを Chrome ブラウザで使用する可能性が高いと推測できます。クリック数を使用して、Web サイト上で最も人気のある URL または重要な URL を特定し、どの URL をサイトリンク機能に含めるべきかを計算します。

Google の検索結果では、ユーザーが最もよくアクセスするページが常に表示されます。これは、何十億もの Chrome ユーザーのクリックストリームを追跡することによって行われます。

もちろん、ネットユーザーはGoogleのこの行動に不満を持っています。

Googleの検索アルゴリズムの内幕が明らかになり、2,500ページに及ぶ文書が実名で流出！検索ランキングの嘘が暴露される

3. 深刻なトピックのホワイトリストを作成する

「Quality Travel Website」モジュールを通じてそのような推論を行うことは難しくありません - Google には旅行分野のホワイトリストがありますが、それが Google の「旅行」検索オプションに特化したものなのか、それともより広範なウェブ検索に向けたものなのかはまだ明らかではありません。

さらに、文書内で「isCovidLocalAuthority」（新しい王冠地方自治体）と「isElectionAuthority」（選挙当局）に関する複数の言及は、Googleが特定のドメイン名をホワイトリストに登録しており、これらのドメイン名がユーザーの検索に表示される可能性があることを示しています。議論の余地のある問題が最初に表示されます。

例えば、2020年の米国大統領選挙の後、ある候補者は票が盗まれたと証拠もなしに主張し、支持者たちに国会議事堂への襲撃を奨励しました。

Google はほぼ確実に、人々がこの事件に関する情報を検索する最初の場所の 1 つとなるでしょう。Google の検索エンジンが選挙の証拠を不正確に説明するプロパガンダサイトを返した場合、さらなる論争、暴力、さらには選挙の終焉に直接つながる可能性があります。アメリカの民主主義。

この観点からすると、ホワイトリストには実用的な意味があります。ランド・フィッシュキン氏は、「自由で公正な選挙の継続を望む我々は、この状況でホワイトリストを利用してくれたGoogleのエンジニアに非常に感謝すべきだ。」と述べた。Googleは長い間EWOKと呼ばれる品質評価プラットフォームを持っており、現在、一部のユーザーがそのような評価を行っているという証拠がある。品質評価者の要素は検索システムで使用されます。

ランドフィッシュキンは、EWOK 品質評価者によって生成されたスコアとデータが、単なる実験用のトレーニングセットではなく、Google の検索システムに直接参加する可能性があることに興味深いことに気づきました。

Googleの検索アルゴリズムの内幕が明らかになり、2,500ページに及ぶ文書が実名で流出！検索ランキングの嘘が暴露される

もちろん、これらは「単なるテスト用」である可能性がありますが、リークされたドキュメントを参照すると、これが真実である場合は、コメントとモジュールの詳細に明確に記載されていることがわかります。

そこに記載されている「各文書の適合性評価」はEWOKの評価によるものですが、詳細な説明はありませんが、ウェブサイトに対する人間の評価がいかに重要であるかは想像に難くありません。

このドキュメントでは、「人間による評価」(EWOK からのものなど) についても言及されており、それらは「通常、評価パイプラインにのみ入力される」と述べており、それらが主にこのモジュールのトレーニングデータである可能性があることを示唆しています。

しかし、ランドフィッシュキン氏は、これは依然として非常に重要な役割であり、マーケティング担当者は、Web サイトの適切な認識と評価にとって品質評価者がいかに重要であるかを無視すべきではないと考えています。

Googleの検索アルゴリズムの内幕が明らかになり、2,500ページに及ぶ文書が実名で流出！検索ランキングの嘘が暴露される

5. クリックデータを使用して重みを決定します

Google はリンクインデックスを 3 つのレベル (低品質、中品質、高品質) に分け、クリックデータを使用して Web サイトがどのレベルに属するかを決定します。

- サイトがクリックされなかった場合、そのサイトは低品質のインデックスに登録され、リンクは無視されます

- サイトが検証可能なデバイスから多くのクリックを獲得した場合、そのサイトは高品質のインデックスに登録されますそしてリンクはランキングシグナルを通過します

リンクがより高いレベルのインデックスに属しているために「信頼できる」リンクになると、PageRank やアンカーをフローしたり、スパムリンクシステムによってフィルタリング/削除されたりする可能性があります。

低品質のリンクインデックスからのリンクはサイトのランキングに影響を与えることはなく、無視されるだけです。

Google の検索アルゴリズムは、おそらくインターネット上で最も重要なシステムであり、さまざまな Web サイトの存続と消滅、そしてオンラインで何が表示されるかを決定します。

しかし、Web サイトを正確にどのようにランク付けするのかは長い間謎であり、ジャーナリスト、研究者、SEO に携わる人々は常にこのパズルの答えをつなぎ合わせています。

Google はこのリークについて沈黙を保っており、謎は永続しているようです。

しかし、今回は Google 史上最も深刻な漏洩であり、依然として亀裂が生じ、検索の仕組みについて人々に前例のない理解を与えました。

以上がGoogleの検索アルゴリズムの内幕が明らかになり、2,500ページに及ぶ文書が実名で流出！検索ランキングの嘘が暴露されるの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

ホットトピック

Java チュートリアル

1673

CakePHP チュートリアル

1429

Laravel チュートリアル

1333

PHP チュートリアル

1278

C# チュートリアル

1257

Related knowledge

ddrescue を使用して Linux 上のデータを回復する Mar 20, 2024 pm 01:37 PM

DDREASE は、ハードドライブ、SSD、RAM ディスク、CD、DVD、USB ストレージデバイスなどのファイルデバイスまたはブロックデバイスからデータを回復するためのツールです。あるブロックデバイスから別のブロックデバイスにデータをコピーし、破損したデータブロックを残して正常なデータブロックのみを移動します。 ddreasue は、回復操作中に干渉を必要としないため、完全に自動化された強力な回復ツールです。さらに、ddasue マップファイルのおかげでいつでも停止および再開できます。 DDREASE のその他の主要な機能は次のとおりです。リカバリされたデータは上書きされませんが、反復リカバリの場合にギャップが埋められます。ただし、ツールに明示的に指示されている場合は切り詰めることができます。複数のファイルまたはブロックから単一のファイルにデータを復元します

オープンソース！ゾーイデプスを超えて！ DepthFM: 高速かつ正確な単眼深度推定! Apr 03, 2024 pm 12:04 PM

0.この記事は何をするのですか?私たちは、多用途かつ高速な最先端の生成単眼深度推定モデルである DepthFM を提案します。従来の深度推定タスクに加えて、DepthFM は深度修復などの下流タスクでも最先端の機能を実証します。 DepthFM は効率的で、いくつかの推論ステップ内で深度マップを合成できます。この作品について一緒に読みましょう〜 1. 論文情報タイトル: DepthFM: FastMonocularDepthEstimationwithFlowMatching 著者: MingGui、JohannesS.Fischer、UlrichPrestel、PingchuanMa、Dmytr

Google は大喜び: JAX のパフォーマンスが Pytorch や TensorFlow を上回りました! GPU 推論トレーニングの最速の選択肢となる可能性があります Apr 01, 2024 pm 07:46 PM

Google が推進する JAX のパフォーマンスは、最近のベンチマークテストで Pytorch や TensorFlow のパフォーマンスを上回り、7 つの指標で 1 位にランクされました。また、テストは最高の JAX パフォーマンスを備えた TPU では行われませんでした。ただし、開発者の間では、依然として Tensorflow よりも Pytorch の方が人気があります。しかし、将来的には、おそらくより大規模なモデルが JAX プラットフォームに基づいてトレーニングされ、実行されるようになるでしょう。モデル最近、Keras チームは、ネイティブ PyTorch 実装を使用して 3 つのバックエンド (TensorFlow、JAX、PyTorch) をベンチマークし、TensorFlow を使用して Keras2 をベンチマークしました。まず、主流のセットを選択します

こんにちは、電気アトラスです！ボストン・ダイナミクスのロボットが復活、180度の奇妙な動きにマスク氏も恐怖 Apr 18, 2024 pm 07:58 PM

Boston Dynamics Atlas は正式に電動ロボットの時代に突入します!昨日、油圧式アトラスが歴史の舞台から「涙ながらに」撤退したばかりですが、今日、ボストン・ダイナミクスは電動式アトラスが稼働することを発表しました。ボストン・ダイナミクス社は商用人型ロボットの分野でテスラ社と競争する決意を持っているようだ。新しいビデオが公開されてから、わずか 10 時間ですでに 100 万人以上が視聴しました。古い人が去り、新しい役割が現れるのは歴史的な必然です。今年が人型ロボットの爆発的な年であることは間違いありません。ネットユーザーは「ロボットの進歩により、今年の開会式は人間のように見え、人間よりもはるかに自由度が高い。しかし、これは本当にホラー映画ではないのか？」とコメントした。ビデオの冒頭では、アトラスは仰向けに見えるように地面に静かに横たわっています。次に続くのは驚くべきことです

iPhoneのセルラーデータインターネット速度が遅い：修正 May 03, 2024 pm 09:01 PM

iPhone のモバイルデータ接続に遅延や遅い問題が発生していませんか?通常、携帯電話の携帯インターネットの強度は、地域、携帯ネットワークの種類、ローミングの種類などのいくつかの要因によって異なります。より高速で信頼性の高いセルラーインターネット接続を実現するためにできることがいくつかあります。解決策 1 – iPhone を強制的に再起動する場合によっては、デバイスを強制的に再起動すると、携帯電話接続を含む多くの機能がリセットされるだけです。ステップ 1 – 音量を上げるキーを 1 回押して放します。次に、音量小キーを押して、もう一度放します。ステップ 2 – プロセスの次の部分は、右側のボタンを押し続けることです。 iPhone の再起動が完了するまで待ちます。セルラーデータを有効にし、ネットワーク速度を確認します。もう一度確認してください修正 2 – データモードを変更する 5G はより優れたネットワーク速度を提供しますが、信号が弱い場合はより適切に機能します

テスラのロボットは工場で働く、マスク氏：手の自由度は今年22に達する！ May 06, 2024 pm 04:13 PM

テスラのロボット「オプティマス」の最新映像が公開され、すでに工場内で稼働可能となっている。通常の速度では、バッテリー（テスラの4680バッテリー）を次のように分類します：公式は、20倍の速度でどのように見えるかも公開しました - 小さな「ワークステーション」上で、ピッキング、ピッキング、ピッキング：今回は、それがリリースされたハイライトの1つビデオの内容は、オプティマスが工場内でこの作業を完全に自律的に行い、プロセス全体を通じて人間の介入なしに完了するというものです。そして、オプティマスの観点から見ると、自動エラー修正に重点を置いて、曲がったバッテリーを拾い上げたり配置したりすることもできます。オプティマスのハンドについては、NVIDIA の科学者ジムファン氏が高く評価しました。オプティマスのハンドは、世界の 5 本指ロボットの 1 つです。最も器用。その手は触覚だけではありません

Kuaishou バージョンの Sora「Ke Ling」がテスト用に公開されています。120 秒以上のビデオを生成し、物理学をより深く理解し、複雑な動きを正確にモデル化できます。 Jun 11, 2024 am 09:51 AM

何？ズートピアは国産AIによって実現するのか？ビデオとともに公開されたのは、「Keling」と呼ばれる新しい大規模な国産ビデオ生成モデルです。 Sora も同様の技術的ルートを使用し、自社開発の技術革新を多数組み合わせて、大きく合理的な動きをするだけでなく、物理世界の特性をシミュレートし、強力な概念的結合能力と想像力を備えたビデオを制作します。データによると、Keling は、最大 1080p の解像度で 30fps で最大 2 分の超長時間ビデオの生成をサポートし、複数のアスペクト比をサポートします。もう 1 つの重要な点は、Keling は研究所が公開したデモやビデオ結果のデモンストレーションではなく、ショートビデオ分野のリーダーである Kuaishou が立ち上げた製品レベルのアプリケーションであるということです。さらに、主な焦点は実用的であり、白紙小切手を書かず、リリースされたらすぐにオンラインに移行することです。Ke Ling の大型モデルは Kuaiying でリリースされました。

Alibaba 7B マルチモーダル文書理解の大規模モデルが新しい SOTA を獲得 Apr 02, 2024 am 11:31 AM

マルチモーダル文書理解機能のための新しい SOTA!アリババの mPLUG チームは、最新のオープンソース作品 mPLUG-DocOwl1.5 をリリースしました。これは、高解像度の画像テキスト認識、一般的な文書構造の理解、指示の遵守、外部知識の導入という 4 つの主要な課題に対処するための一連のソリューションを提案しています。さっそく、その効果を見てみましょう。複雑な構造のグラフをワンクリックで認識しMarkdown形式に変換：さまざまなスタイルのグラフが利用可能：より詳細な文字認識や位置決めも簡単に対応：文書理解の詳しい説明も可能：ご存知「文書理解」「」は現在、大規模な言語モデルの実装にとって重要なシナリオです。市場には文書の読み取りを支援する多くの製品が存在します。その中には、主にテキスト認識に OCR システムを使用し、テキスト処理に LLM と連携する製品もあります。

See all articles

Googleの検索アルゴリズムの内幕が明らかになり、2,500ページに及ぶ文書が実名で流出！検索ランキングの嘘が暴露される

Google で「ブラック ボックス」を検索

1. ユーザーのクリック データの使用

Google の代表者は、ページのランク付けに Chrome データを使用していないと何度も述べていますが、流出した文書では、Chrome の検索でのサイトの表示方法に関するセクションで具体的に言及しています。

3. 深刻なトピックのホワイトリストを作成する

ランド フィッシュキンは、EWOK 品質評価者によって生成されたスコアとデータが、単なる実験用のトレーニング セットではなく、Google の検索システムに直接参加する可能性があることに興味深いことに気づきました。

ホットAIツール

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

人気の記事

ホットツール

メモ帳++7.3.1

SublimeText3 中国語版

ゼンドスタジオ 13.0.1

ドリームウィーバー CS6

SublimeText3 Mac版

ホットトピック

Google で「ブラックボックス」を検索

1. ユーザーのクリックデータの使用

ランドフィッシュキンは、EWOK 品質評価者によって生成されたスコアとデータが、単なる実験用のトレーニングセットではなく、Google の検索システムに直接参加する可能性があることに興味深いことに気づきました。