html
Fapte despre semnalele de clic Google, clasamentele și SEO [dacă IE 9]> <link rel="stylesheet" href=" <![endif] Salt la conținut
- SEJ
- ⋅
- SEO
Click-urile ca semnal legat de clasare au fost subiect de dezbatere de peste douăzeci de ani, deși în prezent majoritatea SEO-urilor înțeleg că clicurile nu sunt un factor direct de clasare. Adevărul simplu despre clicuri este că acestea sunt date brute și, în mod surprinzător, procesate cu o oarecare similitudine cu scorurile evaluatorilor umani.
Clicurile sunt un semnal brut
Avizul memorandumului DOJ Antitrust din septembrie 2025 menționează clicurile drept „semnal brut” pe care Google îl folosește. De asemenea, clasifică conținutul, scorurile evaluatorilor umani și interogările de căutare ca semnale brute. Acest lucru este important deoarece un semnal brut este punctul de date de cel mai jos nivel. Semnalele brute sunt, în general, procesate în semnale de clasare de nivel superior sau utilizate pentru antrenarea unui model precum RankEmbed și succesorul său, RankEmbedBERT.
Acestea sunt considerate semnale brute deoarece sunt:
- Direct observat
- Dar încă nu a fost interpretat sau folosit pentru datele de antrenament
Documentul DOJ îl citează pe profesorul James Allan, care a depus mărturie de specialitate în numele Google:
„Semnalele variază în ceea ce privește complexitatea. Există semnale „brute”, cum ar fi numărul de clicuri, conținutul unei pagini web și termenii dintr-o interogare.
…Aceste semnale pot fi create cu metode simple, cum ar fi numărarea aparițiilor (de exemplu, de câte ori s-a făcut clic pe o pagină web ca răspuns la o anumită interogare). Id. la 2859:3–2860:21 (Allan) (discutând semnalul Navboost) „
Apoi contrastează semnalele brute cu semnalele „la celălalt capăt al spectrului”:
„La celălalt capăt al spectrului se află modele inovatoare de învățare profundă, care sunt modele de învățare automată care discern modele complexe în seturi mari de date.
Modelele profunde găsesc și exploatează modele în seturi vaste de date. Ele adaugă capacități unice la costuri ridicate.”
Profesorul Allan explică că „semnalele de nivel superior” sunt folosite pentru a produce scorurile „finale” pentru o pagină web, inclusiv popularitatea și calitatea.
Semnalele brute sunt date care urmează să fie procesate în continuare
Navboost este menționat de mai multe ori în documentul antitrust din septembrie 2025 ca date de popularitate. Nu este menționat în contextul clicurilor care au un efect de clasare pe site-uri individuale.
Este denumită o modalitate de a măsura popularitatea și intenția:
„…popularitatea măsurată prin intenția utilizatorului și sistemele de feedback, inclusiv Navboost/Glue…”
Și în altă parte, în contextul explicării de ce unele dintre datele Navboost sunt privilegiate:
„Sunt „popularitatea măsurată prin intenția utilizatorului și sistemele de feedback, inclusiv Navboost/Glue”…”
În contextul explicării de ce unele dintre datele Navboost sunt privilegiate:
„În conformitate cu remedierea propusă, Google trebuie să pună la dispoziția concurenților calificați... următoarele seturi de date:
1. Datele utilizatorului utilizate pentru a construi, crea sau opera modelele statistice GLUE;
2. Datele utilizatorului utilizate pentru antrenamentul, construirea sau operarea modelelor RankEmbed; şi
3. Datele utilizatorului utilizate ca date de antrenament pentru modelele GenAI utilizate în Căutare sau orice produs GenAI care poate fi folosit pentru a accesa Căutare.
Google folosește primele două seturi de date pentru a construi semnale de căutare, iar al treilea pentru a antrena și a perfecționa modelele care stau la baza Prezentărilor generale AI și (probabil) aplicației Gemini.”
Clicurile, cum ar fi scorurile evaluatorilor umani, sunt doar un semnal brut care este utilizat mai departe în lanțul algoritmului (de exemplu, pentru a antrena modele AI) pentru a îmbunătăți potrivirea paginilor web cu interogările sau pentru a genera un semnal de calitate sau relevanță care este apoi adăugat la restul semnalelor de clasare utilizate de un motor de clasare sau un motor de modificare a rangului.
Cum sunt utilizate de obicei semnalele brute
70 de zile de jurnal de căutare
Documentul DOJ face referire la utilizarea jurnalelor de căutare a 70 de zile. Dar acestea sunt doar unsprezece cuvinte într-un context mai larg.
Iată partea care este frecvent citată:
„70 de zile de jurnalele de căutare plus scorurile generate de evaluatorii umani”
Am înțeles, este simplu și direct. Dar există mai mult context:
„RankEmbed și iterația sa ulterioară RankEmbedBERT sunt modele de clasare care se bazează pe două surse principale de date: [Exprimat]% din 70 de zile de jurnalele de căutare plus scorurile generate de evaluatorii umani și utilizate de Google pentru a măsura calitatea rezultatelor căutării organice.”
Cele 70 de zile ale jurnalelor de căutare nu sunt date despre clicuri utilizate în scopuri de clasare în Google, Modul AI sau Gemini. Datele agregate sunt procesate în continuare pentru a pregăti modele specializate de IA, cum ar fi RankEmbedBERT, care, la rândul lor, clasează paginile web pe baza analizei limbajului natural.
Partea respectivă a documentului DOJ nu pretinde că Google utilizează în mod direct datele de clic pentru clasarea rezultatelor căutării. Datele, cum ar fi datele evaluatorului uman, sunt folosite de alte sisteme pentru datele de antrenament sau pentru a fi prelucrate în continuare.
Ce este RankEmbed de la Google?
RankEmbed este o abordare în limbaj natural pentru identificarea documentelor relevante și clasarea acestora.
Același document DOJ explică:
"Modelul RankEmbed în sine este un sistem de învățare profundă bazat pe inteligență artificială, care are o înțelegere puternică a limbajului natural. Acest lucru permite modelului să identifice mai eficient cele mai bune documente de preluat, chiar dacă unei interogări îi lipsesc anumiți termeni."
Este antrenat pe mai puține date decât modelele anterioare. Datele constau parțial din termeni de interogare și perechi de pagini web:
„...RankEmbed este antrenat pe 1/100 din datele utilizate pentru a antrena modele de clasare anterioare, dar oferă rezultate de căutare de calitate superioară.
… Printre datele de instruire subiacente se numără informații despre interogare, inclusiv termenii importanți pe care Google i-a derivat din interogare și paginile web rezultate.”
Acestea sunt date de instruire pentru formarea unui model pentru a recunoaște modul în care termenii de interogare sunt relevanți pentru paginile web.
Același document explică:
„Datele care stau la baza modelelor RankEmbed sunt o combinație de date de clic și interogare și scorul paginilor web de către evaluatorii umani.”
Este foarte clar că, în contextul acestui pasaj specific, descrie utilizarea datelor de clic (și a datelor de evaluator uman) pentru a antrena modele AI, nu pentru a influența direct clasamentele.
Dar patentul Google pentru clasarea clicurilor?
În 2006, Google a depus un brevet legat de clicuri numit, Modificarea clasării rezultatelor căutării pe baza feedback-ului implicit al utilizatorilor . Invenția se referă la formula matematică pentru crearea unei „măsuri a relevanței” din datele brute agregate ale clicurilor (plural).
Brevetul distinge între crearea semnalului și actul de clasare în sine. „Măsura relevanței” este transmisă unui motor de clasare, care apoi o poate adăuga la scorurile de clasare existente pentru a clasa rezultatele căutării pentru căutări noi.
Iată ce descrie brevetul:
„Un subsistem de clasare poate include un motor de modificare a rangului care utilizează feedbackul implicit al utilizatorului pentru a determina re-clasificarea rezultatelor căutării pentru a îmbunătăți clasarea finală prezentată unui utilizator al unui sistem de regăsire a informațiilor.
Selecțiile utilizatorilor de rezultatele căutării (datele de clic) pot fi urmărite și transformate într-o fracțiune de clic care poate fi folosită pentru a re-clasifica rezultatele căutării viitoare.”
Acea „fracție de clic” este o măsură a relevanței. Invenția descrisă în brevet nu se referă la urmărirea clicului; este vorba despre măsura matematică (fracția de clic) care rezultă din combinarea tuturor clicurilor individuale împreună. Aceasta include clicul scurt, clicul mediu, clicul lung și ultimul clic.
Din punct de vedere tehnic, se numește fracțiunea LCIC (Clic lung împărțit la clicuri). Este „clicuri” la plural, deoarece ia decizii bazate pe sumele mai multor clicuri (agregate), nu pe clicul individual.
Fracția de clic este un agregat deoarece:
- Însumare: „Primul număr” utilizat pentru clasare este suma tuturor clicurilor individuale ponderate pentru o anumită pereche interogare-document.
- Normalizare: Acesta ia acea sumă și o împarte la numărul total al tuturor clicurilor („al doilea număr”).
- Netezire statistică: Sistemul aplică „factori de netezire” acestui număr agregat pentru a se asigura că un singur clic pe o interogare „rară” nu deformează în mod nedrept rezultatele, în special pentru spammeri.
Acel brevet din 2006 descrie formula sa de ponderare astfel:
„O fracție de clic LCC de bază poate fi definită ca:
LCC_BASE=[#WC(Q,D)]/[#C(Q,D)+S0)
unde iWC(Q.D) este suma clicurilor ponderate pentru o pereche URL de interogare, iC(Q.D) este numărul total de clicuri (număr ordinal, neponderat) pentru perechea interogare-adresă URL, iar S0 este un factor de netezire.”
Această formulă descrie însumarea și împărțirea datelor de la mulți utilizatori pentru a crea un singur scor pentru un document. Perechea „interogare-URL” este o „găleată” de date care stochează comportamentul de clic al fiecărui utilizator care a introdus vreodată acea interogare specifică și a dat clic pe acel rezultat de căutare specific. Factorul de netezire este partea anti-spam care include necontorizarea clicurilor unice pe interogările de căutare rare.
Chiar și în 2006, clicurile sunt doar date brute care sunt transformate mai în sus în lanț în mai multe etape de agregare, într-o măsură statistică a relevanței înainte de a ajunge vreodată la etapa de clasare. În acest brevet, clicurile în sine nu sunt factori de clasare care influențează direct dacă un site este clasat sau nu. Acestea au fost utilizate în agregat ca măsură a relevanței, care, la rândul său, a fost alimentată într-un alt motor pentru clasare.
Categorie Știri SEO Google Brevete și lucrări de cercetare Citiți biografia completă SEJ STAFF Roger Montti Proprietar - Martinibuster.com la Martinibuster.com #looop_parentSursa: Jurnalul motorului de căutare


