Înapoi la Blog

Urmărirea citațiilor Bing AI, paginile de pornire și paginile ascunse HTTP cad sub limita de accesare cu crawlere – SEO Pulse

Urmărirea citațiilor Bing AI, paginile de pornire și paginile ascunse HTTP cad sub limita de accesare cu crawlere – SEO Pulse

SEO Pulse
Bun venit la Pulse for SEO din săptămâna: actualizările acoperă modul în care urmăriți vizibilitatea AI, modul în care o pagină fantomă vă poate sparge numele site-ului în rezultatele căutării și ce dezvăluie noile date de accesare cu crawlere despre limitele de dimensiune a fișierelor Googlebot.
Iată ce contează pentru tine și munca ta.
Bing Webmaster Tools adaugă AI Citation Dashboard
Microsoft a introdus un tablou de bord AI Performance în Bing Webmaster Tools, oferind editorilor vizibilitate cu privire la frecvența cu care conținutul lor este citat în Copilot și răspunsurile generate de AI. Funcția este acum în previzualizare publică.
Date cheie:
Tabloul de bord urmărește numărul total de citări, numărul mediu de pagini citate pe zi, activitatea de citare la nivel de pagină și interogările de bază. Interogările de bază arată expresiile folosite de AI la preluarea conținutului pentru răspunsuri.
Bing oferă acum un tablou de bord dedicat pentru vizibilitatea citărilor AI. Google include Prezentări generale AI și activitatea în modul AI în raportarea generală a performanței Search Console, dar nu dezvăluie un raport separat și nu furnizează numere de adrese URL în stil citat. Prezentările generale AI atribuie, de asemenea, toate paginile conectate la o singură poziție, ceea ce limitează ceea ce puteți afla despre performanța paginii individuale în răspunsurile AI.
Tabloul de bord Bing merge mai departe, urmărind ce pagini sunt citate, cât de des și ce fraze au declanșat citarea. Piesa care lipsește este datele clicului. Tabloul de bord arată când este citat conținutul dvs., dar nu dacă acele citate generează trafic.
Acum puteți confirma la ce pagini se face referire în răspunsurile AI și puteți identifica modele în interogările de bază, dar conectarea vizibilității AI la rezultatele afacerii necesită în continuare combinarea acestor date cu propriile analize.
Ce spun profesioniștii SEO
Wil Reynolds, fondatorul Seer Interactive, a sărbătorit caracteristica pe X și s-a concentrat pe noile date privind interogările de bază:
Koray Tuğberk GÜBÜR, fondatorul Holistic SEO & Digital, a comparat-o direct cu instrumentele Google pe X:
Fabrice Canel, director de produs principal la Microsoft Bing, a încadrat lansarea pe X ca o punte între optimizarea tradițională și cea bazată pe inteligență artificială:
"Editorii pot vedea acum cum apare conținutul lor în era AI. GEO întâlnește SEO, alimentează-ți strategia cu semnale reale."
Reacția pe rețelele sociale s-a centrat pe o frustrare comună. Acestea sunt datele pe care le-au cerut practicienii, dar provin de la Bing mai degrabă decât de la Google. Mai multe persoane și-au exprimat speranța că Google și OpenAI vor urma cu raportări comparabile.
Citiți acoperirea noastră completă: Bing Webmaster Tools adaugă date despre performanța citațiilor AI
Pagina de pornire HTTP ascunsă vă poate sparge numele site-ului în Google
John Mueller de la Google a împărtășit un caz de depanare pe Bluesky în care o pagină de pornire HTTP rămasă a cauzat probleme neașteptate cu numele site-ului și favicon-ul în rezultatele căutării. Problema este ușor de ratat, deoarece Chrome poate actualiza automat solicitările HTTP la HTTPS, ascunzând pagina problematică de navigarea normală.
Site-ul folosea HTTPS, dar o pagină de pornire HTTP implicită a serverului era încă accesibilă. Actualizarea automată a Chrome a însemnat că editorul nu a văzut niciodată versiunea HTTP, dar Googlebot nu urmărește comportamentul de actualizare al Chrome, așa că Googlebot a scos de pe pagina greșită.
Acesta este genul de problemă pe care nu l-ați găsi într-un audit standard de site, deoarece browserul dvs. nu o afișează niciodată. Dacă numele site-ului sau favicon-ul din rezultatele căutării nu corespunde cu ceea ce vă așteptați, iar pagina dvs. de pornire HTTPS pare corectă, merită verificată versiunea HTTP a domeniului dvs.
Mueller a sugerat să ruleze curl din linia de comandă pentru a vedea răspunsul HTTP brut fără actualizarea automată a Chrome. Dacă returnează o pagină implicită de server în loc de pagina dvs. de pornire reală, aceasta este sursa problemei. De asemenea, puteți utiliza instrumentul de inspecție URL din Search Console cu un test live pentru a vedea ce a preluat și a randat Google.
Documentația Google privind numele site-urilor menționează în mod specific paginile de pornire duplicate, inclusiv versiunile HTTP și HTTPS și recomandă utilizarea acelorași date structurate pentru ambele. Cazul lui Mueller arată ce se întâmplă atunci când o versiune HTTP conține conținut diferit de pagina de pornire HTTPS pe care ați vrut-o.
Ce spun oamenii
Mueller a descris cazul de pe Bluesky ca fiind „unul ciudat”, menționând că problema principală este invizibilă în navigarea normală:
Cazul evidențiază un model în care funcțiile browserului ascund adesea ceea ce văd crawlerele. Printre exemple se numără actualizarea automată a Chrome, modurile de citire, redarea pe partea clientului și conținutul JavaScript. Pentru a depana problemele legate de numele site-ului și favicon-ul, verificați direct răspunsul serverului, nu doar încărcările browserului.
Citiți acoperirea noastră completă: Pagina HTTP ascunsă poate cauza probleme cu numele site-ului în Google
Date noi arată că majoritatea paginilor se încadrează bine în limita de accesare cu crawlere a Googlebot
O nouă cercetare bazată pe pagini web din lumea reală sugerează că majoritatea paginilor se află mult sub limita de preluare de 2 MB a Googlebot. Datele, analizate de Roger Montti de la Search Engine Journal, se bazează pe măsurătorile HTTP Archive pentru a pune problema privind limita de accesare cu crawlere în context practic.
Datele HTTP Archive sugerează că majoritatea paginilor sunt cu mult sub 2 MB. Google a clarificat recent în documentația actualizată că limita Googlebot pentru tipurile de fișiere acceptate este de 2 MB, în timp ce PDF-urile primesc o limită de 64 MB.
Întrebarea privind limita de accesare cu crawlere a circulat în discuțiile tehnice SEO, în special după ce Google și-a actualizat documentația Googlebot la începutul acestei luni.
Noile date răspund la întrebarea practică pe care documentația singură nu ar putea-o. Limita de 2 MB contează pentru paginile dvs.? Pentru majoritatea site-urilor, răspunsul este nu. Paginile web standard, chiar și cele cu conținut intens, rareori se apropie de acest prag.
Acolo unde ar putea conta limita este în paginile cu marcaje extrem de umflate, scripturi inline sau date încorporate care măresc dimensiunea HTML dincolo de intervalele obișnuite.
Modelul mai larg aici este Google care își face sistemele de crawling mai transparente. Mutarea documentației pe un site de accesare cu crawlere autonom, clarificarea limitelor care se aplică pentru care crawler-uri și acum având date din lumea reală pentru a valida acele limite oferă o imagine mai clară a ceea ce Googlebot gestionează.
Ce spun profesioniștii tehnici SEO
Dave Smart, consultant tehnic SEO la Tame the Bots și expert în produse de diamante din Centrul de căutare Google, a pus cifrele în perspectivă într-o postare pe LinkedIn:
Smart a continuat prin actualizarea instrumentului său de preluare și redare Tame the Bots pentru a simula limita. Într-o postare Bluesky, el a adăugat o avertizare cu privire la riscul practic:
John Mueller de la Google a aprobat instrumentul pe Bluesky, scriind:
Mueller a împărtășit și date Web Almanac pe Reddit pentru a pune limita în context:
Roger Montti, scriind pentru Search Engine Journal, a ajuns la o concluzie similară după ce a analizat datele HTTP Archive. Montti a remarcat că datele bazate pe site-uri web reale arată că majoritatea site-urilor sunt cu mult sub limită și a numit „sigur să spunem că este în regulă să eliminați dimensiunea HTML din lista de lucruri de care să vă faceți griji SEO”.
Citiți acoperirea noastră completă: Date noi arată că limita de accesare cu crawlere de 2 MB a Googlebot este suficientă
Tema săptămânii: Decalajul de diagnostic
Fiecare poveste din această săptămână indică ceva ce practicanții nu au putut vedea înainte sau au verificat în mod greșit.
Tabloul de bord pentru citarea AI al Bing umple un gol de măsurare care a existat de când răspunsurile AI au început să citeze conținutul site-ului. Cazul paginii de pornire HTTP a lui Mueller dezvăluie o pagină invizibilă pe care auditurile standard ale site-urilor și verificările browserului ar rata-o complet, deoarece Chrome o ascunde. Și limita de accesare cu crawlere a datelor Googlebot răspunde la o întrebare pe care actualizările documentației au ridicat-o, dar nu au putut-o rezolva singure.
Firul de legătură nu este că acestea sunt probleme noi. Citările AI au avut loc fără instrumente de măsurare. Paginile Ghost HTTP au încurcat sistemele de nume ale site-urilor de când Google a introdus această caracteristică. Și limitele de accesare cu crawlere au fost enumerate în documentele Google de ani de zile fără validare în lumea reală. Ceea ce s-a schimbat în această săptămână este că fiecare decalaj a primit un diagnostic concret: un tablou de bord, o comandă curl și un set de date.
Rezultatul este că instrumentele și datele pentru înțelegerea modului în care motoarele de căutare interacționează cu conținutul dvs. devin mai specifice. Provocarea este să știi unde să cauți.
Mai multe resurse:
Google actualizează Googlebot File Size Limit Docs
LinkedIn împărtășește ceea ce funcționează pentru vizibilitatea căutării AI
Google arată cum să verificați indexarea pasajelor
Imagine prezentată: Accogliente Design/Shutterstock
Categoria SEO SEO Pulse
Citiți biografia completă SEJ STAFF Matt G. Southern Senior Scriitor de știri la Search Engine Journal
Matt G. Southern, redactor senior de știri, face parte din Search Engine Journal din 2013. Cu o diplomă de licență în comunicații, ...
#looop_parent
Sursa: Jurnalul motorului de căutare

Author Avatar

kiper

This is a short author bio. It can be stored in the 'users' table in the future. Lorem ipsum dolor sit amet, consectetur adipiscing elit.