Google a publicat o lucrare de cercetare despre crearea unui set de date provocator pentru antrenarea agenților AI pentru cercetare profundă. Lucrarea oferă perspective asupra modului în care funcționează cercetarea profundă a AI agentică, ceea ce implică perspective pentru optimizarea conținutului.
Acronimul SAGE înseamnă Steerable Agentic Data Generation for Deep Search with Execution Feedback.
Perechi sintetice de întrebări și răspunsuri
Cercetătorii au remarcat că seturile de date anterioare de formare AI de ultimă generație (cum ar fi Musique și HotpotQA) au necesitat nu mai mult de patru pași de raționament pentru a răspunde la întrebări. În ceea ce privește numărul de căutări necesare pentru a răspunde la o întrebare, Musique are o medie de 2,7 căutări per întrebare, iar HotpotQA a avut o medie de 2,1 căutări. Un alt set de date folosit în mod obișnuit, numit Natural Questions (NQ) a necesitat doar o medie de 1,3 căutări per întrebare.
Aceste seturi de date care sunt folosite pentru a instrui agenții AI au creat un decalaj de instruire pentru sarcinile de căutare profunde care necesitau mai mulți pași de raționament și un număr mai mare de căutări. Cum puteți antrena un agent AI pentru sarcini complexe de căutare profundă din lumea reală dacă agenții AI nu au fost instruiți să abordeze întrebări cu adevărat dificile.
Cercetătorii au creat un sistem numit SAGE care generează automat perechi întrebări-răspuns complexe de înaltă calitate pentru antrenarea agenților de căutare AI. SAGE este un sistem „dual-agent” în care un AI scrie o întrebare și un al doilea „agent de căutare” AI încearcă să o rezolve, oferind feedback cu privire la complexitatea întrebării.
Scopul primului AI este de a scrie o întrebare la care este dificil să răspunzi și care necesită mulți pași de raționament și căutări multiple pentru a fi rezolvată.
Scopul celui de-al doilea AI este să încerce să măsoare dacă întrebarea poate răspunde și să calculeze cât de dificilă este (numărul minim de pași de căutare necesari).
Cheia pentru SAGE este că, dacă al doilea AI rezolvă întrebarea prea ușor sau greșește, pașii și documentele specifice pe care le-a găsit (urma de execuție) sunt transmise înapoi la primul AI. Acest feedback îi permite primului AI să identifice una dintre cele patru comenzi rapide care îi permit celui de-al doilea AI să rezolve întrebarea în mai puțini pași.
Aceste comenzi rapide oferă informații despre cum să vă clasați mai bine pentru sarcinile de cercetare profunde.
Patru moduri prin care cercetarea profundă a fost evitată
Scopul lucrării a fost de a crea un set de perechi de întrebări și răspunsuri care au fost atât de dificile încât agentul AI a fost nevoie de mai mulți pași pentru a le rezolva. Feedback-ul a arătat patru moduri care au făcut mai puțin necesar ca agentul AI să facă căutări suplimentare pentru a găsi un răspuns.
Patru motive pentru care cercetarea profundă a fost inutilă
Informații Co-Localizare
Aceasta este cea mai comună scurtătură, reprezentând 35% din cazurile în care nu era necesară o cercetare profundă. Acest lucru se întâmplă atunci când două sau mai multe informații necesare pentru a răspunde la o întrebare se află în același document. În loc să caute de două ori, AI găsește ambele răspunsuri într-un singur „hop”.
Restrângerea interogării multiple
Acest lucru s-a întâmplat în 21% din cazuri. Cauza este atunci când o singură interogare inteligentă de căutare preia suficiente informații din diferite documente pentru a rezolva mai multe părți ale problemei simultan. Acest lucru „prăbușește” ceea ce ar fi trebuit să fie un proces în mai multe etape într-un singur pas.
Complexitatea superficială
Acest lucru reprezintă 13% din cazurile în care nu era necesară o cercetare profundă. Întrebarea pare lungă și complicată pentru un om, dar un motor de căutare (pe care îl folosește un agent AI) poate sări direct la răspuns fără a fi nevoie să raționeze prin pașii intermediari.
Întrebări prea specifice
31% dintre eșecuri sunt întrebări care conțin atât de multe detalii încât răspunsul devine evident chiar de la prima căutare, eliminând necesitatea oricărei investigații „profunde”.
Cercetătorii au descoperit că unele întrebări par greu, dar sunt de fapt relativ ușoare, deoarece informațiile sunt „colocate” într-un singur document. Dacă un agent poate răspunde la o întrebare de 4 hop într-un hop, deoarece un site web a fost suficient de cuprinzător pentru a avea toate răspunsurile, acel punct de date este considerat un eșec pentru instruirea agentului pentru raționament, dar este totuși ceva care se poate întâmpla în viața reală și agentul va profita de a găsi toate informațiile pe o singură pagină.
SEO Takeaways
Este posibil să obțineți câteva informații despre tipurile de conținut care satisface cercetarea profundă. Deși acestea nu sunt neapărat tactici pentru o clasare mai bună în căutarea profundă a AI agentică, aceste informații arată ce tipuri de scenarii i-au determinat pe agenții AI să găsească toate sau majoritatea răspunsurilor într-o singură pagină web.
Cercetătorii au descoperit că atunci când în același document apar mai multe informații necesare pentru a răspunde la o întrebare, se reduce numărul de pași de căutare necesari. Pentru un editor, aceasta înseamnă că consolidarea faptelor „împrăștiate” într-o singură pagină împiedică un agent AI să fie nevoit să „sare” pe site-ul unui concurent pentru a găsi restul răspunsului.
Se declanșează „Reducerea interogării multiple”
Autorii au identificat un fenomen în care informațiile din diferite documente pot fi preluate folosind o singură interogare. Prin structurarea conținutului pentru a răspunde la mai multe sub-întrebări simultan, îi permiteți agentului să găsească soluția completă pe pagina dvs. mai rapid, „scurtcircuitând” în mod eficient lanțul lung de raționament pe care agentul era pregătit să îl întreprindă.
Eliminarea „comenzilor rapide” (decalajul de raționament)
Lucrarea de cercetare notează că generatorul de date eșuează atunci când creează accidental o „comandă rapidă” la răspuns. În calitate de SEO, scopul tău este să fie acea comandă rapidă - oferind puncte de date specifice, cum ar fi calcule, date sau nume, care îi permit agentului să ajungă la răspunsul final fără explorare suplimentară.
Scopul este încă să se claseze în căutarea clasică
Pentru un SEO și un editor, aceste comenzi rapide subliniază valoarea creării unui document cuprinzător, deoarece va elimina nevoia ca un agent AI să fie declanșat să sară în altă parte. Acest lucru nu înseamnă că va fi util să adăugați toate informațiile într-o singură pagină. Dacă are sens pentru un utilizator, poate fi util să faceți un link de la o pagină la alta pentru informații conexe.
Motivul pentru care spun asta este pentru că agentul AI efectuează o căutare clasică în căutarea răspunsurilor, așa că scopul rămâne acela de a optimiza o pagină web pentru căutarea clasică. Mai mult, în această cercetare, agentul AI extrage din primele trei pagini web clasate pentru fiecare interogare pe care o execută. Nu știu dacă așa funcționează căutarea agentică AI într-un mediu live, dar acesta este ceva de luat în considerare.
Categorie Noutăți SEO Google Brevete și lucrări de cercetare Citiți biografia completă SEJ STAFF Roger Montti Proprietar - Martinibuster.com la Martinibuster.com
#looop_parent
Sursa: Jurnalul motorului de căutare
Înapoi la Blog
Cercetarea Google SAGE Agentic AI: Ce înseamnă pentru SEO


