Google a actualizat Search Live cu Gemini 2.5 Flash Native Audio, îmbunătățind modul în care funcționează vocea în Căutare, extinzând, de asemenea, utilizarea modelului la agenții de traducere și voce live. Actualizarea introduce răspunsuri vorbite mai naturale în Search Live și reflectă efortul Google de a îmbunătăți interogările vocale naturale, tratând vocea ca pe o interfață de bază ca o modalitate prin care utilizatorii pot obține tot ce pot obține din căutarea obișnuită, plus permițându-le să pună întrebări despre lumea fizică din jurul lor și să primească traduceri vocale imediate între două persoane care vorbesc limbi diferite.
Noile capabilități vocale actualizate, lansate săptămâna aceasta în Statele Unite, vor permite răspunsurilor vocale ale Google să sune mai natural și vor putea chiar fi încetinite pentru conținutul de instruire.
Potrivit Google:
"Când accesați Live cu Căutare, puteți avea o conversație vocală dus-întors în modul AI pentru a obține ajutor în timp real și pentru a găsi rapid site-uri relevante pe web. Și acum, datorită celui mai recent model Gemini pentru audio nativ, răspunsurile pe Search Live vor fi mai fluide și mai expresive decât oricând."
Lansare audio nativă Gemini mai amplă
Această actualizare a Căutării face parte dintr-o actualizare mai amplă a Gemini 2.5 Flash Native Audio care se lansează în ecosistemul Google, inclusiv Gemini Live (în aplicația Gemini), Google AI Studio și Vertex AI. Modelul procesează sunetul vorbit în timp real și produce răspunsuri fluide, reducând barierele în calea conversației naturale, reducând frecarea în interacțiunile live. Deși anunțul Google nu spunea că modelul a fost un model de vorbire în vorbire (spre deosebire de vorbire în text și apoi de text în vorbire), această actualizare urmează anunțului Google din octombrie despre „Speech-to-Retrieval (S2R). Este un model de învățare automată bazat pe rețea neuronală, antrenat pe interogări mari de date audio.”
Aceste modificări arată că Google tratează audio nativ ca pe o capacitate de bază pentru produsele destinate consumatorilor, facilitând utilizatorilor să solicite și să primească informații despre lumea fizică din jurul lor într-un mod natural care nu era posibil anterior.
Îmbunătățiri pentru sistemele bazate pe voce
Pentru dezvoltatorii și întreprinderile care construiesc sisteme bazate pe voce, Google spune că modelul actualizat îmbunătățește fiabilitatea în mai multe domenii. Gemini 2.5 Flash Native Audio declanșează mai constant funcții externe în timpul conversațiilor, urmează instrucțiuni complexe și menține contextul în mai multe rânduri. Aceste îmbunătățiri fac agenții de voce live mai fiabili în fluxurile de lucru din lumea reală, unde instrucțiunile interpretate greșit sau fluxul conversațional întrerupt reduc capacitatea de utilizare.
Traducere conversațională fluidă
Dincolo de căutare și agenți vocali, actualizarea introduce suport nativ pentru „traducere live din vorbire în vorbire”. Gemenii traduce limba vorbită în timp real, fie prin traducerea continuă a vorbirii ambientale într-o limbă țintă, fie prin gestionarea conversațiilor între vorbitori de diferite limbi în ambele direcții. Sistemul păstrează caracteristicile vocale, cum ar fi ritmul și accentul vorbirii, susținând traducerea care sună mai fluidă și conversațională.
Google evidențiază mai multe capabilități care acceptă această funcție de traducere, inclusiv acoperire largă a limbii, detectarea automată a limbii, gestionarea intrărilor în mai multe limbi și filtrarea zgomotului pentru mediile de zi cu zi. Aceste caracteristici reduc frecarea de configurare și permit traducerea să aibă loc pasiv în timpul conversației, mai degrabă decât prin controale manuale. Rezultatul este o experiență de traducere care se comportă mult ca o persoană reală la mijloc care traduce între două persoane.
Căutare vocală Realizarea aspirațiilor Google
Actualizarea reflectă iterația continuă de către Google a căutării vocale către un ideal care a fost inspirat inițial de interacțiunile vocale științifico-fantastice dintre oameni și computere din populara serie de televiziune și filme Star Trek.
Google anunță o nouă eră pentru căutarea vocală
Acum puteți avea conversații mai fluide și mai expresive când accesați Live cu Căutare.
Modele audio Gemini îmbunătățite pentru interacțiuni vocale puternice
Gemeni Live
5 moduri de a obține ajutor în timp real, accesând Live cu Căutare
Imagine prezentată de Shutterstock/Jackbin
Categorie Știri SEO Generative AI Citiți biografia completă SEJ STAFF Roger Montti Proprietar - Martinibuster.com la Martinibuster.com
Am 25 de ani de experiență practică în SEO, evoluând împreună cu motoarele de căutare ținând pasul cu cele mai recente...
#looop_parent
Sursa: Jurnalul motorului de căutare

kiper

This is a short author bio. It can be stored in the 'users' table in the future. Lorem ipsum dolor sit amet, consectetur adipiscing elit.

Menu

Google Actualizează Căutarea în direct cu actualizarea modelului Gemini

kiper

Citește în Continuare

Google adaugă rapoarte sociale; Mueller avertizează împotriva Markdown – SEO Pulse

Căutarea AI expune riscul SEO de a pierde rezultatele GEO