SEO paslaugos > Tinklaraštis > Kodėl Google dar nesiruošia naudoti DI?
Kodėl Google dar nesiruošia naudoti DI?
„Google” neseniai paskelbė, jog jų eksperimentinis projektas „Paieškos Generatyvinė Patirtis” (SGE) bus pratęstas, o tai reiškia, kad DI (dirbtinis intelektas) dar nebus aktyviai naudojamas paieškoje artimiausiu metu. Tai gali atrodyti netikėta, tačiau leisti „Microsoft” eiti priekyje gali būti netikėtai gera strategija „Google”.
SGE pratęsimą „Google” beveik nepastebimai paminėjo savo tinklaraščio įraše, skirto naujoms DI funkcijoms paieškoje. Jie pabrėžė, kad gavo daug naudingų atsiliepimų iš eksperimento dalyvių ir ketina ir toliau siūlyti SGE kaip bandymų aikštelę drąsioms naujoms idėjoms.
Tuo tarpu „Google” nenagrinėjo priežasčių, kodėl jie neskuba DI iškelti į pagrindą, leisdami „Microsoft” ir šešioms rizikos kapitalo finansuojamoms DI paieškos startuolėms vesti į priekį kurdami naujos kartos paiešką.
„Google” paieškos strategija su DI „Google” sprendimas laikyti SGE „Google Labs” projekte atitinka jų ilgalaikę strategiją integruoti DI užkulisiniu būdu. DI buvo naudojamas „Google” paieškoje ilgiau, nei daugelis supranta, tačiau jo buvimas ne visuomet buvo akivaizdus.
- „RankBrain” 2015 Pirmasis DI naudojimas paieškoje buvo „RankBrain” sistema, padedanti reitingavimo algoritmams suprasti, kaip paieškos užklausų žodžiai susiję su realaus pasaulio konceptais.
- „Neural Matching” 2018 Vėliau buvo įdiegtas „Neural Matching”, padedantis suprasti platesnius paieškos užklausų ir tinklalapių konceptus.
- „SpamBrain” 2018 „SpamBrain”, kovos su šlamštu DI sistema, yra viena svarbiausių DI taikymo paieškoje formų, nes ji padeda atsijoti žemos kokybės svetaines.
- „Google MUM” 2021 Viena geriausiai žinomų „Google” išrūšiuotų DI sistemų yra „Multitask Unified Model” (MUM), apimanti vaizdų ir teksto supratimą bei gebėjimą juos integruoti į sakinio ar paieškos užklausos kontekstus.
„Google” DI taiko užkulisiniu būdu Visi šie pavyzdžiai rodo „Google” metodą spręsti įvairias paieškos problemas naudojant DI kaip funkcijas, kartais įtraukiant jas į bendrąjį pagrindinį algoritmą.
Tikėtina, kad „Google” būtų ir toliau naudojęs DI užkulisiniu būdu, jei ne „Microsoft” sprendimas integruoti „ChatGPT” į „Bing”, dėl ko „Google” pradėjo aktyviau įtraukti DI į paiešką.
Kodėl SGE dar nepasiruošęs palikti „Google Labs”?
Nepaisant to, kad „Microsoft” integruoja „ChatGPT” į „Bing”, gali kilti klausimas, kodėl „Google” dar nesiėmė panašaus žingsnio ir vis dar laiko SGE „Google Labs”. Tam yra kelios geros priežastys.
Viena iš pagrindinių „Google” DI naudojimo principų yra taikyti technologiją tik tada, kai ji įrodyta sėkminga ir gali būti patikimai ir atsakingai įgyvendinta, o šiuo metu generatyvinis DI dar nėra pajėgus tai užtikrinti.
Yra bent trys didelės problemos, kurias reikia išspręsti, kad DI galėtų sėkmingai integruotis į paieškos priekį:
- LLM negali būti naudojami kaip informacijos paieškos sistema, nes jiems reikia visiškai iš naujo mokyti, norint pridėti naujus duomenis.
- Transformatorių architektūra yra neefektyvi ir brangi.
- Generatyvinis DI linkęs kurti neteisingus faktus, reiškinys vadinamas halucinacijomis.
Kodėl „Google” Laiko SGE „Google Labs”
„Google” pripažįsta, kad atsiliepimai apie SGE „Google Labs” padėjo pristatyti dvi naujas DI pagrįstas funkcijas. Šiuo metu SGE „Google” turi vertę kaip būdas išbandyti naujas funkcijas, bet ne kaip bandomąjį paleidimą naujai paieškos versijai.
Yra keletas sunkių problemų, kurios paaiškina, kodėl SGE dabartine forma negali tapti naujos kartos DI paieška.
Kodėl DI Negali Būti Naudojamas Kaip Paieškos Variklis
Viena iš svarbiausių problemų, kurias reikia išspręsti prieš naudojant DI kaip paieškos variklio užpakalį ir priekį, yra ta, kad LLM negali funkcionuoti kaip paieškos indeksas, kuriame nuolat pridedami nauji duomenys.
Paprastais terminais, kas vyksta reguliarioje paieškoje, yra naujų tinklalapių pridėjimas – procesas, kai paieškos variklis apskaičiuoja teksto žodžių ir frazių semantinę reikšmę (procesą vadinamą „embedding”), todėl jie tampa paieškomais ir paruošti integracijai į indeksą.
Vėliau paieškos variklis turi atnaujinti visą indeksą, kad suprastų (taip sakant), kaip nauji tinklalapiai įsilieja į bendrąjį paieškos indeksą.
Naujų tinklalapių pridėjimas gali pakeisti, kaip paieškos variklis supranta ir sieja visus kitus apie kuriuos žino tinklalapius, todėl jis peržiūri visus indekse esančius tinklalapius ir atnaujina jų santykius su kitais, jei reikia. Tai supaprastinimas, siekiant perteikti bendrąją naujų tinklalapių pridėjimo prie paieškos indekso prasmę.
Priešingai dabartinei paieškos technologijai, LLM negali pridėti naujų tinklalapių prie indekso, nes naujų duomenų pridėjimas reikalauja visiško visos LLM pertreniravimo.
„Google” tyrinėja, kaip išspręsti šią problemą, siekiant sukurti transformatorių pagrįstą LLM paieškos variklį, bet problema dar nėra išspręsta, net ne arti.