Kaip būti cituojamiems ChatGPT paieškoje

Išnagrinėta 815 000 užklausų ir puslapių porų. Analizė rodo, kad vadinamoji „išsamaus vadovo“ strategija cituojama rečiau nei trumpesni, aiškiai vieną temą nagrinėjantys puslapiai.

Ilgą laiką SEO specialistai vadovavosi paprasta prielaida: kuo platesnė turinio aprėptis, tuo didesnė tikimybė, kad jis bus panaudotas dirbtinio intelekto generuojamuose atsakymuose. Tradicinė SEO praktika dažnai skatino plėsti tekstą į visas įmanomas puses. Buvo rekomenduojama įtraukti kuo daugiau potemių, papildomų skyrių ir platesnių paaiškinimų. Tokiu būdu buvo kuriami vadinamieji išsamūs teminiai vadovai.

Tačiau didelio masto analizė, apėmusi 815 000 užklausų ir puslapių porų, pateikė kitokias išvadas. Tyrime nagrinėta 16 851 užklausa ir 353 799 skirtingi puslapiai.

Pagrindiniai rezultatai parodė kelis svarbius dalykus:

plačiai išskleista temų aprėptis beveik neturi įtakos tam, ar puslapis bus cituojamas
tik du signalai iš tikrųjų leidžia prognozuoti, ar ChatGPT pasirinks puslapį kaip šaltinį
turinio bibliotekos optimizavimui galima taikyti šešis konkrečius pakeitimus

Tyrimas

Analizė atlikta naudojant platformą AirOps. Sistema tris kartus pateikė 16 851 skirtingą užklausą ChatGPT per vartotojo sąsają ir fiksavo visus procesus: sugeneruotas papildomas užklausas, rastus URL adresus, atliktas citatas ir puslapius, kuriuos modelis perskaitė.

Tyrimo infrastruktūrą sukūrė Oshen Davidson, o duomenų analizę atliko Kevin Indig.

Vidutiniškai kiekviena užklausa sugeneruodavo dvi papildomas paieškos kryptis. Kiekvienos iš jų metu ChatGPT atrinkdavo maždaug dešimt URL adresų, juos peržiūrėdavo ir tik tada nuspręsdavo, kuriuos šaltinius verta cituoti.

Siekiant įvertinti turinio atitikimą, buvo analizuojama, kaip puslapių H2, H3 ir H4 antraštės sutampa su šiomis papildomomis užklausomis. Tam naudota kosininio panašumo metodika, pritaikyta bge-base-en-v1.5 vektoriniams įterpiniams.

Gautas rodiklis pavadintas fan-out aprėptimi. Jis parodo, kokią dalį papildomų potemių nagrinėja konkretus puslapis, kai panašumo slenkstis siekia 0,80. Šis slenkstis buvo pasirinktas kaip kriterijus, leidžiantis nuspręsti, ar antraštė pakankamai tiksliai atitinka papildomą užklausą.

Paprasčiau tariant, tai buvo bandymas nustatyti, ar puslapis realiai nagrinėja temą, kurios ieško sistema.

Pagrindinis tyrimo klausimas buvo toks: ar puslapiai, turintys didesnę potemių aprėptį, cituojami dažniau?

Turinio tankis daro labai nedidelę įtaką

Analizavus 815 484 duomenų eilutes paaiškėjo, kad ryšys tarp potemių aprėpties ir citavimo dažnio yra silpnas.

Jeigu puslapis aptaria visas papildomas potemes, citavimo tikimybė padidėja tik 4,6 procentinio punkto palyginti su puslapiais, kurie jų visai neapima. Tačiau šis skirtumas dar labiau sumažėja, kai atsižvelgiama į užklausos atitikimą. Tai rodiklis, parodantis, kaip tiksliai geriausia puslapio antraštė atitinka pradinę vartotojo užklausą.

Kai analizuojami tik tie puslapiai, kurių atitikimas užklausai yra stiprus, tai yra kosininio panašumo reikšmė siekia 0,80 ar daugiau, atsiranda dar aiškesnė tendencija.

Vidutinė aprėptis, siekianti 26–50 procentų, veikia geriau nei maksimalus temų išplėtimas.

Antraščių fan-out aprrėptis ir citavimo rodiklis

Kitaip tariant, puslapiai, bandantys apimti visas galimas potemes, dažniau pasirodo prasčiau nei tekstai, kurie koncentruojasi tik į dalį temų. Straipsniai, nagrinėjantys maždaug ketvirtadalį potemių, dažnai pasiekia geresnių rezultatų nei tie, kurie siekia visiško išsamumo.

Tai reiškia, kad strategija kurti vadinamuosius išsamius teminius vadovus dažnai yra mažiau efektyvi nei aiškiai orientuotas straipsnis, kuris nuosekliai ir kokybiškai išnagrinėja dvi ar tris glaudžiai susijusias temos kryptis.

Kas iš tikrųjų lemia citavimą

Du signalai aiškiai išsiskiria ir turi didžiausią įtaką: paieškos rezultato pozicija ir užklausos atitikimas turiniui.

Paieškos rezultato pozicija

Stipriausias veiksnys yra puslapio vieta paieškos rezultatuose. Kai puslapis ChatGPT naudojamos paieškos sistemos rezultatuose pateikiamas pirmoje vietoje, jo citavimo tikimybė siekia 58 procentus. Tačiau kai puslapis atsiduria dešimtoje pozicijoje, citavimo tikimybė sumažėja iki 14 procentų.

Šiame tyrime kiekviena užklausa buvo pateikta tris kartus iš eilės. Puslapiai, kurie buvo cituojami visais trimis atvejais, vidutiniškai turėjo 2,5 pozicijos paieškos rezultatų vietą. Tuo tarpu puslapiai, kurie nė karto nebuvo cituoti, dažniausiai pasirodydavo tik apie 13 poziciją.

Užklausos atitikimas turiniui

Antras svarbiausias signalas, susijęs su pačiu turiniu, yra tai, kaip tiksliai puslapio antraštė atitinka vartotojo užklausą. Šis ryšys buvo matuojamas naudojant kosininio panašumo metodą tarp užklausos ir geriausiai ją atitinkančios puslapio antraštės.

Puslapiai, kurių antraštės atitikimas siekia 0,90 ar daugiau, turi 41 procento citavimo tikimybę. Puslapiai, kurių panašumas mažesnis nei 0,50, cituojami tik apie 30 procentų atvejų.

Net ir tarp aukščiausiai reitinguojamų puslapių, esančių 0–2 pozicijose, didesnis užklausos atitikimas padidina citavimo tikimybę dar 19 procentinių punktų.

Kiti veiksniai, tokie kaip potemių aprėptis, žodžių skaičius, antraščių kiekis ar domeno autoritetas, turi tik antrinę reikšmę. Kai kurie iš jų beveik neturi jokio ryšio su citavimo tikimybe, o kai kurie net rodo priešingą tendenciją.

Vikipedijos išimtis

Vienas svetainių tipas šiame tyrime ryškiai išsiskiria iš bendros tendencijos. Tai Wikipedia.

Šios svetainės puslapiai turi prasčiausią paieškos poziciją visame duomenų rinkinyje, vidutinė vieta yra 24. Be to, jų užklausos atitikimo rodiklis taip pat yra žemas ir siekia 0,576. Nepaisant to, būtent ši svetainė pasiekia didžiausią citavimo rodiklį – 59 procentus.

Vikipedijos straipsniai vidutiniškai turi 4 383 žodžius, apie 31 sąrašą ir 6,6 lentelės. Tai enciklopedinio pobūdžio tekstai tiesiogine šio žodžio prasme. ChatGPT dažnai cituoja Vikipediją net tada, kai jos puslapiai randami gana giliai paieškos rezultatuose, nors kiti panašiose pozicijose esantys puslapiai paprastai ignoruojami.

Tokiu atveju didelė informacijos koncentracija veikia kaip signalas, tačiau tokio masto turinio modelio dauguma leidėjų praktiškai negali atkartoti. Vikipedijos turinys yra itin išsamus, struktūruotas ir susietas su milijonais kitų temų. Pavyzdžiui, maždaug trijų tūkstančių žodžių įmonės tinklaraščio straipsnis su penkiolika potemių nėra lygiavertis tokiam turinio ekosistemos mastui.

Dvipolė situacija

Duomenys rodo aiškią struktūrą. Iš visų puslapių, kuriuos ChatGPT rado šiame tyrime:

58 procentai niekada nebuvo cituojami
25 procentai buvo cituojami kiekvieną kartą, kai tik pasirodydavo rezultatuose
17 procentų pateko į tarpinę kategoriją

Įdomu tai, kad puslapiai, kurie visada cituojami, ir tie, kurie niekada nepatenka į citatas, pagal daugumą turinio rodiklių atrodo beveik vienodi. Jų vidutinis tekstų ilgis siekia apie 2 200 žodžių, antraščių skaičius yra apie 20, tekstų skaitomumas atitinka maždaug 12 klasės lygį, o domeno autoriteto rodiklis vidutiniškai siekia 54.

Tai rodo, kad puslapio vidiniai turinio rodikliai, kuriuos galima lengvai išmatuoti, neleidžia aiškiai atskirti geriausiai veikiančių puslapių nuo prasčiausių.

Pagrindinis skirtumas yra paieškos rezultato pozicija. Puslapiai, kurie cituojami visada, dažniausiai atsiduria tarp pirmųjų rezultatų. Puslapiai, kurie niekada necituojami, paprastai patenka į apatinę rezultatų dalį.

Paieškos sistema, nepriklausomai nuo to, kokius vidinius signalus ji naudoja, tampa pagrindiniu filtru. Kiti veiksniai dažniausiai veikia tik kaip papildomi kriterijai.

Ką tai reiškia turinio kūrimui

Tradicinė SEO turinio kūrimo praktika dažnai skatina plėsti straipsnius ir aprėpti kuo daugiau potemių, pridėti papildomų skyrių ir didinti teksto apimtį. Tačiau duomenys rodo, kad toks metodas dažnai sukuria vadinamuosius mišrius puslapius, kurie patenka į minėtą 17 procentų tarpinę kategoriją. Tokie puslapiai kartais cituojami, tačiau ne visada.

Būtent šie puslapiai dažniausiai turi didžiausią žodžių skaičių, daugiausia antraščių ir aukščiausią domeno autoritetą. Tai tie patys išsamūs teminiai vadovai, kurie ilgą laiką buvo laikomi geriausia SEO praktika. Tačiau ChatGPT aplinkoje jie pasirodo kaip mažiausiai stabiliai veikiantis turinio tipas.

Puslapiai, kurie nuosekliai pasiekia geriausių rezultatų, pasižymi aiškia koncentracija į vieną temą. Tokie puslapiai:

savo antraštėse tiesiogiai atspindi vartotojo užklausą
dažniausiai yra trumpesni, optimalus citavimo intervalas yra 500–2000 žodžių
turi pakankamai struktūros, paprastai 7–20 potemių, kad turinys būtų aiškiai organizuotas

Svarbiausias principas yra sukurti puslapį, kuris pateikia geriausią atsakymą į vieną konkretų klausimą, o ne tekstą, kuris paviršutiniškai bando atsakyti į dvidešimt skirtingų klausimų.

Norite, kad jūsų turinys būtų matomas dirbtinio intelekto sistemose

Jeigu jūsų tikslas yra, kad svetainės turinys būtų dažniau naudojamas dirbtinio intelekto generuojamuose atsakymuose, verta apsvarstyti AEO ir SEO strategijas. Šios metodikos orientuojasi į tai, kad turinys būtų lengvai suprantamas paieškos sistemoms ir dirbtinio intelekto modeliams, kurie parenka šaltinius atsakymams generuoti.

Praktikoje tai reiškia aiškiai struktūruotą turinį, tikslų užklausų atitikimą antraštėse, logišką informacijos pateikimą ir teminį fokusą, leidžiantį sistemoms lengvai identifikuoti puslapį kaip patikimą atsakymo šaltinį.

Jeigu siekiate pagerinti savo matomumą tokiose sistemose kaip ChatGPT, verta apsvarstyti AEO optimizavimo paslaugas, kurias teikia SeoRocket.lt komanda. Tinkamai pritaikyta turinio strategija gali padėti jūsų puslapiams dažniau patekti į dirbtinio intelekto pateikiamus atsakymus ir padidinti organinį matomumą.

Šaltiniai

Šaltinis: Search Engine Journal, Shorter, Focused Content Wins In ChatGPT, Kevin Indig, 2026 m.

Dalintis:

Apie autorių

Lukas Juodagalvis SeoRocket.lt

Autoriaus straipsniai

Specializuojasi end-to-end SEO – nuo strategijos formavimo iki techninio įgyvendinimo ir svetainių migracijų. Jo patirtis apima darbą su tarptautiniais projektais Lietuvoje ir daugiau nei 20 rinkų, įskaitant tokius prekių ženklus kaip „Cedral“, „Eternit“, „Euronit“, „Siniat“, „Promat“ ir „Skamowall“.