Paieškos sistemos internete dirba su robotais, dar vadinamais naršyklėmis arba vorais. Jie keliauja per svetaines, randa puslapius ir jų turinį įtraukia į paieškos indeksą. Dažniausiai tai vyksta greitai, tačiau dėl milžiniško turinio kiekio internete robotai ne visada akimirksniu aptinka kiekvieną puslapį. Jei svetainė labai didelė ar sudėtingai struktūruota, dalis svarbių vietų gali būti tiesiog praleistos.
Kas yra XML svetainės schema?
XML svetainės schema – tai tekstinis failas, kuriame išvardijami visi jūsų svetainės puslapiai, kuriuos norite matyti paieškos rezultatuose. Schema padeda robotams:
- surasti ir sėkmingai nuskaityti visus nurodytus URL;
- perprasti jūsų turinio ir navigacijos struktūrą;
- laiku pastebėti naują ar atnaujintą turinį.
Ypač naudinga tai yra puslapiams, į kuriuos neveda vidinės nuorodos (vadinamiesiems „našlaičiams“). Schema tarsi pateikia aiškų adresyną – kur kas paprasčiau, nei bandyti viską rasti vien tik sekant nuorodas.
Be pagrindinių URL, XML schema gali nurodyti ir papildomą informaciją, pavyzdžiui, kada puslapis paskutinį kartą atnaujintas, kokia jo santykinė svarba svetainėje, kaip dažnai tikėtini pakeitimai, ar yra alternatyvių to paties puslapio versijų kitomis kalbomis. Svarbu atsiminti: XML schema skirta robotams, o ne žmonių naršymui.
Kada XML schema ypač reikalinga?
Nors iš jos naudos turi kone kiekviena svetainė, yra atvejų, kai schema tampa kritiškai svarbi:
- labai didelės svetainės su šimtais ar tūkstančiais puslapių bei archyvais;
- naujai startavę projektai, kurie dar neturi daug atgalinių nuorodų ar stiprios vidinės struktūros;
- el. parduotuvės su gausiu prekių asortimentu, filtravimo puslapiais ir dinaminiais URL;
- svetainės su dažnais turinio atnaujinimais (naujienos, tinklaraščiai, skelbimai);
- projektai, kuriuose dalis puslapių sunkiai pasiekiami per įprastą navigaciją.
Kaip atrodo XML schema?
XML schema – tai kompiuteriams patogiu formatu parengtas failas. Jo pagrindai:
Pagrindiniai elementai
- Antraštė (XML deklaracija). Aprašo, ko tikėtis faile: nurodo XML versiją, kartais – simbolių koduotę.
- Elementas urlset. Tai „konteineris“, kuriame pateikiami visi URL įrašai ir nurodoma, kokia XML svetainės schemos specifikacija naudojama.
- Elementas url. Esminė dalis, aprašanti konkretų puslapį. Kiekviename url įraše privalomas laukas loc – pilnas puslapio adresas su protokolu (http arba https).
Naudingi, bet neprivalomi laukai
- changefreq – numatomas atnaujinimų dažnis (pvz., hourly, daily, weekly, monthly, yearly, never, always).
- lastmod – paskutinio turinio pakeitimo data.
- priority – santykinė puslapio svarba svetainėje nuo 0.0 iki 1.0 (didesnė reikšmė reiškia didesnę svarbą).
- hreflang/alternatyvios versijos – nuorodos į to paties turinio versijas kitomis kalbomis ar regionams.
Šie papildomi laukai padeda robotams protingiau paskirstyti dėmesį ir dažniau tikrinti tai, kas svarbiausia.
XML ir HTML svetainių schemos: skirtumai
XML schema skirta pirmiausia paieškos robotams – ji pateikia techninį svetainės „žemėlapį“. HTML schema, priešingai, orientuota į lankytoją: tai puslapis su aiškiai išdėstytais skyriais ir nuorodomis, palengvinantis navigaciją žmonėms. Abi rūšys gali būti naudingos ir robotams, tačiau XML yra tikslesnė nurodant, ką ir kaip indeksuoti, o HTML – patogesnė žmogui susidaryti bendrą vaizdą.
Geriausios praktikos kuriant ir diegiant XML schemą
- Automatizuokite procesą. Schema gali būti kuriama ranka, tačiau turinio valdymo sistemos, įskiepiai ar audito įrankiai, turintys schemų generatorius, viską pagreitina ir sumažina klaidų riziką.
- Venkite dublikatų. Neįtraukite identiškų ar beveik vienodų puslapių. Tai padeda robotams sutelkti dėmesį į originalų, vertingą turinį.
- Akcentuokite kokybiškus puslapius. Į schemą dėkite svarbiausius, gerai optimizuotus, lengvai naršomus, mobiliems įrenginiams pritaikytus puslapius su unikaliais tekstais, vizualais ir įtraukiančiais elementais (pvz., atsiliepimais, komentarais).
- Neįtraukite „noindex“ puslapių. Jei nenorite, kad tam tikri URL būtų indeksuojami, jų į schemą nedėkite – taip išvengsite prieštaringų signalų.
- Pateikite schemą paieškos sistemoms. Įkelkite ją į svetainių valdytojų įrankius ir/arba nurodykite robots.txt faile (pvz., eilute sitemap: jūsų-adresas/sitemap.xml).
- Atnaujinkite lastmod atsakingai. Keiskite datą tik tuomet, kai įvyksta reikšmingi turinio pakeitimai. Jei bus nuolat „gaivinama“ be realaus atnaujinimo, lauko vertė praras prasmę.
- Skaldykite į kelias schemas, jei reikia. Viena XML schema negali viršyti 50 MB (nekompresuoto) dydžio ir 50 000 URL. Jei peržengiate ribas, kurkite kelias schemas ir sitemap indeksą (sitemapindex), kuris sujungia visas dalis.
- Tvarkykite kanonines versijas. Naudokite kanoninius URL, kad robotai suprastų, kuris variantas yra pagrindinis, ypač esant filtrams, rūšiavimams ar UTM parametrams.
- Įtraukite tik pasiekiamus URL. Venkite nuorodų, kurios grąžina 4xx ar 5xx klaidas, reikalauja prisijungimo ar blokuojamos robots.txt.
- Sinchronizuokite su vidine struktūra. Nors schema padeda, vis tiek kurkite aiškią vidinę navigaciją ir logišką nuorodų tinklą – taip pagerinsite tiek vartotojų patirtį, tiek nuskaitymą.
Trumpa santrauka
XML svetainės schema – tai patikimas būdas leisti paieškos robotams greitai suprasti, kokius puslapius turite ir kuriuos laikote svarbiausiais. Ji ypač naudinga didelėms, sparčiai augančioms ar sudėtingos struktūros svetainėms. Parengę tvarkingą schemą, pašalinę dublikatus, įtraukę tik aukštos kokybės URL ir pateikę ją paieškos sistemoms, padėsite turiniui greičiau patekti į indeksą ir sutvirtinti organinį matomumą.
Pradėkite nuo esamų puslapių audito, sukurkite automatizuotą schemos generavimo procesą, o reikšmingus atnaujinimus atsakingai atspindėkite lastmod lauke. Taip užtikrinsite, kad paieškos robotams visada būtų pateikiamas tikslus jūsų svetainės „žemėlapis“.
Nuo 2021 metų Lukas yra gilinęsis į dinamišką SEO pasaulį, kuriame jis derina kūrybiškumą su analitiniu mąstymu siekdamas skatinti skaitmeninį augimą. Jo kelionė prasidėjo nuo didelio smalsumo, kaip veikia paieškos sistemos, ir iki šiol išaugo į karjerą, kurioje jis sprendžia įvairius SEO iššūkius skirtingose pramonės šakose.

