Súbor sitemap.xml je podobný súboru robots.txt. Oba slúžia ku komunikácií s robotmi. Tí určujú, aké stránky vášho webu sa majú častejšie indexovať a pomáhajú aktualizovať obsah webu. Aby ale robot pracoval vo váš prospech, musí vedieť kde má vašu sitemapu hľadať a ako ju nájsť.
Sitemap je možné jednoducho preložit ako „mapa stránky“. Je to súbor, v ktorom by sa mali nachádzať informácie o obsahu, ktorý chcete, aby bol vo vyhľadávači k nájdeniu. Môžu to byť vstupné stránky webu, ale tiež rôzne súbori, obrázky alebo videá.
Pomocou tejto „mapy“ sa v mori obsahu internetového sveta predierajú roboti vyhľadávačov a snažia sa nachádzať relevantné stránky. Internetový vyhľadávač sa pomocou nich dokáže lepšie vyznať na vašich stránkach a hľadať také, na ktoré sa doteraz cez interné prelinkovanie nedostal.
Najčastejšie má sitemap podobu .xml súboru, výnimočne sa môžeme stretnúť aj s .html či .php variantom. Súbor je uložený v koreňovom adresári webu a slúží ako doplnok súboru robots.txt. Rozdie medzi týmito súbormi je v tom, že zatiaľ čo robots.txt vylučuje niektoré stránky webu z vyhľadávania, tak naopak sitemap.xml stránky do vyhľadávača pridáva.
Pokiaľ sú vaše stránky optimálne prelinkované, potom vyhledávačom v zásade nemusí robiť problém váš web nájsť. Správne prelinkovanie znamená, že všetky stránky vášho webu, ktorým prikladáte prioritu, sú dosiahnuteľné cez príslušnú navigáciu – napr. menu, alebo linky umiestené na úvodnej stránke. Vyhledávače cez tieto prelinkované odkazy prechádzajú a cez ne nachádzajú stále nové stránky.
V prípade, že prevádzkujete nový web, nemá históriu spätných odkazov, stopercentnú prelinkovanosť, ani na neho nevedú externé linky z cudzích webov, je správná chvíla začať so sitemapou pracovať. Pomocou sitemap.xml priradzujete prioritu vstupným stránkam a hovoríte tak robotom, čo majú prechádzať. Robot si stránky zo sitemapy zaradí do indexu a začne zobrazovať vo výsledkoch vyhľadávania. Šance, že vyhľadávač vami špecifikovanej dôležitej vstupnej stránky prejde a zaindexuje sa výrazne zvyšuje.
Ak prevádzkuje už zabehnutý, veľký web s veľa stránkami, ale stále nemáte dosť dobre riešené prolinkovanie, je pre vás sitemap.xml tiež dôležitý. Ak do neho budete dynamicky pridávať nové vstupné stránky, zaistíte tak, že ich robot pri orientácii webom neprehliadne.
Pokiaľ používate pre správu vášho webu redakčný systém (CMS), bude pre vás vytvorenie sitemapy hračka. V prípade, že si web riešite sami, budete musieť zvoliť crawlera, ktorý vám sitemapu vygeneruje na základe vašich vstupných stránok.
Po vytvorení sitemapy je potrebné súbor v .xml formáte odoslať do príslušného vyhľadávača, aby ho jeho robot čo najskôr objavil.
Sitemapa nemusí obsahovať iba odkazy na vstupné stránky, ale môžete ju využiť k poskytovániu informácií o špecifickom obsahu na vašom webe. Dobrou praxou je do sitemap.xml zahrnúť informácie o multimediálnych súboroch, ako sú obrázky, videá alebo aj správy.
Príklad zápisu adresy súboru sitemap.xml v súbore robots.txt
Sitemap: https://www.zonercloud.sk/sitemap.xml
UPOZORNENIE: URL sitemapy v robots.txt musí byť absolútna.
Príklad odkazu na komprimovaný súbor sitemap.gz v súbore robots.txt
Sitemap: https://www.yahoo.com/news/sitemaps/news-sitemap_index_US_en-US.xml.gz
Záznam o videu v súbore sitemap.xml môže obsahovať špecifikácie o jeho dĺžke, tematické kategórie alebo prístupnosti veku. V prípade Google vyhľadávača sa tak video hravo sprístupní do služby Videa Google.
Príklad sitemapy pre video
<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″ xmlns:video=”http://www.google.com/schemas/sitemap-video/1.1″>
<url>
<loc>http://www.example.com/videa/vstupni_stranka_videa.html</loc>
<video:video>
<video:thumbnail_loc>http://www.example.com/miniatury/123.jpg</video:thumbnail_loc>
<video:title>Názov ukážky videa</video:title>
<video:description>Popis ukážky videa</video:description>
<video:content_loc>
http://streamserver.example.com/video123.mp4</video:content_loc>
<video:player_loc>
http://www.example.com/videoplayer.php?video=123</video:player_loc>
<video:duration>600</video:duration>
<video:expiration_date>2021-11-05T19:20:30+08:00</video:expiration_date>
<video:rating>4.2</video:rating>
<video:view_count>12345</video:view_count>
<video:publication_date>2007-11-05T19:20:30+08:00</video:publication_date>
<video:family_friendly>yes</video:family_friendly>
<video:restriction relationship=”allow”>IE GB US CA</video:restriction>
<video:price currency=”EUR”>1.99</video:price>
<video:requires_subscription>yes</video:requires_subscription>
<video:uploader
info=”http://www.example.com/uzivatele/janzonera”>Jan Zonera
</video:uploader>
<video:live>no</video:live>
</video:video>
</url>
</urlset>
Záznam o obrázku môže obsahovať jeho rozmery, typ, predmet toho, či na ňom nájdeme a licenciu obrázku. Pridať ho môžeme buď priamou cestou pomocou URL, alebo jednoducho vyhľadávaču v súboru sitemap.xml o obrázku oznámiť všetky relevantné doplnkové informácie.
Príklad sitemapy pre obrázok
<?xml version=”1.0″ encoding=”UTF-8″?>
<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″ xmlns:image=”http://www.google.com/schemas/sitemap-image/1.1″>
<url>
<loc>http://example.com/ukazka.html</loc>
<image:image>
<image:loc>http://example.com/obrazek.jpg</image:loc>
</image:image>
<image:image>
<image:loc>http://example.com/fotka.jpg</image:loc>
</image:image>
</url>
</urlset>
Záznam o Správach v sitemape môže obsahovať napr. nadpis článku a dátum vydania.
Príklad sitemapy pre správy
<?xml version=”1.0″ encoding=”UTF-8″?>
<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″ xmlns:news=”http://www.google.com/schemas/sitemap-news/0.9″>
<url>
<loc>http://www.example.org/business/article55.html</loc>
<news:news> <news:publication> <news:name>The Example Times</news:name> <news:language>en</news:language> </news:publication> <news:genres>PressRelease, Blog</news:genres> <news:publication_date>2008-12-23</news:publication_date> <news:title>Companies A, B in Merger Talks</news:title> <news:keywords>business, merger, acquisition, A, B</news:keywords> <news:stock_tickers>NASDAQ:A, NASDAQ:B</news:stock_tickers> </news:news>
</url>
</urlset>
Ďalšie informácie o formátu súboru sitemap.xml nájdete na stránkách sitemaps.org.
Ešte predtým ako sitemap súbor pridáte do vyhľadávača, je vhodné si ho najprv otestovať, či neobsahuje nejaké chyby. K tomuto účelu odporúčame napr. tento nástroj.
Následne ho môžete pridať do vyhľadávača pomocou následujúcich tools:
Google: https://www.google.com/webmasters/tools/sitemap-list
Bing: https://www.bing.com/toolbox/webmaster
Vyhľadávač môžete o svojom sitepamu informovať tiež tak, že cestu k súboru zadáte pomocou súboru robots.txt.
Sitemap: https://zonercloud.cz/sitemap.xml
Poslednou možnosťou je využitie funkcie ping a odoslať požiadavku ako http GET: https://www.google.com/ping?sitemap=https://zonercloud.cz/sitemap.xml
V prípade ak máte problémy s indexáciou stránok na vašom webe, jak sú neaktuálne a vyhľadávače majú problém s ich nájdením, mali byste se venovať sitemap.xml súboru. V ňom môžete vyhľadávaču poskytnúť podstatné informácie, ktoré napomôžu k tomu, aby lepšie prechádzal a hodnotil vaše stránky a tým vám vo vylepšíl výsledky vyhladávania.