Ta strona używa ciasteczek (cookies), dzięki którym nasz serwis może działać lepiej. Dowiedz się więcej OK, rozumiem
WebHelp.pl Warsztat Artykuły Mapa witryny

Warsztat / Artykuły i tutoriale

Mapa witryny

Rafał Kukawski 19 grudnia 2010 komentarze ()

Webmasterom, którym zależy na dobrej indeksacji serwisu przez wyszukiwarki internetowe zaleca się stworzenie pliku mapy witryny. Pod pojęciem tym mam na myśli plik XML o specjalnej strukturze, w którym możemy zamieścić adresy URL do najważniejszych (bądź wszystkich) podstron własnego serwisu.

Zadaniem pliku jest ułatwienie robotom rozpoznania podstron w danym serwisie. Nie oznacza to oczywiście, że każdy podany adres znajdzie się w indeksie wyszukiwarki, ale zwiększa prawdopodobieństwo zindeksowania maksymalnej liczby podstron. Oprócz adresu podstrony, można wstawić informację o częstotliwości aktualizacji danej podstrony, co może też przynieść wymierne korzyści w postaci regularnych odwiedzin robotów.

Dzisiaj wiele CMSów pozwala generować plik sitemapy, dla innych wystarczy znaleźć odpowiednią wtyczkę. Przykładowo, dla Wordpressa znajdziemy wtyczkę Google XML Sitemaps. Drupal też może się pochwalić odpowiednim pluginem. Dla Joomli też istnieje kilka rozszerzeń.

Jeśli rozważasz prowadzenie własnego bloga, platforma Jogger.pl oferuje usługę generowania mapy, którą możesz włączyć w panelu administracyjnym.

Fragment panelu zarządzania blogiem na Jogger.pl

Dla stron korzystających z mniej popularnych CMSów będzie trzeba taki plik wygenerować samemu, lub napisać odpowiedni moduł automatyzujący zadanie.

Specyfikacja pliku (protokołu) Sitemaps znajduje się na stronie projektu. Dostępne jest tłumaczenie na język polski.

Najprostsza struktura pliku sitemapy składa się z kombinacji zaledwie 3 znaczników - urlset, url, loc. Wszystkie inne są opcjonalne.

Kod: Zaznacz cały
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
    <url>
        <loc>http://webhelp.pl/</loc>
    </url>
    <url>
        <loc>http://forum.webhelp.pl/</loc>
    </url>
</urlset>

Warto jednak rozważyć wykorzystanie pozostałych znaczników, które informują roboty o dacie ostatniej modyfikacji, częstotliwości zmian wprowadzanych na swoich podstronach oraz priorytecie (ważności) danej podstrony w serwisie.

Przykładowe wpisy dla Webhelpa mogą wyglądać następująco

Kod: Zaznacz cały
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
    <url>
        <loc>http://webhelp.pl/</loc>
        <lastmod>2010-12-19</lastmod>
        <changefreq>daily</changefreq>
        <priority>1</priority>
    </url>
    <url>
        <loc>http://webhelp.pl/warsztat/</loc>
        <changefreq>daily</changefreq>
    </url>
    <url>
        <loc>http://webhelp.pl/blog/</loc>
        <changefreq>daily</changefreq>
    </url>
    <url>
        <loc>http://webhelp.pl/zasoby/</loc>
        <changefreq>weekly</changefreq>
    </url>
    <url>
        <loc>http://forum.webhelp.pl/</loc>
        <changefreq>always</changefreq>
        <priority>1</priority>
    </url>
</urlset>

Na plik sitemapy nałożone są pewne ograniczenia. Nie powinno się w nim znajdować więcej niż 50 000 wpisów oraz plik nie może przekroczyć rozmiaru 10 megabajtów. Plik musi być zakodowany w UTF-8. Zaleca się też kompresję pliku gzipem.

Jeśli mamy więcej niż 50 000 podstron, które chcielibyśmy mieć zaindeksowane, można skorzystać z pliku indeksu mapy witryny, w którym można przekazać ścieżki do kilku plików sitemap. Struktura tego pliku jest bardzo podobna do samej sitemapy. Zamiast urlset mamy sitemapindex, zamiast url jest sitemap. Obowiązkowym znacznikiem wewnątrz sitemap jest loc, zaś jedynym opcjonalnym jest lastmod.

Kod: Zaznacz cały
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
    <sitemap>
        <loc>http://webhelp.pl/sitemap1.xml</loc>
        <lastmod>2010-12-19</lastmod>
    </sitemap>
    <sitemap>
        <loc>http://webhelp.pl/sitemap2.xml</loc>
        <lastmod>2010-12-19</lastmod>
    </sitemap>
</sitemapindex>

Aby poinformować wyszukiwarki o istnieniu takiego pliku, można skorzystać z dedykowanych narzędzi, np. Google Webmaster Tools lub do pliku robots.txt wstawić linię

Kod: Zaznacz cały
Sitemap: sitemap.xml

Plik mapy witryny stanowi idealną alternatywę dla kanałów RSS czy Atom, które również są parsowane przez roboty wyszukiwarek. Wadą RSSów - dla celów pozycjonowania - jest fakt, że w takim pliku zwykle trzymamy kilkanaście odnośników do ostatnich artykułów na stronie. W przypadku sitemap można pokazać robotom całą zawartość serwisu.

Masz pytania lub wątpliwości? Odwiedź nasze forum dyskusyjne.

Rafał Kukawski

Programista, webmaster. Szczególnie upodobał sobie JavaScript i technologie klienckie, choć strona serwera i bazy danych nie stanowią tajemnicy. Tworzy też aplikacje na urządzenia mobilne. kukawski.pl.


Komentarze


HTML CSS JavaScript PHP bazy danych MySQL Flash grafika framework hosting domeny pozycjonowanie wordpress Facebook