Eine Sitemap ist eine strukturierte Übersicht aller Seiten einer Website. Sie existiert in zwei grundlegend verschiedenen Formen: als XML-Sitemap für Suchmaschinen-Crawler und als HTML-Sitemap für menschliche Besucher. Im SEO-Kontext meint "Sitemap" fast immer die XML-Variante.
Eine Sitemap ist ein direkter Kommunikationskanal zwischen einer Website und den Crawlern von Google, Bing und anderen Suchmaschinen. Sie beantwortet drei grundlegende Fragen: Welche URLs existieren? Wann wurden sie zuletzt geändert? Wie wichtig sind sie relativ zueinander?
XML-Sitemap vs. HTML-Sitemap: Unterschied und Zweck
XML-Sitemap (für Suchmaschinen)
Die XML-Sitemap ist eine maschinenlesbare Datei im XML-Format, die typischerweise unter /sitemap.xml erreichbar ist. Sie enthält strukturierte Daten, die Suchmaschinen beim Crawlen und Indizieren der Website unterstützen.
Typische XML-Sitemap-Struktur:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://www.beispiel.de/leistungen/</loc>
<lastmod>2026-03-15</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
</urlset>
HTML-Sitemap (für Benutzer)
Die HTML-Sitemap ist eine normale Webseite mit einer hierarchischen Linkliste aller wichtigen Seiten. Sie hilft Nutzern, die gewünschte Seite nicht über die Navigation finden. Für SEO hat sie nur indirekte Bedeutung – durch verbesserte interne Verlinkung und Crawlbarkeit.
Vergleich auf einen Blick:
| Merkmal | XML-Sitemap | HTML-Sitemap |
|---|---|---|
| Zielgruppe | Suchmaschinen-Crawler | Menschliche Besucher |
| Format | XML | HTML |
| Speicherort | /sitemap.xml | /sitemap/ oder /uebersicht/ |
| SEO-Bedeutung | Hoch (direkt) | Gering (indirekt) |
| Muss gepflegt werden? | Ja, automatisiert ideal | Ja, manuell oder automatisiert |
Warum Sitemaps wichtig für SEO sind
Crawling erleichtern
Suchmaschinen entdecken neue Seiten über zwei Wege: interne Links und Sitemaps. Seiten, die schlecht verlinkt sind – zum Beispiel neue Blogbeiträge, tief vernetzte Produktseiten oder sprachversionierte Unterseiten – werden ohne Sitemap möglicherweise nicht oder erst mit erheblicher Verzögerung gefunden.
Indizierungs-Signale senden
Die Sitemap sagt Google nicht nur, welche Seiten existieren, sondern auch, welche Seiten aktuell geändert wurden (lastmod). Das hilft Google, Crawl-Ressourcen effizienter einzusetzen – statt die gesamte Website regelmäßig zu crawlen, konzentriert es sich auf geänderte Inhalte.
Internationale Websites und Hreflang
Mehrsprachige Websites wie pakumedia.de (Deutsch und Englisch) nutzen Sitemaps auch, um Hreflang-Attribute zu kommunizieren – die Signale, welche Sprachversion für welche Region bestimmt ist.
Die vier XML-Sitemap-Attribute im Detail
1. <loc> – Die URL (Pflichtfeld)
Die vollständige, kanonische URL der Seite. Immer mit Protokoll (https://) und konsistent mit der bevorzugten URL-Variante (mit oder ohne Trailing Slash).
2. <lastmod> – Letzte Änderung (empfohlen)
Das Datum der letzten inhaltlichen Änderung im Format YYYY-MM-DD. Wichtig: Nur aktualisieren, wenn tatsächlich relevanter Inhalt geändert wurde. Google ignoriert lastmod-Werte, die offensichtlich automatisiert ohne echte Änderungen gesetzt werden.
3. <changefreq> – Änderungshäufigkeit (optional)
Hinweis auf die erwartete Änderungsfrequenz: always, hourly, daily, weekly, monthly, yearly, never. Google nutzt diesen Wert als Hinweis, nicht als Anweisung, und verlässt sich bei der Crawl-Planung stärker auf lastmod.
4. <priority> – Relative Priorität (optional)
Ein Wert von 0.0 bis 1.0, der die relative Priorität einer URL im Vergleich zu anderen Seiten derselben Website angibt. Standardwert: 0.5. Empfehlung: Startseite 1.0, wichtige Hauptseiten 0.8, reguläre Seiten 0.5–0.6, Archivseiten 0.3.
Sitemap bei Google Search Console einreichen
Die Search Console ist die offizielle Schnittstelle zwischen Website und Google. Das Einreichen einer Sitemap beschleunigt die Indizierung und liefert wertvolle Diagnosedaten.
Schritt-für-Schritt-Anleitung:
- Google Search Console öffnen (search.google.com/search-console)
- Property auswählen (oder neue Property anlegen)
- Im linken Menü: "Sitemaps" aufrufen
- Sitemap-URL eingeben (z.B.
sitemap.xmlodersitemap_index.xml) - Auf "Senden" klicken
- Google verarbeitet die Sitemap – Status erscheint nach wenigen Minuten bis Stunden
Wichtige Metriken in der Search Console:
- Eingereichte URLs – Wie viele URLs enthält die Sitemap?
- Indizierte URLs – Wie viele hat Google tatsächlich indexiert?
- Fehler – Welche URLs konnten nicht gecrawlt werden?
Eine große Lücke zwischen eingereichten und indizierten URLs ist ein SEO-Signal, das untersucht werden sollte.
Sitemap-Typen: Über die Standard-Sitemap hinaus
News Sitemap
Für Nachrichtenwebsites und Publisher, die in Google News erscheinen möchten. Enthält nur Artikel der letzten 48 Stunden und zusätzliche Metadaten (Publikationsdatum, Titel, Sprache).
Video Sitemap
Informiert Google über Videoinhalt auf der Website: Videotitel, Beschreibung, Thumbnail-URL, Video-URL und Dauer. Verbessert die Chancen auf Video-Rich-Results in der Suche und ist für Websites mit eigenem Video-Hosting wichtig (im Gegensatz zu eingebetteten YouTube-Videos).
Image Sitemap
Ermöglicht Google, Bilder zu entdecken, die sonst möglicherweise nicht gecrawlt würden – besonders relevant für JavaScript-geladene Bilder oder Bilder in CSS. Erhöht Chancen auf Sichtbarkeit in der Google Bildersuche.
Sitemap-Typen im Überblick:
| Typ | Einsatz | Besonderheiten |
|---|---|---|
| Standard-Sitemap | Alle Websites | Basis; <loc>, <lastmod>, <changefreq>, <priority> |
| Video Sitemap | Video-Publisher | Zusatzinfos zu Videos; hilft bei Video-Rich-Results |
| Image Sitemap | Bildlastige Seiten | Verbessert Indexierung von Bildern |
| News Sitemap | Nachrichtenportale | Nur letzte 48h; Google News-Integration |
| Sitemap Index | Große Websites | Enthält Verweise auf mehrere Sub-Sitemaps |
Sitemap-Größe und -Aufteilung
Eine einzelne XML-Sitemap darf maximal 50.000 URLs enthalten und 50 MB (unkomprimiert) groß sein. Große Websites mit Zehntausenden von Seiten – E-Commerce-Shops, Nachrichtenportale, Jobbörsen – benötigen mehrere Sitemaps, die über eine Sitemap-Index-Datei zusammengefasst werden.
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>https://www.beispiel.de/sitemap-seiten.xml</loc>
<lastmod>2026-03-29</lastmod>
</sitemap>
<sitemap>
<loc>https://www.beispiel.de/sitemap-produkte.xml</loc>
<lastmod>2026-03-29</lastmod>
</sitemap>
</sitemapindex>
Für WordPress-Websites übernehmen Plugins wie Yoast SEO oder Rank Math die automatische Sitemap-Verwaltung inkl. Index-Dateien.
Sitemap-Generatoren und automatisierte Erstellung
Next.js (App Router)
Für Next.js-Projekte wie pakumedia.de bietet der App Router eine native Sitemap-Generierung. Eine sitemap.ts-Datei im app/-Verzeichnis generiert dynamisch die Sitemap:
// app/sitemap.ts
import { MetadataRoute } from 'next'
export default function sitemap(): MetadataRoute.Sitemap {
return [
{ url: 'https://pakumedia.de', lastModified: new Date() },
{ url: 'https://pakumedia.de/leistungen', lastModified: new Date() },
]
}
WordPress + Yoast SEO
Yoast SEO generiert automatisch eine XML-Sitemap unter /sitemap_index.xml mit getrennten Sitemaps für Seiten, Beiträge, Kategorien und Medien. Granulare Einstellung möglich (welche Post-Typen, welche Taxonomien).
Screaming Frog
Der Screaming Frog SEO Spider kann Websites crawlen und eine Sitemap exportieren – besonders nützlich für Websites ohne automatisierte Lösung oder zur Sitemap-Validierung.
Crawl Budget und Sitemap
Das Crawl Budget bezeichnet die Anzahl der URLs, die Googlebot in einem bestimmten Zeitraum crawlt. Für mittelgroße bis große Websites ist das Crawl Budget ein limitierender Faktor.
Eine saubere Sitemap hilft, das Crawl Budget optimal zu nutzen:
- Nur wichtige, indizierbare Seiten in der Sitemap
- Keine Redirect-Ketten zu Sitemap-URLs
- Aktuelles
lastmod-Datum nur bei echten Änderungen
Was NICHT in die Sitemap gehört
Das ist ein oft unterschätzter Punkt. Falsche URLs in der Sitemap verschwenden Crawl Budget und senden verwirrende Signale:
| Ausschließen | Begründung |
|---|---|
| noindex-Seiten | Widersprüchliches Signal; noindex nicht in Sitemap |
| 301/302-Weiterleitungen | Sitemap soll nur kanonische End-URLs enthalten |
| Parameter-URLs (z.B. ?sort=asc) | Duplicate Content; nur kanonische URL |
| 404-Seiten | Fehlende Seiten haben keine Sitemap-Berechtigung |
| Inhalte hinter Login | Crawler können nicht zugreifen |
| Paginated Pages (Seite 2, 3...) | Nur wenn inhaltlich eigenständig; meist ausschließen |
Sitemap-Fehler diagnostizieren
Die Search Console zeigt Sitemap-Fehler detailliert. Häufige Fehler und Lösungen:
"URL nicht indiziert: Crawled - currently not indexed" → Google hat die Seite gecrawlt, aber entschieden, sie nicht zu indexieren. Inhalt prüfen: zu kurz, zu ähnlich zu anderen Seiten, wenig Mehrwert?
"Redirect-Fehler" → Sitemap-URL leitet weiter. Sitemap auf Ziel-URL aktualisieren.
"Nicht gefunden (404)" → URL existiert nicht mehr. Aus Sitemap entfernen oder Redirect einrichten.
"Soft 404" → Seite gibt Status 200 zurück, hat aber keinen sinnvollen Inhalt (z.B. leere Suchergebnis-Seite). Inhalt verbessern oder aus Sitemap entfernen.
Sitemap-Best-Practices auf einen Blick
Eine saubere Sitemap-Strategie zusammengefasst:
- Automatische Generierung bevorzugen (verhindert veraltete URLs)
- Sitemap in der
robots.txtangeben:Sitemap: https://domain.de/sitemap.xml - Bei Google Search Console einreichen und regelmäßig auf Fehler prüfen
- Nur indizierbare, kanonische URLs aufnehmen
lastmodnur bei echten inhaltlichen Änderungen aktualisieren- Ab 50.000 URLs: Sitemap-Index mit mehreren Sub-Sitemaps
- Spezielle Sitemaps für Videos, Bilder oder News-Inhalte
- Sitemap und XML-Sitemap als Teil der gesamten SEO-Infrastruktur verstehen