Eine XML-Sitemap ist eine strukturierte Datei im XML-Format (Extensible Markup Language), die alle wichtigen URLs einer Website für Suchmaschinen-Crawler auflistet. Sie fungiert als Inhaltsverzeichnis oder Navigationskarte, die Googlebot und anderen Crawlern mitteilt, welche Seiten existieren, wann sie zuletzt geändert wurden und wie wichtig sie relativ zueinander sind.
XML steht dabei für "Extensible Markup Language" – ein standardisiertes Format für maschinenlesbare Daten, das seit dem Sitemaps-Protokoll 2005 für Web-Sitemaps genutzt wird. Das Protokoll wurde von Google, Yahoo und Microsoft gemeinsam entwickelt und ist der internationale Standard.
XML-Sitemap vs. HTML-Sitemap: Zweck und Unterschied
Beide Sitemap-Typen existieren nebeneinander – mit fundamental verschiedenen Zielgruppen:
| Merkmal | XML-Sitemap | HTML-Sitemap |
|---|---|---|
| Zielgruppe | Suchmaschinen-Crawler | Menschliche Besucher |
| Format | XML (maschinenlesbar) | HTML (menschenlesbar) |
| Typische URL | /sitemap.xml | /sitemap/ oder /uebersicht/ |
| Inhalt | Alle URLs mit Metadaten | Strukturierte Linkliste wichtiger Seiten |
| SEO-Wirkung | Direkt (Crawling + Indexierung) | Indirekt (interne Verlinkung) |
| Pflege | Automatisiert (CMS, Framework) | Manuell oder automatisiert |
| Für wen nötig | Alle professionellen Websites | Größere Websites mit vielen Seiten |
Für SEO ist die XML-Sitemap die entscheidende Variante. Die HTML-Sitemap hat nur bei größeren Websites mit komplexer Struktur nennenswerte Bedeutung.
XML-Sitemap-Aufbau: Alle Tags erklärt
Grundstruktur einer einfachen XML-Sitemap
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://www.pakumedia.de/</loc>
<lastmod>2026-03-29</lastmod>
<changefreq>weekly</changefreq>
<priority>1.0</priority>
</url>
<url>
<loc>https://www.pakumedia.de/leistungen/</loc>
<lastmod>2026-03-15</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
<url>
<loc>https://www.pakumedia.de/blog/</loc>
<lastmod>2026-03-29</lastmod>
<changefreq>daily</changefreq>
<priority>0.7</priority>
</url>
</urlset>
<urlset> – Das Root-Element
Der Wurzel-Container, der alle URL-Einträge umschließt. Der xmlns-Namespace-Attribut gibt das verwendete Protokoll an und ist Pflichtfeld. Für spezielle Sitemaps (Video, News, Image) werden zusätzliche Namespaces ergänzt.
<url> – Container für eine einzelne URL
Jeder URL-Eintrag wird in ein eigenes <url>-Element eingeschlossen. Eine gültige XML-Sitemap enthält mindestens das <loc>-Pflichtfeld pro URL-Eintrag.
<loc> – Die URL (Pflichtfeld)
Die vollständige, kanonische URL der Seite. Immer mit Protokoll (https://), Domain und Pfad. Konsistent mit der bevorzugten URL-Variante der Website (mit oder ohne Trailing Slash – aber einheitlich).
Wichtige Regeln für <loc>:
- Immer HTTPS (nicht HTTP)
- Konsistente Schreibweise (mit oder ohne Trailing Slash – aber nie beides)
- URL-Encoding für Sonderzeichen (Leerzeichen =
%20) - Keine Parameter-URLs (außer kanonisch wichtig)
<lastmod> – Letzte Änderung (empfohlen)
Das Datum der letzten inhaltlichen Änderung im Format YYYY-MM-DD (W3C-Datum-Format). Optional, aber empfohlen – es signalisiert Google, welche Seiten kürzlich aktualisiert wurden und bevorzugt gecrawlt werden sollten.
Wichtig: lastmod sollte nur aktualisiert werden, wenn tatsächlich relevanter Content geändert wurde. Automatische Setzung auf das aktuelle Datum ohne echte Änderung wird von Google erkannt und ignoriert – oder schadet der Credibility.
<changefreq> – Änderungshäufigkeit (optional)
Gibt an, wie häufig sich die Seite voraussichtlich ändert. Mögliche Werte:
| Wert | Bedeutung | Typische Verwendung |
|---|---|---|
always | Ändert sich bei jedem Zugriff | Live-Daten, Echtzeit-Seiten |
hourly | Stündlich | Nachrichtenfeeds, Börsenkurse |
daily | Täglich | Blogs, News-Portale |
weekly | Wöchentlich | Startseite, Kategorieseiten |
monthly | Monatlich | Serviceleistungsseiten, Über-uns |
yearly | Jährlich | Impressum, Datenschutz, statische Seiten |
never | Nie | Archivierte Seiten |
Einschränkung: Google nutzt changefreq nur als Hinweis, nicht als Anweisung. Die tatsächliche Crawl-Frequenz wird von Google selbst auf Basis von Nutzersignalen und lastmod-Änderungen bestimmt.
<priority> – Relative Priorität (optional)
Ein Dezimalwert von 0.0 bis 1.0, der die relative Wichtigkeit einer URL im Vergleich zu anderen Seiten derselben Website angibt. Standardwert: 0.5
Empfohlene Priority-Werte:
| Seitentyp | Empfohlene Priority |
|---|---|
| Startseite | 1.0 |
| Hauptkategorien, Hauptleistungsseiten | 0.8 |
| Unterseiten, Blogbeiträge | 0.6–0.7 |
| Archivseiten, Tag-Seiten | 0.3–0.5 |
Hinweis: Priority ist nur relativ – sie hat keinen absoluten Einfluss auf das Ranking. Google nutzt sie, um innerhalb der eigenen Website Crawl-Ressourcen zu priorisieren.
XML-Sitemap bei Google Search Console einreichen
Das Einreichen der Sitemap in der Google Search Console ist der entscheidende Schritt, der Google aktiv auf die Sitemap aufmerksam macht:
Schritt-für-Schritt:
- Google Search Console öffnen: search.google.com/search-console
- Property auswählen (oder neue Property hinzufügen)
- Linkes Menü → "Sitemaps"
- Im Feld "Sitemap-URL hinzufügen":
sitemap.xmleingeben - "Senden" klicken
- Status prüfen (erscheint nach Minuten bis Stunden)
Alternative: Sitemap-URL in der robots.txt angeben:
User-agent: *
Disallow: /admin/
Sitemap: https://www.pakumedia.de/sitemap.xml
Wichtige Diagnosedaten in der Search Console:
- Eingereichte URLs: Wie viele URLs enthält die Sitemap?
- Indizierte URLs: Wie viele hat Google tatsächlich indexiert?
- Fehler: Welche URLs konnten nicht gecrawlt werden und warum?
Eine signifikante Lücke zwischen eingereichten und indizierten URLs signalisiert ein Problem: entweder enthält die Sitemap URLs, die Google nicht indexieren möchte (dünner Content, noindex) – oder Google hat technische Crawling-Probleme.
Sitemap-Index für große Websites
Eine einzelne Sitemap ist auf 50.000 URLs und 50 MB begrenzt. Größere Websites – E-Commerce-Shops, Nachrichtenportale, Lexikon-Websites – benötigen mehrere Sitemaps, die über eine Sitemap-Index-Datei organisiert werden.
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>https://www.pakumedia.de/sitemap-seiten.xml</loc>
<lastmod>2026-03-29</lastmod>
</sitemap>
<sitemap>
<loc>https://www.pakumedia.de/sitemap-lexikon.xml</loc>
<lastmod>2026-03-29</lastmod>
</sitemap>
<sitemap>
<loc>https://www.pakumedia.de/sitemap-blog.xml</loc>
<lastmod>2026-03-29</lastmod>
</sitemap>
</sitemapindex>
Der Sitemap-Index selbst unterliegt ebenfalls dem 50.000-Limit – kann aber bis zu 50.000 Sub-Sitemap-Referenzen enthalten. Das ermöglicht theoretisch bis zu 2,5 Milliarden URLs pro Index-Datei.
Spezielle Sitemap-Typen
News Sitemap
Für Google News optimiert. Enthält nur Artikel der letzten 48 Stunden und spezielle Metadaten:
<url>
<loc>https://www.beispiel.de/artikel/breaking-news</loc>
<news:news>
<news:publication>
<news:name>Beispiel-Nachrichten</news:name>
<news:language>de</news:language>
</news:publication>
<news:publication_date>2026-03-29T10:00:00+01:00</news:publication_date>
<news:title>Aktuelle Meldung</news:title>
</news:news>
</url>
Video Sitemap
Informiert Google über Video-Inhalte auf der Website:
- Videotitel und -beschreibung
- Thumbnail-URL
- Video-URL oder Player-URL
- Dauer
- Veröffentlichungsdatum
Erhöht Chancen auf Video-Rich-Results und Video-Karussell in der Google-Suche.
Image Sitemap
Hilft Google, Bilder zu entdecken – besonders bei JavaScript-geladenen Bildern oder CSS-Background-Images, die ohne Sitemap möglicherweise nicht gecrawlt werden.
Spezielle Sitemaps auf einen Blick:
| Sitemap-Typ | Namespace | Für wen | Besonderheiten |
|---|---|---|---|
| Standard | sitemap/0.9 | Alle Websites | Basis-Format |
| News | news/0.9 | Nachrichtenportale | Nur letzte 48h; Google News |
| Video | video/1.1 | Video-Publisher | Thumbnail, Dauer, Embed |
| Image | image/1.1 | Bildlastige Sites | Bildinformationen |
| Sitemap-Index | sitemap/0.9 | Große Sites | Verweist auf Sub-Sitemaps |
Automatische Sitemap-Generierung
Next.js (App Router)
In Next.js 13+ mit App Router kann die Sitemap nativ generiert werden:
// app/sitemap.ts
import { MetadataRoute } from 'next'
export default async function sitemap(): Promise<MetadataRoute.Sitemap> {
// Dynamische URLs aus Datenbank/CMS abrufen
const posts = await getPosts()
return [
{
url: 'https://pakumedia.de',
lastModified: new Date(),
changeFrequency: 'weekly',
priority: 1,
},
...posts.map(post => ({
url: `https://pakumedia.de/blog/${post.slug}`,
lastModified: post.updatedAt,
changeFrequency: 'monthly' as const,
priority: 0.7,
})),
]
}
WordPress + Yoast SEO
Yoast SEO generiert automatisch eine sitemap_index.xml mit separaten Sub-Sitemaps für Posts, Pages, Kategorien und Medien. Alle Einstellungen (welche Post-Typen, noindex-Seiten ausschließen) sind über das Plugin konfigurierbar.
Screaming Frog SEO Spider
Für Websites ohne CMS-Plugin oder zur Validierung: Screaming Frog crawlt die gesamte Website und exportiert eine valide XML-Sitemap.
Was NICHT in die XML-Sitemap gehört
Ein oft vernachlässigter, aber entscheidender Punkt:
| Ausschließen | Begründung |
|---|---|
| noindex-Seiten | Widerspruch: Sitemap sagt "indexiere", noindex sagt "nicht indexieren" |
| Weiterleitungen (301/302) | Nur kanonische End-URLs in die Sitemap |
| 404-Fehlerseiten | Nicht vorhandene Seiten haben keine Sitemap-Berechtigung |
Parameter-URLs (?sort=asc) | Duplicate Content; kanonische URL genügt |
| Login-geschützte Inhalte | Crawler können nicht zugreifen |
| Dünne Inhalte / Thin Content | Google indexiert sie ohnehin nicht – Sitemap-Platz sparen |
| Paginated Pages (Seite 2, 3...) | Meist ausschließen, außer eigenständiger Content |
Sitemap-Fehler in der Search Console diagnostizieren
Die Google Search Console zeigt detaillierte Fehlerberichte für Sitemap-Issues:
Häufige Fehler und Lösungen:
| Fehlermeldung | Ursache | Lösung |
|---|---|---|
| "Redirect-Fehler" | Sitemap-URL leitet weiter | Sitemap auf Ziel-URL aktualisieren |
| "Nicht gefunden (404)" | URL existiert nicht mehr | URL aus Sitemap entfernen oder Redirect einrichten |
| "Soft 404" | Seite gibt 200, hat aber leeren/dünnen Inhalt | Content verbessern oder aus Sitemap entfernen |
| "Indexiert, nicht in Sitemap" | Google hat URL gefunden, sie ist aber nicht in Sitemap | Sitemap vervollständigen oder URL noindexen |
| "Crawled – currently not indexed" | Google hat gecrawlt, aber nicht indexiert | Content-Qualität und Relevanz prüfen |
Sitemap und Crawl Budget
Das Crawl Budget ist die Anzahl der URLs, die Google in einem bestimmten Zeitraum crawlt. Für große Websites ist es ein limitierender Faktor – und eine saubere Sitemap hilft, es optimal zu nutzen.
Crawl-Budget-Optimierung durch Sitemap:
- Nur hochwertige, kanonische URLs einschließen
lastmodpräzise und aktuell halten – Google crawlt geänderte Seiten bevorzugt- Redirect-Chains aus Sitemap entfernen
- Sitemap-Index für verschiedene Content-Typen trennen
XML-Sitemap Best-Practices-Checkliste
Eine vollständige Checkliste für eine professionelle XML-Sitemap:
- Sitemap unter
/sitemap.xmloder/sitemap_index.xmlerreichbar - In
robots.txtangegeben:Sitemap: https://domain.de/sitemap.xml - In Google Search Console eingereicht und auf Fehler geprüft
- Nur kanonische, indizierbare URLs enthalten
lastmodnur bei echten inhaltlichen Änderungen aktualisiert- Keine noindex-Seiten, keine Redirects, keine 404-URLs
- Bei > 50.000 URLs: Sitemap-Index mit Sub-Sitemaps
- Spezielle Sitemaps für Videos/Bilder (wenn relevant)
- Regelmäßiger Review (mindestens monatlich)