Was ist eine XML-Sitemap?

Eine XML-Sitemap ist eine strukturierte Datei im XML-Format, die alle wichtigen URLs einer Website für Suchmaschinen auflistet. Sie dient als Navigationskarte für Crawler wie Googlebot und erleichtert die Entdeckung und Indexierung neuer oder aktualisierter Inhalte.

Braucht jede Website eine XML-Sitemap?

Nicht zwingend, aber empfohlen. Google findet kleinere Websites auch ohne Sitemap über interne Links. Sitemaps sind besonders wichtig für große Websites, neue Domains, Seiten mit JavaScript-Inhalten, und immer wenn URLs nicht gut intern verlinkt sind.

Wie viele URLs darf eine XML-Sitemap enthalten?

Eine einzelne XML-Sitemap darf maximal 50.000 URLs enthalten und darf 50 MB (unkomprimiert) nicht überschreiten. Für größere Websites wird ein Sitemap-Index verwendet, der auf mehrere Sub-Sitemaps verweist – jede davon hält sich an das 50.000-URLs-Limit.

Muss man die XML-Sitemap manuell aktualisieren?

Für dynamische Websites empfiehlt sich eine automatisch generierte Sitemap (durch Plugins wie Yoast SEO oder frameworkspezifische Lösungen wie Next.js sitemap.ts). Manuelle Sitemaps sind fehleranfällig und schnell veraltet. Google erkennt nicht automatisch, dass eine Sitemap aktualisiert wurde – das lastmod-Datum oder ein erneutes Einreichen hilft.

Was ist der Unterschied zwischen XML-Sitemap und robots.txt?

Die robots.txt teilt Crawlern mit, welche Seiten sie NICHT besuchen sollen. Die XML-Sitemap teilt Crawlern mit, welche Seiten existieren und priorisiert werden sollen. Beide ergänzen sich: robots.txt schützt, Sitemap empfiehlt. Die Sitemap-URL sollte in der robots.txt angegeben werden.

XML-Sitemap (XML) – Definition & Erklärung

Eine XML-Sitemap ist eine strukturierte Datei im XML-Format (Extensible Markup Language), die alle wichtigen URLs einer Website für Suchmaschinen-Crawler auflistet. Sie fungiert als Inhaltsverzeichnis oder Navigationskarte, die Googlebot und anderen Crawlern mitteilt, welche Seiten existieren, wann sie zuletzt geändert wurden und wie wichtig sie relativ zueinander sind.

XML steht dabei für "Extensible Markup Language" – ein standardisiertes Format für maschinenlesbare Daten, das seit dem Sitemaps-Protokoll 2005 für Web-Sitemaps genutzt wird. Das Protokoll wurde von Google, Yahoo und Microsoft gemeinsam entwickelt und ist der internationale Standard.

XML-Sitemap vs. HTML-Sitemap: Zweck und Unterschied

Beide Sitemap-Typen existieren nebeneinander – mit fundamental verschiedenen Zielgruppen:

Merkmal	XML-Sitemap	HTML-Sitemap
Zielgruppe	Suchmaschinen-Crawler	Menschliche Besucher
Format	XML (maschinenlesbar)	HTML (menschenlesbar)
Typische URL	/sitemap.xml	/sitemap/ oder /uebersicht/
Inhalt	Alle URLs mit Metadaten	Strukturierte Linkliste wichtiger Seiten
SEO-Wirkung	Direkt (Crawling + Indexierung)	Indirekt (interne Verlinkung)
Pflege	Automatisiert (CMS, Framework)	Manuell oder automatisiert
Für wen nötig	Alle professionellen Websites	Größere Websites mit vielen Seiten

Für SEO ist die XML-Sitemap die entscheidende Variante. Die HTML-Sitemap hat nur bei größeren Websites mit komplexer Struktur nennenswerte Bedeutung.

XML-Sitemap-Aufbau: Alle Tags erklärt

Grundstruktur einer einfachen XML-Sitemap

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://www.pakumedia.de/</loc>
    <lastmod>2026-03-29</lastmod>
    <changefreq>weekly</changefreq>
    <priority>1.0</priority>
  </url>
  <url>
    <loc>https://www.pakumedia.de/leistungen/</loc>
    <lastmod>2026-03-15</lastmod>
    <changefreq>monthly</changefreq>
    <priority>0.8</priority>
  </url>
  <url>
    <loc>https://www.pakumedia.de/blog/</loc>
    <lastmod>2026-03-29</lastmod>
    <changefreq>daily</changefreq>
    <priority>0.7</priority>
  </url>
</urlset>

`<urlset>` – Das Root-Element

Der Wurzel-Container, der alle URL-Einträge umschließt. Der xmlns-Namespace-Attribut gibt das verwendete Protokoll an und ist Pflichtfeld. Für spezielle Sitemaps (Video, News, Image) werden zusätzliche Namespaces ergänzt.

`<url>` – Container für eine einzelne URL

Jeder URL-Eintrag wird in ein eigenes <url>-Element eingeschlossen. Eine gültige XML-Sitemap enthält mindestens das <loc>-Pflichtfeld pro URL-Eintrag.

`<loc>` – Die URL (Pflichtfeld)

Die vollständige, kanonische URL der Seite. Immer mit Protokoll (https://), Domain und Pfad. Konsistent mit der bevorzugten URL-Variante der Website (mit oder ohne Trailing Slash – aber einheitlich).

Wichtige Regeln für <loc>:

Immer HTTPS (nicht HTTP)
Konsistente Schreibweise (mit oder ohne Trailing Slash – aber nie beides)
URL-Encoding für Sonderzeichen (Leerzeichen = %20)
Keine Parameter-URLs (außer kanonisch wichtig)

`<lastmod>` – Letzte Änderung (empfohlen)

Das Datum der letzten inhaltlichen Änderung im Format YYYY-MM-DD (W3C-Datum-Format). Optional, aber empfohlen – es signalisiert Google, welche Seiten kürzlich aktualisiert wurden und bevorzugt gecrawlt werden sollten.

Wichtig: lastmod sollte nur aktualisiert werden, wenn tatsächlich relevanter Content geändert wurde. Automatische Setzung auf das aktuelle Datum ohne echte Änderung wird von Google erkannt und ignoriert – oder schadet der Credibility.

`<changefreq>` – Änderungshäufigkeit (optional)

Gibt an, wie häufig sich die Seite voraussichtlich ändert. Mögliche Werte:

Wert	Bedeutung	Typische Verwendung
`always`	Ändert sich bei jedem Zugriff	Live-Daten, Echtzeit-Seiten
`hourly`	Stündlich	Nachrichtenfeeds, Börsenkurse
`daily`	Täglich	Blogs, News-Portale
`weekly`	Wöchentlich	Startseite, Kategorieseiten
`monthly`	Monatlich	Serviceleistungsseiten, Über-uns
`yearly`	Jährlich	Impressum, Datenschutz, statische Seiten
`never`	Nie	Archivierte Seiten

Einschränkung: Google nutzt changefreq nur als Hinweis, nicht als Anweisung. Die tatsächliche Crawl-Frequenz wird von Google selbst auf Basis von Nutzersignalen und lastmod-Änderungen bestimmt.

`<priority>` – Relative Priorität (optional)

Ein Dezimalwert von 0.0 bis 1.0, der die relative Wichtigkeit einer URL im Vergleich zu anderen Seiten derselben Website angibt. Standardwert: 0.5

Empfohlene Priority-Werte:

Seitentyp	Empfohlene Priority
Startseite	1.0
Hauptkategorien, Hauptleistungsseiten	0.8
Unterseiten, Blogbeiträge	0.6–0.7
Archivseiten, Tag-Seiten	0.3–0.5

Hinweis: Priority ist nur relativ – sie hat keinen absoluten Einfluss auf das Ranking. Google nutzt sie, um innerhalb der eigenen Website Crawl-Ressourcen zu priorisieren.

XML-Sitemap bei Google Search Console einreichen

Das Einreichen der Sitemap in der Google Search Console ist der entscheidende Schritt, der Google aktiv auf die Sitemap aufmerksam macht:

Schritt-für-Schritt:

Google Search Console öffnen: search.google.com/search-console
Property auswählen (oder neue Property hinzufügen)
Linkes Menü → "Sitemaps"
Im Feld "Sitemap-URL hinzufügen": sitemap.xml eingeben
"Senden" klicken
Status prüfen (erscheint nach Minuten bis Stunden)

Alternative: Sitemap-URL in der robots.txt angeben:

User-agent: *
Disallow: /admin/
Sitemap: https://www.pakumedia.de/sitemap.xml

Wichtige Diagnosedaten in der Search Console:

Eingereichte URLs: Wie viele URLs enthält die Sitemap?
Indizierte URLs: Wie viele hat Google tatsächlich indexiert?
Fehler: Welche URLs konnten nicht gecrawlt werden und warum?

Eine signifikante Lücke zwischen eingereichten und indizierten URLs signalisiert ein Problem: entweder enthält die Sitemap URLs, die Google nicht indexieren möchte (dünner Content, noindex) – oder Google hat technische Crawling-Probleme.

Sitemap-Index für große Websites

Eine einzelne Sitemap ist auf 50.000 URLs und 50 MB begrenzt. Größere Websites – E-Commerce-Shops, Nachrichtenportale, Lexikon-Websites – benötigen mehrere Sitemaps, die über eine Sitemap-Index-Datei organisiert werden.

<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <sitemap>
    <loc>https://www.pakumedia.de/sitemap-seiten.xml</loc>
    <lastmod>2026-03-29</lastmod>
  </sitemap>
  <sitemap>
    <loc>https://www.pakumedia.de/sitemap-lexikon.xml</loc>
    <lastmod>2026-03-29</lastmod>
  </sitemap>
  <sitemap>
    <loc>https://www.pakumedia.de/sitemap-blog.xml</loc>
    <lastmod>2026-03-29</lastmod>
  </sitemap>
</sitemapindex>

Der Sitemap-Index selbst unterliegt ebenfalls dem 50.000-Limit – kann aber bis zu 50.000 Sub-Sitemap-Referenzen enthalten. Das ermöglicht theoretisch bis zu 2,5 Milliarden URLs pro Index-Datei.

Spezielle Sitemap-Typen

News Sitemap

Für Google News optimiert. Enthält nur Artikel der letzten 48 Stunden und spezielle Metadaten:

<url>
  <loc>https://www.beispiel.de/artikel/breaking-news</loc>
  <news:news>
    <news:publication>
      <news:name>Beispiel-Nachrichten</news:name>
      <news:language>de</news:language>
    </news:publication>
    <news:publication_date>2026-03-29T10:00:00+01:00</news:publication_date>
    <news:title>Aktuelle Meldung</news:title>
  </news:news>
</url>

Video Sitemap

Informiert Google über Video-Inhalte auf der Website:

Videotitel und -beschreibung
Thumbnail-URL
Video-URL oder Player-URL
Dauer
Veröffentlichungsdatum

Erhöht Chancen auf Video-Rich-Results und Video-Karussell in der Google-Suche.

Image Sitemap

Hilft Google, Bilder zu entdecken – besonders bei JavaScript-geladenen Bildern oder CSS-Background-Images, die ohne Sitemap möglicherweise nicht gecrawlt werden.

Spezielle Sitemaps auf einen Blick:

Sitemap-Typ	Namespace	Für wen	Besonderheiten
Standard	sitemap/0.9	Alle Websites	Basis-Format
News	news/0.9	Nachrichtenportale	Nur letzte 48h; Google News
Video	video/1.1	Video-Publisher	Thumbnail, Dauer, Embed
Image	image/1.1	Bildlastige Sites	Bildinformationen
Sitemap-Index	sitemap/0.9	Große Sites	Verweist auf Sub-Sitemaps

Automatische Sitemap-Generierung

Next.js (App Router)

In Next.js 13+ mit App Router kann die Sitemap nativ generiert werden:

// app/sitemap.ts
import { MetadataRoute } from 'next'

export default async function sitemap(): Promise<MetadataRoute.Sitemap> {
  // Dynamische URLs aus Datenbank/CMS abrufen
  const posts = await getPosts()

  return [
    {
      url: 'https://pakumedia.de',
      lastModified: new Date(),
      changeFrequency: 'weekly',
      priority: 1,
    },
    ...posts.map(post => ({
      url: `https://pakumedia.de/blog/${post.slug}`,
      lastModified: post.updatedAt,
      changeFrequency: 'monthly' as const,
      priority: 0.7,
    })),
  ]
}

WordPress + Yoast SEO

Yoast SEO generiert automatisch eine sitemap_index.xml mit separaten Sub-Sitemaps für Posts, Pages, Kategorien und Medien. Alle Einstellungen (welche Post-Typen, noindex-Seiten ausschließen) sind über das Plugin konfigurierbar.

Screaming Frog SEO Spider

Für Websites ohne CMS-Plugin oder zur Validierung: Screaming Frog crawlt die gesamte Website und exportiert eine valide XML-Sitemap.

Was NICHT in die XML-Sitemap gehört

Ein oft vernachlässigter, aber entscheidender Punkt:

Ausschließen	Begründung
noindex-Seiten	Widerspruch: Sitemap sagt "indexiere", noindex sagt "nicht indexieren"
Weiterleitungen (301/302)	Nur kanonische End-URLs in die Sitemap
404-Fehlerseiten	Nicht vorhandene Seiten haben keine Sitemap-Berechtigung
Parameter-URLs (`?sort=asc`)	Duplicate Content; kanonische URL genügt
Login-geschützte Inhalte	Crawler können nicht zugreifen
Dünne Inhalte / Thin Content	Google indexiert sie ohnehin nicht – Sitemap-Platz sparen
Paginated Pages (Seite 2, 3...)	Meist ausschließen, außer eigenständiger Content

Sitemap-Fehler in der Search Console diagnostizieren

Die Google Search Console zeigt detaillierte Fehlerberichte für Sitemap-Issues:

Häufige Fehler und Lösungen:

Fehlermeldung	Ursache	Lösung
"Redirect-Fehler"	Sitemap-URL leitet weiter	Sitemap auf Ziel-URL aktualisieren
"Nicht gefunden (404)"	URL existiert nicht mehr	URL aus Sitemap entfernen oder Redirect einrichten
"Soft 404"	Seite gibt 200, hat aber leeren/dünnen Inhalt	Content verbessern oder aus Sitemap entfernen
"Indexiert, nicht in Sitemap"	Google hat URL gefunden, sie ist aber nicht in Sitemap	Sitemap vervollständigen oder URL noindexen
"Crawled – currently not indexed"	Google hat gecrawlt, aber nicht indexiert	Content-Qualität und Relevanz prüfen

Sitemap und Crawl Budget

Das Crawl Budget ist die Anzahl der URLs, die Google in einem bestimmten Zeitraum crawlt. Für große Websites ist es ein limitierender Faktor – und eine saubere Sitemap hilft, es optimal zu nutzen.

Crawl-Budget-Optimierung durch Sitemap:

Nur hochwertige, kanonische URLs einschließen
lastmod präzise und aktuell halten – Google crawlt geänderte Seiten bevorzugt
Redirect-Chains aus Sitemap entfernen
Sitemap-Index für verschiedene Content-Typen trennen

XML-Sitemap Best-Practices-Checkliste

Eine vollständige Checkliste für eine professionelle XML-Sitemap:

Sitemap unter /sitemap.xml oder /sitemap_index.xml erreichbar
In robots.txt angegeben: Sitemap: https://domain.de/sitemap.xml
In Google Search Console eingereicht und auf Fehler geprüft
Nur kanonische, indizierbare URLs enthalten
lastmod nur bei echten inhaltlichen Änderungen aktualisiert
Keine noindex-Seiten, keine Redirects, keine 404-URLs
Bei > 50.000 URLs: Sitemap-Index mit Sub-Sitemaps
Spezielle Sitemaps für Videos/Bilder (wenn relevant)
Regelmäßiger Review (mindestens monatlich)

XML-Sitemap vs. HTML-Sitemap: Zweck und Unterschied

Beide Sitemap-Typen existieren nebeneinander – mit fundamental verschiedenen Zielgruppen:

Merkmal	XML-Sitemap	HTML-Sitemap
Zielgruppe	Suchmaschinen-Crawler	Menschliche Besucher
Format	XML (maschinenlesbar)	HTML (menschenlesbar)
Typische URL	/sitemap.xml	/sitemap/ oder /uebersicht/
Inhalt	Alle URLs mit Metadaten	Strukturierte Linkliste wichtiger Seiten
SEO-Wirkung	Direkt (Crawling + Indexierung)	Indirekt (interne Verlinkung)
Pflege	Automatisiert (CMS, Framework)	Manuell oder automatisiert
Für wen nötig	Alle professionellen Websites	Größere Websites mit vielen Seiten

Für SEO ist die XML-Sitemap die entscheidende Variante. Die HTML-Sitemap hat nur bei größeren Websites mit komplexer Struktur nennenswerte Bedeutung.

XML-Sitemap-Aufbau: Alle Tags erklärt

Grundstruktur einer einfachen XML-Sitemap

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://www.pakumedia.de/</loc>
    <lastmod>2026-03-29</lastmod>
    <changefreq>weekly</changefreq>
    <priority>1.0</priority>
  </url>
  <url>
    <loc>https://www.pakumedia.de/leistungen/</loc>
    <lastmod>2026-03-15</lastmod>
    <changefreq>monthly</changefreq>
    <priority>0.8</priority>
  </url>
  <url>
    <loc>https://www.pakumedia.de/blog/</loc>
    <lastmod>2026-03-29</lastmod>
    <changefreq>daily</changefreq>
    <priority>0.7</priority>
  </url>
</urlset>

`<urlset>` – Das Root-Element

`<url>` – Container für eine einzelne URL

Jeder URL-Eintrag wird in ein eigenes <url>-Element eingeschlossen. Eine gültige XML-Sitemap enthält mindestens das <loc>-Pflichtfeld pro URL-Eintrag.

`<loc>` – Die URL (Pflichtfeld)

Wichtige Regeln für <loc>:

Immer HTTPS (nicht HTTP)
Konsistente Schreibweise (mit oder ohne Trailing Slash – aber nie beides)
URL-Encoding für Sonderzeichen (Leerzeichen = %20)
Keine Parameter-URLs (außer kanonisch wichtig)

`<lastmod>` – Letzte Änderung (empfohlen)

`<changefreq>` – Änderungshäufigkeit (optional)

Gibt an, wie häufig sich die Seite voraussichtlich ändert. Mögliche Werte:

Wert	Bedeutung	Typische Verwendung
`always`	Ändert sich bei jedem Zugriff	Live-Daten, Echtzeit-Seiten
`hourly`	Stündlich	Nachrichtenfeeds, Börsenkurse
`daily`	Täglich	Blogs, News-Portale
`weekly`	Wöchentlich	Startseite, Kategorieseiten
`monthly`	Monatlich	Serviceleistungsseiten, Über-uns
`yearly`	Jährlich	Impressum, Datenschutz, statische Seiten
`never`	Nie	Archivierte Seiten

`<priority>` – Relative Priorität (optional)

Ein Dezimalwert von 0.0 bis 1.0, der die relative Wichtigkeit einer URL im Vergleich zu anderen Seiten derselben Website angibt. Standardwert: 0.5

Empfohlene Priority-Werte:

Seitentyp	Empfohlene Priority
Startseite	1.0
Hauptkategorien, Hauptleistungsseiten	0.8
Unterseiten, Blogbeiträge	0.6–0.7
Archivseiten, Tag-Seiten	0.3–0.5

Hinweis: Priority ist nur relativ – sie hat keinen absoluten Einfluss auf das Ranking. Google nutzt sie, um innerhalb der eigenen Website Crawl-Ressourcen zu priorisieren.

XML-Sitemap bei Google Search Console einreichen

Das Einreichen der Sitemap in der Google Search Console ist der entscheidende Schritt, der Google aktiv auf die Sitemap aufmerksam macht:

Schritt-für-Schritt:

Google Search Console öffnen: search.google.com/search-console
Property auswählen (oder neue Property hinzufügen)
Linkes Menü → "Sitemaps"
Im Feld "Sitemap-URL hinzufügen": sitemap.xml eingeben
"Senden" klicken
Status prüfen (erscheint nach Minuten bis Stunden)

Alternative: Sitemap-URL in der robots.txt angeben:

User-agent: *
Disallow: /admin/
Sitemap: https://www.pakumedia.de/sitemap.xml

Wichtige Diagnosedaten in der Search Console:

Eingereichte URLs: Wie viele URLs enthält die Sitemap?
Indizierte URLs: Wie viele hat Google tatsächlich indexiert?
Fehler: Welche URLs konnten nicht gecrawlt werden und warum?

Sitemap-Index für große Websites

<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <sitemap>
    <loc>https://www.pakumedia.de/sitemap-seiten.xml</loc>
    <lastmod>2026-03-29</lastmod>
  </sitemap>
  <sitemap>
    <loc>https://www.pakumedia.de/sitemap-lexikon.xml</loc>
    <lastmod>2026-03-29</lastmod>
  </sitemap>
  <sitemap>
    <loc>https://www.pakumedia.de/sitemap-blog.xml</loc>
    <lastmod>2026-03-29</lastmod>
  </sitemap>
</sitemapindex>

Der Sitemap-Index selbst unterliegt ebenfalls dem 50.000-Limit – kann aber bis zu 50.000 Sub-Sitemap-Referenzen enthalten. Das ermöglicht theoretisch bis zu 2,5 Milliarden URLs pro Index-Datei.

Spezielle Sitemap-Typen

News Sitemap

Für Google News optimiert. Enthält nur Artikel der letzten 48 Stunden und spezielle Metadaten:

<url>
  <loc>https://www.beispiel.de/artikel/breaking-news</loc>
  <news:news>
    <news:publication>
      <news:name>Beispiel-Nachrichten</news:name>
      <news:language>de</news:language>
    </news:publication>
    <news:publication_date>2026-03-29T10:00:00+01:00</news:publication_date>
    <news:title>Aktuelle Meldung</news:title>
  </news:news>
</url>

Video Sitemap

Informiert Google über Video-Inhalte auf der Website:

Videotitel und -beschreibung
Thumbnail-URL
Video-URL oder Player-URL
Dauer
Veröffentlichungsdatum

Erhöht Chancen auf Video-Rich-Results und Video-Karussell in der Google-Suche.

Image Sitemap

Hilft Google, Bilder zu entdecken – besonders bei JavaScript-geladenen Bildern oder CSS-Background-Images, die ohne Sitemap möglicherweise nicht gecrawlt werden.

Spezielle Sitemaps auf einen Blick:

Sitemap-Typ	Namespace	Für wen	Besonderheiten
Standard	sitemap/0.9	Alle Websites	Basis-Format
News	news/0.9	Nachrichtenportale	Nur letzte 48h; Google News
Video	video/1.1	Video-Publisher	Thumbnail, Dauer, Embed
Image	image/1.1	Bildlastige Sites	Bildinformationen
Sitemap-Index	sitemap/0.9	Große Sites	Verweist auf Sub-Sitemaps

Automatische Sitemap-Generierung

Next.js (App Router)

In Next.js 13+ mit App Router kann die Sitemap nativ generiert werden:

// app/sitemap.ts
import { MetadataRoute } from 'next'

export default async function sitemap(): Promise<MetadataRoute.Sitemap> {
  // Dynamische URLs aus Datenbank/CMS abrufen
  const posts = await getPosts()

  return [
    {
      url: 'https://pakumedia.de',
      lastModified: new Date(),
      changeFrequency: 'weekly',
      priority: 1,
    },
    ...posts.map(post => ({
      url: `https://pakumedia.de/blog/${post.slug}`,
      lastModified: post.updatedAt,
      changeFrequency: 'monthly' as const,
      priority: 0.7,
    })),
  ]
}

WordPress + Yoast SEO

Screaming Frog SEO Spider

Für Websites ohne CMS-Plugin oder zur Validierung: Screaming Frog crawlt die gesamte Website und exportiert eine valide XML-Sitemap.

Was NICHT in die XML-Sitemap gehört

Ein oft vernachlässigter, aber entscheidender Punkt:

Ausschließen	Begründung
noindex-Seiten	Widerspruch: Sitemap sagt "indexiere", noindex sagt "nicht indexieren"
Weiterleitungen (301/302)	Nur kanonische End-URLs in die Sitemap
404-Fehlerseiten	Nicht vorhandene Seiten haben keine Sitemap-Berechtigung
Parameter-URLs (`?sort=asc`)	Duplicate Content; kanonische URL genügt
Login-geschützte Inhalte	Crawler können nicht zugreifen
Dünne Inhalte / Thin Content	Google indexiert sie ohnehin nicht – Sitemap-Platz sparen
Paginated Pages (Seite 2, 3...)	Meist ausschließen, außer eigenständiger Content

Sitemap-Fehler in der Search Console diagnostizieren

Die Google Search Console zeigt detaillierte Fehlerberichte für Sitemap-Issues:

Häufige Fehler und Lösungen:

Fehlermeldung	Ursache	Lösung
"Redirect-Fehler"	Sitemap-URL leitet weiter	Sitemap auf Ziel-URL aktualisieren
"Nicht gefunden (404)"	URL existiert nicht mehr	URL aus Sitemap entfernen oder Redirect einrichten
"Soft 404"	Seite gibt 200, hat aber leeren/dünnen Inhalt	Content verbessern oder aus Sitemap entfernen
"Indexiert, nicht in Sitemap"	Google hat URL gefunden, sie ist aber nicht in Sitemap	Sitemap vervollständigen oder URL noindexen
"Crawled – currently not indexed"	Google hat gecrawlt, aber nicht indexiert	Content-Qualität und Relevanz prüfen

Sitemap und Crawl Budget

Crawl-Budget-Optimierung durch Sitemap:

Nur hochwertige, kanonische URLs einschließen
lastmod präzise und aktuell halten – Google crawlt geänderte Seiten bevorzugt
Redirect-Chains aus Sitemap entfernen
Sitemap-Index für verschiedene Content-Typen trennen

XML-Sitemap Best-Practices-Checkliste

Eine vollständige Checkliste für eine professionelle XML-Sitemap:

Sitemap unter /sitemap.xml oder /sitemap_index.xml erreichbar
In robots.txt angegeben: Sitemap: https://domain.de/sitemap.xml
In Google Search Console eingereicht und auf Fehler geprüft
Nur kanonische, indizierbare URLs enthalten
lastmod nur bei echten inhaltlichen Änderungen aktualisiert
Keine noindex-Seiten, keine Redirects, keine 404-URLs
Bei > 50.000 URLs: Sitemap-Index mit Sub-Sitemaps
Spezielle Sitemaps für Videos/Bilder (wenn relevant)
Regelmäßiger Review (mindestens monatlich)

XML-Sitemap

XML-Sitemap vs. HTML-Sitemap: Zweck und Unterschied

XML-Sitemap-Aufbau: Alle Tags erklärt

Grundstruktur einer einfachen XML-Sitemap

<urlset> – Das Root-Element

<url> – Container für eine einzelne URL

<loc> – Die URL (Pflichtfeld)

<lastmod> – Letzte Änderung (empfohlen)

<changefreq> – Änderungshäufigkeit (optional)

<priority> – Relative Priorität (optional)

XML-Sitemap bei Google Search Console einreichen

Sitemap-Index für große Websites

Spezielle Sitemap-Typen

News Sitemap

Video Sitemap

Image Sitemap

Automatische Sitemap-Generierung

Next.js (App Router)

WordPress + Yoast SEO

Screaming Frog SEO Spider

Was NICHT in die XML-Sitemap gehört

Sitemap-Fehler in der Search Console diagnostizieren

Sitemap und Crawl Budget

XML-Sitemap Best-Practices-Checkliste

Häufige Fragen zu XML-Sitemap.

Sie brauchen eine Website?

Verwandte Begriffe.

Verwandte Artikel.

Let's talk.

XML-Sitemap

XML-Sitemap vs. HTML-Sitemap: Zweck und Unterschied

XML-Sitemap-Aufbau: Alle Tags erklärt

Grundstruktur einer einfachen XML-Sitemap

<urlset> – Das Root-Element

<url> – Container für eine einzelne URL

<loc> – Die URL (Pflichtfeld)

<lastmod> – Letzte Änderung (empfohlen)

<changefreq> – Änderungshäufigkeit (optional)

<priority> – Relative Priorität (optional)

XML-Sitemap bei Google Search Console einreichen

Sitemap-Index für große Websites

Spezielle Sitemap-Typen

News Sitemap

Video Sitemap

Image Sitemap

Automatische Sitemap-Generierung

Next.js (App Router)

WordPress + Yoast SEO

Screaming Frog SEO Spider

Was NICHT in die XML-Sitemap gehört

Sitemap-Fehler in der Search Console diagnostizieren

Sitemap und Crawl Budget

XML-Sitemap Best-Practices-Checkliste

Häufige Fragen zu XML-Sitemap.

Sie brauchen eine Website?

Verwandte Begriffe.

Verwandte Artikel.

Let's talk.

`<urlset>` – Das Root-Element

`<url>` – Container für eine einzelne URL

`<loc>` – Die URL (Pflichtfeld)

`<lastmod>` – Letzte Änderung (empfohlen)

`<changefreq>` – Änderungshäufigkeit (optional)

`<priority>` – Relative Priorität (optional)

`<urlset>` – Das Root-Element

`<url>` – Container für eine einzelne URL

`<loc>` – Die URL (Pflichtfeld)

`<lastmod>` – Letzte Änderung (empfohlen)

`<changefreq>` – Änderungshäufigkeit (optional)

`<priority>` – Relative Priorität (optional)