PAKU Media
StartseiteLeistungenPortfolioÜber unsBlogKontakt
PAKU Media

Kreativagentur aus Bielefeld für Webdesign, Videografie und Social Media — seit 2022.

Partner

Navigation

  • ›Startseite
  • ›Leistungen
  • ›Portfolio
  • ›Über uns
  • ›Branchen
  • ›Blog
  • ›Kontakt

Leistungen

  • ›Webdesign
  • ›Videografie
  • ›Social Media Ads
  • ›App Design
  • ›Lexikon
  • ›Tools

Kontakt

Pamuk und Kuscu GbR

Friedhofstraße 171
33659 Bielefeld

hello@pakumedia.de

0521 98 99 40 99

PAKU.Media

© 2026 PAKU Media. Alle Rechte vorbehalten.

ImpressumDatenschutzAGBLexikonToolsSitemap
Home/Lexikon/XML-Sitemap
WebentwicklungXML

XML-Sitemap

Zuletzt aktualisiert: 2026-03-29

Eine XML-Sitemap ist eine strukturierte Datei im XML-Format (Extensible Markup Language), die alle wichtigen URLs einer Website für Suchmaschinen-Crawler auflistet. Sie fungiert als Inhaltsverzeichnis oder Navigationskarte, die Googlebot und anderen Crawlern mitteilt, welche Seiten existieren, wann sie zuletzt geändert wurden und wie wichtig sie relativ zueinander sind.

XML steht dabei für "Extensible Markup Language" – ein standardisiertes Format für maschinenlesbare Daten, das seit dem Sitemaps-Protokoll 2005 für Web-Sitemaps genutzt wird. Das Protokoll wurde von Google, Yahoo und Microsoft gemeinsam entwickelt und ist der internationale Standard.

XML-Sitemap vs. HTML-Sitemap: Zweck und Unterschied

Beide Sitemap-Typen existieren nebeneinander – mit fundamental verschiedenen Zielgruppen:

MerkmalXML-SitemapHTML-Sitemap
ZielgruppeSuchmaschinen-CrawlerMenschliche Besucher
FormatXML (maschinenlesbar)HTML (menschenlesbar)
Typische URL/sitemap.xml/sitemap/ oder /uebersicht/
InhaltAlle URLs mit MetadatenStrukturierte Linkliste wichtiger Seiten
SEO-WirkungDirekt (Crawling + Indexierung)Indirekt (interne Verlinkung)
PflegeAutomatisiert (CMS, Framework)Manuell oder automatisiert
Für wen nötigAlle professionellen WebsitesGrößere Websites mit vielen Seiten

Für SEO ist die XML-Sitemap die entscheidende Variante. Die HTML-Sitemap hat nur bei größeren Websites mit komplexer Struktur nennenswerte Bedeutung.

XML-Sitemap-Aufbau: Alle Tags erklärt

Grundstruktur einer einfachen XML-Sitemap

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://www.pakumedia.de/</loc>
    <lastmod>2026-03-29</lastmod>
    <changefreq>weekly</changefreq>
    <priority>1.0</priority>
  </url>
  <url>
    <loc>https://www.pakumedia.de/leistungen/</loc>
    <lastmod>2026-03-15</lastmod>
    <changefreq>monthly</changefreq>
    <priority>0.8</priority>
  </url>
  <url>
    <loc>https://www.pakumedia.de/blog/</loc>
    <lastmod>2026-03-29</lastmod>
    <changefreq>daily</changefreq>
    <priority>0.7</priority>
  </url>
</urlset>

<urlset> – Das Root-Element

Der Wurzel-Container, der alle URL-Einträge umschließt. Der xmlns-Namespace-Attribut gibt das verwendete Protokoll an und ist Pflichtfeld. Für spezielle Sitemaps (Video, News, Image) werden zusätzliche Namespaces ergänzt.

<url> – Container für eine einzelne URL

Jeder URL-Eintrag wird in ein eigenes <url>-Element eingeschlossen. Eine gültige XML-Sitemap enthält mindestens das <loc>-Pflichtfeld pro URL-Eintrag.

<loc> – Die URL (Pflichtfeld)

Die vollständige, kanonische URL der Seite. Immer mit Protokoll (https://), Domain und Pfad. Konsistent mit der bevorzugten URL-Variante der Website (mit oder ohne Trailing Slash – aber einheitlich).

Wichtige Regeln für <loc>:

  • Immer HTTPS (nicht HTTP)
  • Konsistente Schreibweise (mit oder ohne Trailing Slash – aber nie beides)
  • URL-Encoding für Sonderzeichen (Leerzeichen = %20)
  • Keine Parameter-URLs (außer kanonisch wichtig)

<lastmod> – Letzte Änderung (empfohlen)

Das Datum der letzten inhaltlichen Änderung im Format YYYY-MM-DD (W3C-Datum-Format). Optional, aber empfohlen – es signalisiert Google, welche Seiten kürzlich aktualisiert wurden und bevorzugt gecrawlt werden sollten.

Wichtig: lastmod sollte nur aktualisiert werden, wenn tatsächlich relevanter Content geändert wurde. Automatische Setzung auf das aktuelle Datum ohne echte Änderung wird von Google erkannt und ignoriert – oder schadet der Credibility.

<changefreq> – Änderungshäufigkeit (optional)

Gibt an, wie häufig sich die Seite voraussichtlich ändert. Mögliche Werte:

WertBedeutungTypische Verwendung
alwaysÄndert sich bei jedem ZugriffLive-Daten, Echtzeit-Seiten
hourlyStündlichNachrichtenfeeds, Börsenkurse
dailyTäglichBlogs, News-Portale
weeklyWöchentlichStartseite, Kategorieseiten
monthlyMonatlichServiceleistungsseiten, Über-uns
yearlyJährlichImpressum, Datenschutz, statische Seiten
neverNieArchivierte Seiten

Einschränkung: Google nutzt changefreq nur als Hinweis, nicht als Anweisung. Die tatsächliche Crawl-Frequenz wird von Google selbst auf Basis von Nutzersignalen und lastmod-Änderungen bestimmt.

<priority> – Relative Priorität (optional)

Ein Dezimalwert von 0.0 bis 1.0, der die relative Wichtigkeit einer URL im Vergleich zu anderen Seiten derselben Website angibt. Standardwert: 0.5

Empfohlene Priority-Werte:

SeitentypEmpfohlene Priority
Startseite1.0
Hauptkategorien, Hauptleistungsseiten0.8
Unterseiten, Blogbeiträge0.6–0.7
Archivseiten, Tag-Seiten0.3–0.5

Hinweis: Priority ist nur relativ – sie hat keinen absoluten Einfluss auf das Ranking. Google nutzt sie, um innerhalb der eigenen Website Crawl-Ressourcen zu priorisieren.

XML-Sitemap bei Google Search Console einreichen

Das Einreichen der Sitemap in der Google Search Console ist der entscheidende Schritt, der Google aktiv auf die Sitemap aufmerksam macht:

Schritt-für-Schritt:

  1. Google Search Console öffnen: search.google.com/search-console
  2. Property auswählen (oder neue Property hinzufügen)
  3. Linkes Menü → "Sitemaps"
  4. Im Feld "Sitemap-URL hinzufügen": sitemap.xml eingeben
  5. "Senden" klicken
  6. Status prüfen (erscheint nach Minuten bis Stunden)

Alternative: Sitemap-URL in der robots.txt angeben:

User-agent: *
Disallow: /admin/
Sitemap: https://www.pakumedia.de/sitemap.xml

Wichtige Diagnosedaten in der Search Console:

  • Eingereichte URLs: Wie viele URLs enthält die Sitemap?
  • Indizierte URLs: Wie viele hat Google tatsächlich indexiert?
  • Fehler: Welche URLs konnten nicht gecrawlt werden und warum?

Eine signifikante Lücke zwischen eingereichten und indizierten URLs signalisiert ein Problem: entweder enthält die Sitemap URLs, die Google nicht indexieren möchte (dünner Content, noindex) – oder Google hat technische Crawling-Probleme.

Sitemap-Index für große Websites

Eine einzelne Sitemap ist auf 50.000 URLs und 50 MB begrenzt. Größere Websites – E-Commerce-Shops, Nachrichtenportale, Lexikon-Websites – benötigen mehrere Sitemaps, die über eine Sitemap-Index-Datei organisiert werden.

<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <sitemap>
    <loc>https://www.pakumedia.de/sitemap-seiten.xml</loc>
    <lastmod>2026-03-29</lastmod>
  </sitemap>
  <sitemap>
    <loc>https://www.pakumedia.de/sitemap-lexikon.xml</loc>
    <lastmod>2026-03-29</lastmod>
  </sitemap>
  <sitemap>
    <loc>https://www.pakumedia.de/sitemap-blog.xml</loc>
    <lastmod>2026-03-29</lastmod>
  </sitemap>
</sitemapindex>

Der Sitemap-Index selbst unterliegt ebenfalls dem 50.000-Limit – kann aber bis zu 50.000 Sub-Sitemap-Referenzen enthalten. Das ermöglicht theoretisch bis zu 2,5 Milliarden URLs pro Index-Datei.

Spezielle Sitemap-Typen

News Sitemap

Für Google News optimiert. Enthält nur Artikel der letzten 48 Stunden und spezielle Metadaten:

<url>
  <loc>https://www.beispiel.de/artikel/breaking-news</loc>
  <news:news>
    <news:publication>
      <news:name>Beispiel-Nachrichten</news:name>
      <news:language>de</news:language>
    </news:publication>
    <news:publication_date>2026-03-29T10:00:00+01:00</news:publication_date>
    <news:title>Aktuelle Meldung</news:title>
  </news:news>
</url>

Video Sitemap

Informiert Google über Video-Inhalte auf der Website:

  • Videotitel und -beschreibung
  • Thumbnail-URL
  • Video-URL oder Player-URL
  • Dauer
  • Veröffentlichungsdatum

Erhöht Chancen auf Video-Rich-Results und Video-Karussell in der Google-Suche.

Image Sitemap

Hilft Google, Bilder zu entdecken – besonders bei JavaScript-geladenen Bildern oder CSS-Background-Images, die ohne Sitemap möglicherweise nicht gecrawlt werden.

Spezielle Sitemaps auf einen Blick:

Sitemap-TypNamespaceFür wenBesonderheiten
Standardsitemap/0.9Alle WebsitesBasis-Format
Newsnews/0.9NachrichtenportaleNur letzte 48h; Google News
Videovideo/1.1Video-PublisherThumbnail, Dauer, Embed
Imageimage/1.1Bildlastige SitesBildinformationen
Sitemap-Indexsitemap/0.9Große SitesVerweist auf Sub-Sitemaps

Automatische Sitemap-Generierung

Next.js (App Router)

In Next.js 13+ mit App Router kann die Sitemap nativ generiert werden:

// app/sitemap.ts
import { MetadataRoute } from 'next'

export default async function sitemap(): Promise<MetadataRoute.Sitemap> {
  // Dynamische URLs aus Datenbank/CMS abrufen
  const posts = await getPosts()

  return [
    {
      url: 'https://pakumedia.de',
      lastModified: new Date(),
      changeFrequency: 'weekly',
      priority: 1,
    },
    ...posts.map(post => ({
      url: `https://pakumedia.de/blog/${post.slug}`,
      lastModified: post.updatedAt,
      changeFrequency: 'monthly' as const,
      priority: 0.7,
    })),
  ]
}

WordPress + Yoast SEO

Yoast SEO generiert automatisch eine sitemap_index.xml mit separaten Sub-Sitemaps für Posts, Pages, Kategorien und Medien. Alle Einstellungen (welche Post-Typen, noindex-Seiten ausschließen) sind über das Plugin konfigurierbar.

Screaming Frog SEO Spider

Für Websites ohne CMS-Plugin oder zur Validierung: Screaming Frog crawlt die gesamte Website und exportiert eine valide XML-Sitemap.

Was NICHT in die XML-Sitemap gehört

Ein oft vernachlässigter, aber entscheidender Punkt:

AusschließenBegründung
noindex-SeitenWiderspruch: Sitemap sagt "indexiere", noindex sagt "nicht indexieren"
Weiterleitungen (301/302)Nur kanonische End-URLs in die Sitemap
404-FehlerseitenNicht vorhandene Seiten haben keine Sitemap-Berechtigung
Parameter-URLs (?sort=asc)Duplicate Content; kanonische URL genügt
Login-geschützte InhalteCrawler können nicht zugreifen
Dünne Inhalte / Thin ContentGoogle indexiert sie ohnehin nicht – Sitemap-Platz sparen
Paginated Pages (Seite 2, 3...)Meist ausschließen, außer eigenständiger Content

Sitemap-Fehler in der Search Console diagnostizieren

Die Google Search Console zeigt detaillierte Fehlerberichte für Sitemap-Issues:

Häufige Fehler und Lösungen:

FehlermeldungUrsacheLösung
"Redirect-Fehler"Sitemap-URL leitet weiterSitemap auf Ziel-URL aktualisieren
"Nicht gefunden (404)"URL existiert nicht mehrURL aus Sitemap entfernen oder Redirect einrichten
"Soft 404"Seite gibt 200, hat aber leeren/dünnen InhaltContent verbessern oder aus Sitemap entfernen
"Indexiert, nicht in Sitemap"Google hat URL gefunden, sie ist aber nicht in SitemapSitemap vervollständigen oder URL noindexen
"Crawled – currently not indexed"Google hat gecrawlt, aber nicht indexiertContent-Qualität und Relevanz prüfen

Sitemap und Crawl Budget

Das Crawl Budget ist die Anzahl der URLs, die Google in einem bestimmten Zeitraum crawlt. Für große Websites ist es ein limitierender Faktor – und eine saubere Sitemap hilft, es optimal zu nutzen.

Crawl-Budget-Optimierung durch Sitemap:

  • Nur hochwertige, kanonische URLs einschließen
  • lastmod präzise und aktuell halten – Google crawlt geänderte Seiten bevorzugt
  • Redirect-Chains aus Sitemap entfernen
  • Sitemap-Index für verschiedene Content-Typen trennen

XML-Sitemap Best-Practices-Checkliste

Eine vollständige Checkliste für eine professionelle XML-Sitemap:

  • Sitemap unter /sitemap.xml oder /sitemap_index.xml erreichbar
  • In robots.txt angegeben: Sitemap: https://domain.de/sitemap.xml
  • In Google Search Console eingereicht und auf Fehler geprüft
  • Nur kanonische, indizierbare URLs enthalten
  • lastmod nur bei echten inhaltlichen Änderungen aktualisiert
  • Keine noindex-Seiten, keine Redirects, keine 404-URLs
  • Bei > 50.000 URLs: Sitemap-Index mit Sub-Sitemaps
  • Spezielle Sitemaps für Videos/Bilder (wenn relevant)
  • Regelmäßiger Review (mindestens monatlich)
←Zurück zum Lexikon

Projekt anfragen

Fragen zu XML-Sitemap? Wir helfen gerne.

Unser Team berät Sie kostenlos und unverbindlich — direkt aus Bielefeld.

Kontakt aufnehmen→
FAQ's

Häufige Fragen zu XML-Sitemap.

Die wichtigsten Antworten auf einen Blick – kompakt und verständlich.

Weiter lernen

Verwandte Begriffe.

Zum Lexikon →
01Webentwicklung

Sitemap

Was ist eine Sitemap? XML-Sitemap vs. HTML-Sitemap erklärt: Aufbau, Einreichen bei Google, Typen und Best Practices für mehr Sichtbarkeit im Web.

Definition lesen→
02Marketing

SEO

Was ist SEO (Suchmaschinenoptimierung)? Vollständige Definition, alle Maßnahmen, Techniken und Tipps für Top-Rankings bei Google 2026.

Definition lesen→
03SEO

Crawling

Crawling einfach erklärt: Wie Suchmaschinen-Crawler funktionieren, Crawl-Budget, robots.txt, Crawl-Fehler und wie interne Verlinkung das Crawling verbessert.

Definition lesen→
04SEO

Indexierung

Was ist Indexierung bei Google? Wie Suchmaschinen Seiten in ihren Index aufnehmen und wie Sie Indexierungsprobleme lösen.

Definition lesen→
05SEO

Google Search Console

Google Search Console: Das kostenlose Google-Tool für SEO – Funktionen, Einrichtung und wie Sie Ihre Website-Performance optimieren.

Definition lesen→
06SEO

Technisches SEO

Was ist technisches SEO? Crawling, Indexierung, Page Speed und die technischen Grundlagen für bessere Rankings bei Google.

Definition lesen→