Indexierung ist der Prozess, bei dem Suchmaschinen eine Webseite analysieren und in ihre Datenbank (den Index) aufnehmen. Nur indexierte Seiten können in den Suchergebnissen erscheinen. Indexierung ist damit die Grundvoraussetzung für jede SEO-Sichtbarkeit.
Wie Indexierung funktioniert
Der Weg einer Webseite in den Google-Index:
1. Crawling
Der Googlebot entdeckt die URL – durch Links auf anderen Seiten, die Sitemap oder die Google Search Console. Er ruft die Seite auf und liest den HTML-Code, CSS und JavaScript.
2. Verarbeitung (Rendering)
Google rendert die Seite wie ein Browser: JavaScript wird ausgeführt, das DOM aufgebaut, die finale Darstellung analysiert. Bei JavaScript-lastigen Seiten kann dies verzögert ablaufen (Delayed Indexing).
3. Indexierung
Google analysiert den Inhalt, identifiziert Keywords, bewertet Qualität und Relevanz und speichert die Seite im Index – einer riesigen Datenbank von Hunderten Milliarden Seiten.
4. Ranking
Bei einer Suchanfrage durchsucht Google den Index und liefert die relevantesten Ergebnisse – sortiert nach Hunderten von Ranking-Faktoren.
Indexierung steuern
Seiten indexieren lassen
- Interne Links: Jede wichtige Seite sollte intern verlinkt sein
- XML-Sitemap: Alle indexierbaren URLs auflisten und in der Search Console einreichen
- URL-Prüfung: In der Search Console einzelne URLs zur Indexierung anmelden
- Qualitätscontent: Google indexiert bevorzugt einzigartigen, wertvollen Inhalt
Seiten von der Indexierung ausschließen
Nicht jede Seite gehört in den Index:
- noindex-Tag:
<meta name="robots" content="noindex">– Seite wird gecrawlt, aber nicht indexiert - Robots.txt: Crawling komplett verhindern (Vorsicht: Seite kann trotzdem im Index landen)
- Canonical Tag: Bei Duplikaten die bevorzugte Version definieren
- Login-geschützte Bereiche: Automatisch nicht indexierbar
Häufige Indexierungsprobleme
Seiten nicht im Index
Mögliche Ursachen:
- noindex-Tag gesetzt (absichtlich oder versehentlich)
- In robots.txt blockiert
- Orphan Pages (keine internen Links)
- Duplicate Content
- Zu dünner oder minderwertiger Inhalt
- Crawl-Fehler (Server-Probleme, 5xx-Errors)
Falsche Seiten im Index
Tag-Seiten, Filterseiten, Paginierungsseiten oder veraltete URLs im Index. Lösung: noindex setzen oder Canonical Tags verwenden.
Crawl-Budget-Verschwendung
Google weist jeder Domain ein begrenztes Crawl-Budget zu. Wenn dieses Budget für irrelevante Seiten verbraucht wird, werden wichtige Seiten seltener gecrawlt und aktualisiert.
Indexierung überwachen
Die Google Search Console ist das wichtigste Tool:
- Indexierungsbericht: Zeigt, wie viele Seiten indexiert/nicht indexiert sind
- URL-Prüfung: Status einzelner URLs prüfen
- Sitemap-Bericht: Ob alle Sitemap-URLs indexiert wurden
- Crawl-Statistiken: Wie häufig der Googlebot die Website besucht
Best Practices
- Alle wichtigen Seiten intern verlinken – Orphan Pages werden schlecht gefunden
- XML-Sitemap aktuell halten – nur indexierbare URLs aufnehmen
- Search Console regelmäßig prüfen – Fehler frühzeitig erkennen
- Schnelle Ladezeiten – Page Speed beeinflusst das Crawl-Budget
- Duplicate Content vermeiden – durch Canonical Tags und saubere URL-Strukturen
Indexierung ist die Eintrittskarte für Suchergebnisse. Kein Index, keine Rankings. Im technischen SEO ist die Sicherstellung einer sauberen Indexierung der erste und fundamentalste Schritt.