Was ist der Unterschied zwischen meta robots und robots.txt?

Die robots.txt steuert, ob eine Seite gecrawlt werden darf (Zugriff auf die Seite). Der Meta Robots Tag steuert, ob eine gecrawlte Seite indexiert und ihre Links verfolgt werden duerfen. Beide ergaenzen sich: robots.txt für das Crawling, Meta Robots für die Indexierung.

Brauche ich den Meta Robots Tag auf jeder Seite?

Nein. Ohne Meta Robots Tag gilt der Standard: index, follow. Sie müssen den Tag nur setzen, wenn Sie vom Standard abweichen wollen -- also bei noindex, nofollow oder speziellen Direktiven wie noarchive oder nosnippet.

Was passiert wenn robots.txt den Zugriff blockiert, aber meta robots index sagt?

Die robots.txt gewinnt: Wenn der Crawler die Seite nicht aufrufen darf, kann er den Meta Robots Tag gar nicht lesen. Die Seite wird nicht gecrawlt und nicht indexiert. Das ist ein haeufiger Fehler -- blockieren Sie nie Seiten per robots.txt, die Sie per noindex steuern wollen.

Meta Robots – Definition & Erklärung

Der Meta Robots Tag ist ein HTML-Meta-Element, das Suchmaschinen auf Seitenebene anweist, wie sie mit einer bestimmten Seite umgehen sollen: ob sie indexiert, ihre Links verfolgt oder Snippets in den Suchergebnissen angezeigt werden duerfen.

Waehrend die robots.txt das Crawling auf Website-Ebene steuert, gibt der Meta Robots Tag granulare Anweisungen pro Seite. Er ist ein essenzielles Werkzeug im technischen SEO für die präzise Steuerung der Indexierung.

Grundlegende Direktiven

Index / Noindex

Direktive	Wirkung
`index`	Seite darf in den Suchindex aufgenommen werden (Standard)
`noindex`	Seite wird nicht indexiert, erscheint nicht in Suchergebnissen

Follow / Nofollow

Direktive	Wirkung
`follow`	Links auf der Seite werden verfolgt und fliessen in die Bewertung ein (Standard)
`nofollow`	Links auf der Seite werden nicht verfolgt, kein PageRank-Weitergabe

Kombination

Die haeufigsten Kombinationen in der Praxis:

index, follow: Standard -- keine Angabe noetig
[noindex](/lexikon/noindex), follow: Seite nicht indexieren, aber Links verfolgen (z. B. Tag-Seiten)
noindex, nofollow: Seite komplett aus dem Index fernhalten (z. B. interne Suchergebnisse)

Erweiterte Direktiven

Direktive	Wirkung	Anwendungsfall
`noarchive`	Google speichert keine Cache-Version	Seiten mit zeitkritischem Content
`nosnippet`	Kein Text-Snippet in den SERPs	Datenschutz-sensible Seiten
`max-snippet:[n]`	Maximale Snippet-Länge in Zeichen	Kontrolle über SERP-Darstellung
`max-image-preview:[size]`	Bildvorschau-Größe (none/standard/large)	Kontrolle über Bild-Snippets
`max-video-preview:[n]`	Maximale Video-Vorschau in Sekunden	Video-SERP-Steuerung
`notranslate`	Google bietet keine Uebersetzung an	Mehrsprachige Seiten

Implementierung

HTML Meta Tag

<meta name="robots" content="noindex, follow">

X-Robots-Tag (HTTP Header)

Für Nicht-HTML-Dateien (PDFs, Bilder) kann der X-Robots-Tag als HTTP-Header gesetzt werden. Das ist die einzige Möglichkeit, die Indexierung von Dateien zu steuern, die keinen HTML-Head haben.

Suchmaschinenspezifisch

Neben dem generischen robots-Tag koennen Sie Direktiven für einzelne Suchmaschinen setzen: googlebot, bingbot oder GPTBot. So koennen Sie die Indexierung pro Suchmaschine differenziert steuern.

Typische Anwendungsfaelle

Seiten, die noindex benötigen

Interne Suchergebnisse: Produzieren Thin Content und Duplicate Content
Tag- und Filterseiten: Aehnlicher Content, verdruennen die Crawl-Ressourcen
Dankeseiten: Kein Mehrwert für Suchende
Staging- und Testseiten: Duerfen nicht indexiert werden
Paginierungsseiten: Ab Seite 2 optional mit noindex

Seiten, die keinesfalls noindex haben sollten

Alle kommerziell wichtigen Landingpages
Blog-Artikel und Ratgeber-Inhalte
Produktseiten und Kategorieseiten
Die Startseite (hängt haeufer als gedacht)

Haeufige Fehler

Der gefaehrlichste Fehler: versehentliches noindex auf wichtigen Seiten. Nach einem Relaunch oder einer Migration bleiben noindex-Tags manchmal stehen und Seiten verschwinden aus dem Index. Pruefen Sie regelmäßig in der Google Search Console den Indexierungsstatus und suchen Sie gezielt nach Seiten mit noindex-Direktive, die indexiert sein sollten.

Ein weiterer Fehler: noindex in Kombination mit robots.txt-Blockierung. Wenn die robots.txt den Zugriff auf eine Seite verbietet, kann Google den noindex-Tag nicht lesen. Die Seite bleibt moeglicherweise im Index -- das Gegenteil der Absicht.

Grundlegende Direktiven

Index / Noindex

Direktive	Wirkung
`index`	Seite darf in den Suchindex aufgenommen werden (Standard)
`noindex`	Seite wird nicht indexiert, erscheint nicht in Suchergebnissen

Follow / Nofollow

Direktive	Wirkung
`follow`	Links auf der Seite werden verfolgt und fliessen in die Bewertung ein (Standard)
`nofollow`	Links auf der Seite werden nicht verfolgt, kein PageRank-Weitergabe

Kombination

Die haeufigsten Kombinationen in der Praxis:

index, follow: Standard -- keine Angabe noetig
[noindex](/lexikon/noindex), follow: Seite nicht indexieren, aber Links verfolgen (z. B. Tag-Seiten)
noindex, nofollow: Seite komplett aus dem Index fernhalten (z. B. interne Suchergebnisse)

Erweiterte Direktiven

Direktive	Wirkung	Anwendungsfall
`noarchive`	Google speichert keine Cache-Version	Seiten mit zeitkritischem Content
`nosnippet`	Kein Text-Snippet in den SERPs	Datenschutz-sensible Seiten
`max-snippet:[n]`	Maximale Snippet-Länge in Zeichen	Kontrolle über SERP-Darstellung
`max-image-preview:[size]`	Bildvorschau-Größe (none/standard/large)	Kontrolle über Bild-Snippets
`max-video-preview:[n]`	Maximale Video-Vorschau in Sekunden	Video-SERP-Steuerung
`notranslate`	Google bietet keine Uebersetzung an	Mehrsprachige Seiten

Implementierung

HTML Meta Tag

<meta name="robots" content="noindex, follow">

X-Robots-Tag (HTTP Header)

Für Nicht-HTML-Dateien (PDFs, Bilder) kann der X-Robots-Tag als HTTP-Header gesetzt werden. Das ist die einzige Möglichkeit, die Indexierung von Dateien zu steuern, die keinen HTML-Head haben.

Suchmaschinenspezifisch

Typische Anwendungsfaelle

Seiten, die noindex benötigen

Interne Suchergebnisse: Produzieren Thin Content und Duplicate Content
Tag- und Filterseiten: Aehnlicher Content, verdruennen die Crawl-Ressourcen
Dankeseiten: Kein Mehrwert für Suchende
Staging- und Testseiten: Duerfen nicht indexiert werden
Paginierungsseiten: Ab Seite 2 optional mit noindex

Seiten, die keinesfalls noindex haben sollten

Alle kommerziell wichtigen Landingpages
Blog-Artikel und Ratgeber-Inhalte
Produktseiten und Kategorieseiten
Die Startseite (hängt haeufer als gedacht)

Meta Robots

Grundlegende Direktiven

Index / Noindex

Follow / Nofollow

Kombination

Erweiterte Direktiven

Implementierung

HTML Meta Tag

X-Robots-Tag (HTTP Header)

Suchmaschinenspezifisch

Typische Anwendungsfaelle

Seiten, die noindex benötigen

Seiten, die keinesfalls noindex haben sollten

Haeufige Fehler

Häufige Fragen zu Meta Robots.

Sie wollen bei Google gefunden werden?

Verwandte Begriffe.

Weitere Themen.

Let's talk.

Meta Robots

Grundlegende Direktiven

Index / Noindex

Follow / Nofollow

Kombination

Erweiterte Direktiven

Implementierung

HTML Meta Tag

X-Robots-Tag (HTTP Header)

Suchmaschinenspezifisch

Typische Anwendungsfaelle

Seiten, die noindex benötigen

Seiten, die keinesfalls noindex haben sollten

Haeufige Fehler

Häufige Fragen zu Meta Robots.

Sie wollen bei Google gefunden werden?

Verwandte Begriffe.

Weitere Themen.

Let's talk.