Die System Usability Scale (SUS) ist ein standardisierter Fragebogen zur Messung der wahrgenommenen Benutzerfreundlichkeit eines Systems. Entwickelt 1986 von John Brooke, ist SUS heute einer der am haeufigsten eingesetzten Usability-Frageboegen weltweit — mit ueber 1.300 wissenschaftlichen Zitierungen.
SUS liefert einen einzelnen Score zwischen 0 und 100, der die subjektive Zufriedenheit der Nutzer mit der Bedienbarkeit eines Systems quantifiziert. Im Gegensatz zu qualitativen Methoden wie dem Cognitive Walkthrough oder der Heuristic Evaluation misst SUS die tatsaechliche Nutzerwahrnehmung.
Der SUS-Fragebogen
SUS besteht aus genau 10 Aussagen, die auf einer 5-Punkt-Likert-Skala bewertet werden (1 = Stimme ueberhaupt nicht zu, 5 = Stimme voll zu):
| Nr. | Aussage | Richtung |
|---|---|---|
| 1 | Ich denke, dass ich das System gerne haeufig nutzen wuerde | Positiv |
| 2 | Ich fand das System unnoetig komplex | Negativ |
| 3 | Ich fand das System einfach zu bedienen | Positiv |
| 4 | Ich denke, ich wuerde technische Unterstuetzung brauchen, um das System nutzen zu koennen | Negativ |
| 5 | Ich fand, die verschiedenen Funktionen des Systems waren gut integriert | Positiv |
| 6 | Ich fand, das System enthielt zu viele Inkonsistenzen | Negativ |
| 7 | Ich kann mir vorstellen, dass die meisten Menschen den Umgang mit diesem System schnell erlernen wuerden | Positiv |
| 8 | Ich fand das System sehr umstaendlich zu bedienen | Negativ |
| 9 | Ich fuehlte mich bei der Benutzung des Systems sehr sicher | Positiv |
| 10 | Ich musste eine Menge lernen, bevor ich mit dem System arbeiten konnte | Negativ |
Der Wechsel zwischen positiven und negativen Aussagen ist beabsichtigt: Er verhindert, dass Teilnehmer gedankenlos die gleiche Antwort ankreuzen.
Berechnung des SUS-Scores
Schritt-fuer-Schritt-Anleitung
- Ungerade Fragen (1, 3, 5, 7, 9): Antwort minus 1
- Gerade Fragen (2, 4, 6, 8, 10): 5 minus Antwort
- Alle 10 Einzelwerte addieren
- Summe mit 2,5 multiplizieren
Das Ergebnis ist ein Wert zwischen 0 und 100. Wichtig: Dies ist keine Prozentzahl, sondern ein normierter Score.
Interpretation
| SUS-Score | Bewertung | Schulnote (US) | Perzentil |
|---|---|---|---|
| 90-100 | Exzellent | A+ | Top 5 % |
| 80-89 | Gut | A/B | Top 10-15 % |
| 68-79 | Ueberdurchschnittlich | C | Top 50 % |
| 50-67 | Unterdurchschnittlich | D | Untere 50 % |
| 0-49 | Schlecht | F | Untere 15 % |
Der globale Durchschnitt liegt bei 68 Punkten — basierend auf einer Metaanalyse von ueber 500 Studien durch Jeff Sauro.
SUS in der Praxis
Wann SUS einsetzen?
SUS wird typischerweise nach einem User Test oder einer definierten Nutzungsperiode ausgefuellt. Die Teilnehmer haben gerade mit dem System interagiert und koennen ihre Erfahrung frisch bewerten.
Sinnvolle Einsatzszenarien:
- Vor und nach einem Redesign: Verbesserung messbar machen
- Vergleich von Varianten: Zwei Design-Alternativen quantitativ bewerten
- Wettbewerbsanalyse: Eigenes Produkt gegen Konkurrenzprodukte benchmarken
- Tracking ueber Zeit: Quartalsweise Messung zur Erkennung von Trends
Stichprobengroesse
Bereits ab 12-14 Teilnehmern liefert SUS reliable Ergebnisse. Fuer statistisch robuste Vergleiche zwischen zwei Systemen werden mindestens 20 Teilnehmer pro Gruppe empfohlen.
SUS und andere UX-Metriken
SUS misst die subjektive Wahrnehmung der Usability. Fuer ein vollstaendiges Bild sollte SUS mit objektiven Metriken kombiniert werden:
- Task Success Rate: Wie viele Aufgaben wurden erfolgreich abgeschlossen?
- Task Completion Time: Wie lange brauchten Nutzer fuer die Aufgaben?
- Error Rate: Wie viele Fehler machten Nutzer?
- Conversion Rate: Fuehrt bessere Usability zu mehr Conversions?
Diese Kombination aus subjektiven und objektiven Daten bildet die Grundlage fuer datengetriebene UX-Entscheidungen im UX-Design-Prozess.
Grenzen von SUS
- Misst nur die wahrgenommene Usability, nicht die tatsaechliche Leistung
- Liefert keine Hinweise auf die Ursache von Problemen — dafuer braucht es qualitative Methoden
- Der Score ist ein Gesamtwert; einzelne Problembereiche sind nicht isoliert erkennbar
- Kulturelle Unterschiede koennen die Antworttendenzen beeinflussen
Trotz dieser Einschraenkungen bleibt SUS dank seiner Einfachheit, Zuverlaessigkeit und der umfangreichen Benchmark-Datenbank das am weitesten verbreitete Instrument zur Usability-Quantifizierung.