Controlling 21
Dr. J. Schuhmacher
Der Begriff Usability [jusebiliti] stammt aus dem amerikanischen Englisch. Er setzt sich aus zwei Worten zusammen, dem Verb to use (benutzen) und dem Nomen ability (Fähigkeit).
Usability mit Ergonomie gleichzusetzen, trifft den Kern nicht. Übersetzt wird der Begriff oft mit Gebrauchstauglichkeit und Brauchbarkeit. Gemeint wird damit, dass man etwas ohne Probleme benutzen kann. Usability kann man somit nicht nur mit Bedienerfreundlichkeit oder technischer Verfügbarkeit übersetzen. Faktoren wie Benutzungseffizienz und den Grad der Zufriedenstellung fließen ebenfalls mit ein.
In der ISO Norm 9241 wird Usability als das Ausmaß definiert, in dem ein Produkt durch bestimmte Benutzer in einem bestimmten Nutzungskontext genutzt werden kann, um bestimmte Ziele effektiv, effizient und zufrieden stellend zu erreichen.
Der Grad der drei letzten Bestandteile (Effektivität - genaue und komplette Ergebnisse erzielbar, Effizienz - der Aufwand steht in einem angemessenen Verhältnis zum Ergebnis, Zufriedenstellung) spielt für den Maßstab der Gebrauchstauglichkeit die entscheidende Rolle.
Usability ist somit auch nicht nur die Eigenschaft eines Produktes, sondern das Attribut einer Interaktion bestimmter Benutzer (Zielgruppe) mit einem Produkt innerhalb eines bestimmten Kontextes.
Usability is the measure of the quality of the user experience when interacting with something - whether a Web site, a traditional software application, or any other device the user can operate in some way or another.
(Jakob Nielsen, 1998, zitiert nach Eichinger, Armin, Usability, psychologie.uni-regensburg.de. Nach Nielsen beschäftigt sich Usability überwiegend mit der Vermeidung von Bedienungs-/ Anwendungsfehlern durch den Nutzer. Nielsen.
Usability richtet sich auf die Optimierung der Vorgänge, durch die ein Anwender eine bestimmte Aufgabe auf einem Internet-Auftritt erledigen kann. Sie umfasst somit das weite Feld der wissenschaftlichen Beobachtung, Messung und Entwurfsregeln zur Erzeugung und Pflege eines Internet-Auftrittes. Ziel ist die größtmögliche Leichtigkeit der Bedienung, der Erlernbarkeit, den größtmöglichen Nutzen und den geringsten Aufwand für den Nutzer. Usability umfasst jedoch nicht nur die Gestaltung von Software, sondern auch ganz alltägliche Gebrauchsgegenstände, so dass es eher Ähnlichkeit mit dem deutschen Begriff Ergonomie hat. Dennoch wird er hauptsächlich im Zusammenhang mit dem Computerbereich und dort wiederum der Software benutzt.
Als notwendige Bestandteile zur Analyse der Usability einer Mensch-Maschine-Interaktion werden u.a. gesehen die Definition der Benutzer. Darunter fallen relevante Eigenschaften wie zum Beispiel das Alter, die Benutzungshäufigkeit oder die Erfahrung. Eine häufige anzutreffende Unterteilung ist Anfänger und Experten.
Dann folgt die Definition der Ziele der Interaktion. Zudem erforderlich ist die Definition der Aufgaben. Damit gemeint sind Handlungen und Techniken, die zur Zielerreichung erforderlich sind: Welche Hauptaufgaben werden in welche Häufigkeit durchgeführt? Dann folgt die Definition der Ausstattung Damit ist hier die Software und Hardware gemeint. Zudem benötigt man die Definition der Umgebung, also der Arbeitsbedingungen.
Ferner benötigt man die Definition der Messinstrumente. Darunter fällt die Methode, mit der man einem Usability-Attribut Werte beimisst. Es werden sowohl subjektive Daten (Zufriedenheitsdaten, Einstellungsdaten) wie auch objektive (quantitative: Fehlerhäufigkeit, Zeitaufwand sowie qualitative: Problembeschreibungen) benutzt. Klassische Messinstrumente sind Protokollierungssoftware, Protokollierungsvideos, Vergleichs-/Benchmark-Aufgaben oder Fragebögen.
Überdies benötigt man die Definition der Usability Messgrößen. Das sind messbare Attribute, die sich auf Effektivität, Effizienz und Zufriedenheit beziehen. Diese Attribute werden situationsabhängig oft weiter in Usability-Unterfaktoren oder Usability-Kriterien wie benötigte Zeit, Fehlerraten, Flexibilität oder Erlernbarkeit unterteilt. Wichtig für die Festlegung der Kriterien ist primär ihre Messbarkeit.
Ferner ist die Definition der Grenzwerte der Messgrößen wichtig. Gemeint sind absolute Größen: Zum Beispiel maximal 20 Sekunden oder maximal 2 Fehler sind erlaubt bis zur erfolgreichen Erledigung der Aufgabe, sowie relative: Mit dem Internet-Auftritt A muss ein Nutzer in kürzerer Zeit oder mit weniger Fehlern die Aufgabe lösen als mit dem Auftritt B. Vor allem die exakte Festlegung absoluter Werte ist schwierig, da weder Marktforschungsstudien noch Expertenaussagen, weder ähnliche Vergleichswerte älterer Tests noch Feldstudien mehr als Größenordnungen liefern können, da selten exakt die identische Untersuchungssituation als Vergleich vorliegt. Zudem ist auch grundsätzlich immer Vorsicht bei Vergleichen über verschiedene Studien geboten. Der Detailliertheitsgrad der Untersuchungen, der Entwicklungsstand und die Art des Produktes können dabei erheblich variieren und so einen Vergleich unmöglich machen.
Situationsabhängig werden die relevanten Aspekte gewichtet. Wichtig ist, dass der Kontext hinreichend detailliert beschrieben wird, damit man alle für die Usability relevante Faktoren miteinbezieht.
Vor allem das als Ingenieurswissenschaft aufgekommene Usability Engineering konzentriert sich sehr auf die praxisorientierte Anwendung, will jedoch auch einer wissenschaftlichen Überprüfung gerecht werden. Situationsabhängig werden in diesem iterativen Prozess des Usability Engineerings (iterative redesign - iteratives Redesign / iterativer Umbau / stetige Verbesserung der Ergonomie) konkrete Eigenschaften oder Attribute für Usability erarbeitet, die messbar sind. Für die Umsetzung sollten je Attribut kritische (numerische, d.h. messbare) Werte angegeben werden. Als dritten Schritt will man in einem analytischen Vergleich am Objekt zwischen Soll- und Ist-Werten messen. Werden die Sollwerte erreicht, ist man am Ziel. Ansonsten erfolgt eine Problemanalyse anhand des Benutzerverhaltens und seiner Rückmeldung, daraus eine Optimierung und schließlich die erneute Messung.
Accessibility / Erreichbarkeit / Zugänglichkeit stellt eine Untergruppe der Usability / Ergonomie dar, ist jedoch nicht mit Usability identisch. Grafische Seiten sind zum Beispiel nicht zugänglich für Blinde.
UCD ist die Philosophie und die Methodik der Produktentwicklung. Man konzentriert sich hierbei auf die Sicht des Nutzers, da ein Produkt (eine Software oder ein Internet-Auftritt) ohne diesen sein Ziel verfehlt hat. Allerdings geht UCD nicht so weit zu behaupten, dass jeder Nutzer immer Recht hätte. UCD gilt als das der Usability zugrunde liegende Prinzip.
Das Gegenteil ist Designer-centered-Design, der Hintergrund, auf dem ein Produkt unergonomisch werden kann. Dazu gehört die Konzentration auf technische Details, statt auf den Nutzer. Hinzu kommt der Umstand, dass Techniker, Ingenieure und Programmierer das Produkt entwerfen, also Menschen, die anders denken als unerfahrene, technisch wenig gebildete Nutzer. Dazu kommt oft blindes Nachgeben des Managements / der Entscheidungsträger bezüglich tatsächlicher oder vermeintlicher Trends. Oft findet sich hier der Wunsch, 'State-of-the-Art' zu sein. Dazu kommt die Fehlinterpretation, dass die wissenschaftliche Ergonomie durch gesunden Menschenverstand ersetzt werden kann. Das betrifft vor allem die weit verbreitete Meinung, dass jeder bei ergonomischen Fragen mitdiskutieren darf. Schließlich kommt noch hinzu, dass Personen ohne fundiertes Wissen über Ergonomie entscheiden und somit über das Aussehen und das funktionale Modell.
Klassische empirische Usability-Tests werden im Sinne von Fallstudien oft in dafür eingerichteten Usability-Labors durchgeführt. Sie laufen wie folgt ab:
Die Vorbereitung: Die Aufgaben und Testmethoden werden festlegt, das Testmaterial und die Einrichtung vorbereitet, die Teilnehmer werden ausgewählt.
Die Einführung: Die wichtigen Informationen werden erarbeitet und an die Teilnehmer zum Test ausgegeben.
Der Test: Dazu wird zuerst eine Methode ausgewählt und dann festgelegt, wie diese Methode eingesetzt wird. Z.B. Think aloud / Laut denken, Eye-Tracking, Videokonfrontation, Fragebögen, Interviews... Hierbei haben die Probanden in der Regel mehrere Aufgaben zu erledigen: zum Beispiel Ergebnis-, Informations-, Transaktions-, Verwendungs- Verständnis-Aufgaben, etc. Die Tests selbst dauern oft 30-60 Minuten.
Die Abschlussbesprechung: Dabei werden zum Beispiel nachträgliche Fragebögen über das allgemeine Bild ausgefüllt, oder eindeutige Zuordnung aller Unterlagen zu bestimmten Testpersonen getroffen etc.
Die Analyse: Zur Verfügung respektive Auswahl stehen u.a. die einfache Analyse der Messgrößen, die Videoanalyse, oder die Pareto-Analyse (welche gravierenden Probleme verursachen beim Nutzer welchen Zeitaufwand und sind deshalb vorrangig zu beheben).
Der Bericht: Dazu gehören eine Zusammenfassung, die Darlegung der verwendeten Methoden, die Ergebnisse und die Empfehlungen.
Tests mit Probanden sollten bereits am Prototypen - also noch während der Produktion der Website - durchgeführt werden. Die Tests sollten möglichst oft während der Produktionsphase wiederholt werden und der letzte Test sollte kurz vor der Freischaltung zur Validierung erfolgen. Die hohe Anzahl der erforderlichen Tests entlarvt auch Fehlinterpretationen der Nutzerangaben und übertriebene Korrekturen. Dies ist ein Problem der Feldversuche. Man muss sehr vorsichtig vor Überinterpretationen der Probanden-/Kundenangaben sein. Die Probanden / befragte Kunden wissen nicht immer, was sie wollen. Deshalb sollte man ihnen im Test Alternativen anbieten. Ferner ist immer zu beachten: Die Probanden sind keine Ergonomiefachleute, keine Programmierprofis und keine Designspezialisten.
Ein wichtiger und schwieriger Teil der Aufgaben eines Ergonomie-Experten für klassische empirische Usability-Tests besteht in der Rekrutierung von Probanden, die der Zufallsstichprobe aus der Gesamtpopulation entsprechen. Oft lautet die Auswahl "Grundgesamtheit": alle potentiellen Nutzer. Dann sollten Sie auch einen "Neuling" (DAU - Dümmster anzunehmender User) mit aufnehmen, als so genannten "Härtetest" für die Ergonomie des Internet-Auftrittes. Vor allem die erforderliche (finanzielle) Entschädigung der Probanden zieht oft nichtrepräsentative Kreise an. Hinzu kommt, dass viele repräsentative Probanden sich selbst die Schuld geben, wenn sie etwas nicht finden oder durchführen können. Vor allem männliche Probanden gehen gern großzügig über unverständliche Details hinweg oder beschönigen Probleme, um nicht als technische Laien dazustehen. Andere Probanden geben teilweise falsche Antworten, um dem "Prüfer" zu "gefallen".
In der Regel ist der Ablauf dreistufig: Vorher findet eine kleine Einführung (briefing) des Probanden in die Aufgabe statt, dann folgt die Aufgabe. Danach schließt sich eine kurze Fragemöglichkeit für den Probanden (debriefing) an.
Aus diesem Grund sind klassische Ergonomie-Tests sehr aussagekräftig, aber teuer und kompliziert, sowie nur von einem Spezialistenteam mit Spezialausrüstung durchführbar. Deshalb sind sie bei kleineren Auftritten sinnvoll, zumindest um die kritischen Stellen zu prüfen, zum Beispiel Bestellvorgang.
Man findet so die kritischen Stopppunkte, die einen Vorgang verhindern! Notwendig ist hierzu allerdings ein detaillierter Testplan. Aus den Zielen des Auftrittes werden ca. 10 Problemfelder herausgearbeitet. Daraus werden wiederum die spezifischen operativen Testaufgaben ausgearbeitet. Aus diesen leiten sich dann klar messbare Kriterien für einen erfolgreichen Ablauf des Tests ab (Zeitdauer, Anzahl der Klicks bis zum Erfolg etc.).
Zwar sind diese ursprünglich aus der GOMS-Theorie stammenden Messgrößen (vor allem die benötigte Zeit) umstritten, da sie von einem allwissenden und nie irrenden oder zögernden Nutzer ausgehen. Dennoch werden sie oft angewandt. Eine Weiterentwicklung der Testergebnisse zu einem vergleichbaren Standard liegt dem CIF (Common Industry Format) zugrunde, das auch ein ANSI-Standard ist. (GOMS: Goals, Operators, Methods, and Selection Rules, die Komponenten für das Modell Englische Details - http://www.usabilityfirst.com; ANSI: American National Standards Institute) Englische Details - https://www.ansi.org/
Hierbei handelt es sich um eine halbstrukturierte Periode der Beobachtung von Anwendern in ihrem natürlichen (Arbeits-) Umfeld. Sie wird teilweise am Anfang des Design-Entwicklungs-Prozesses eingesetzt. Man erhält so Eindrücke von Arbeits-Prozessen, Anwendergewohnheiten und der verwendeten (Fach-) Sprache und den momentanen Beschränkungen der bisherigen Prozesse/Systeme. Es wird ein Zeitfenster mit dem Vorgesetzten für die Beobachtungen, die Fragen, die Vorgehensweise festgelegt. Die Datenbearbeitung wird beobachtet, Vermutungen bestätigen sich bzw. Unerwartetes lässt sich eventuell mit Tonband, Video etc. festhalten. Allerdings erledigen beobachtete Personen die üblichen / täglichen Arbeiten eventuell nicht mehr so wie gewohnt. Oft wird genauer gearbeitet - nach Vorschrift. Dies kann zu verfälschten Ergebnissen führen. Ferner bestehen unterschiedliche Auffassungen über die Interaktion mit Personen contra dem Zurücknehmen, bis zur Unmerklichkeit (Beobachtete ungestört lassen).
Hierbei wird eine software-gesteuerte Messvorrichtung (zum Beispiel Browser-basiert, oder per CD-ROM) benutzt. Sie lässt sich leicht an viele verteilen und kostengünstig auswerten (zum Beispiel in jeder Stufe des iterativen Redesigns). So kann man zum Beispiel das Login testen oder die Auswahl zwischen zwei Design-Alternativen treffen lassen. Jedoch handelt es sich um ein einseitiges Verfahren, da kein menschlicher Kontakt stattfindet. Weitere Informationen sind oft erforderlich. Es bleibt festzuhalten, dass sich Menschen anders verhalten, wenn sie Gefühle niederschreiben sollen, im Vergleich zum mündlichen Schildern. Eine anonyme Niederschrift ist jedoch oft wahrheitsgetreuer. Da kein kaufbares Tool vorhanden ist, muss man es selbst programmieren. Gemessen wird in der Regel das Klickverhalten, die Zeit zwischen Klicks, die Anzahl der Klicks bis zum Ziel, ob das Ziel erreicht wird, oder nicht, die Gesamtzeitdauer etc.
Focus-Gruppen sind informelle Sitzungen mit mehreren Teilnehmern und einem bis zwei Moderator(en), der die Fragen rund um den Auftritt an einem Tisch mit allen über 1-3 Stunden diskutiert. Das Verfahren eignet sich in vielen Phasen des Redesigns. Meist liegt eine Mischung aus geplantem Vorgehen und freier Diskussion vor. Vorsicht ist jedoch bei der Selbstselektion zu üben. Es kommen eventuell einige dominante Selbstdarsteller.
Als weitere Testverfahren / Werkzeuge in einem Ergonomieplan finden sich Kiosk-Systeme, bei denen im Prinzip ein PC benutzt wird mit einer Person, die Fragen beantwortet und Fragen an Probanden stellt. Das wird zum Beispiel als Testplattform für Neuauftritte verwendet und ist besonders geeignet bei Produkten. Eine Sitzung sollte hierbei maximal 5 Minuten dauern.
Ferner finden sich Meinungsumfragen, die bei einfachen Fragen zu einem einzigen Thema sinnvoll einsetzbar sind, sowie vereinzelte Ergonomie-Gewinnspiele auf einem Internet-Auftritt.
Da die Kosten für klassische empirische Ergonomie-Tests hoch sind, wurden preiswertere Alternativen erarbeitet. Bei der Usability Inspection überprüfen deshalb Gutachter, die aufgrund ihrer Erfahrung Probleme der Endanwender vorhersagen können, für die Usability relevante Aspekte eines Produktes. Dadurch werden Usability-Probleme erkannt. Die Validität der Methode hängt allerdings von der Qualifikation der Gutachter ab.
Hierbei werden besonders Usability-Probleme nach ihrer Auftretenshäufigkeit, -wahrscheinlichkeit und dem Einfluss auf die Bedienung einer Software untersucht und in niedrig, mittel, hoch gruppiert. Mit Usability Inspection findet man sehr effizient die Probleme.
In einem Experiment wies der Usability-Experte Jakob Nielsen 1993 (Usability Engineering. Boston, Academic Press) nach, dass Usability Experten mit Hilfe der heuristischen Evaluation (auch: Usability evaluation - Ergonomiebewertung/-erhebung) eine größere Anzahl an Problemen identifizierten als normale Test-Anwender. Usability Experten mit Domänenwissen ("Doppelexperten"), erzielten ein noch günstigeres Ergebnis. Eine Usability Inspection ist in der Regel auch schneller durchführbar als klassische Probandentests im Labor.
Experten-Gutachter können allerdings genaue Leistungsmaße im Sinne von: Wie lange benötigt ein durchschnittlicher Anwender der Zielgruppe X zur Erledigung einer bestimmten Aufgabe, nicht erbringen. Dies funktioniert erst am fertiggestellten Produkt.
Für die Durchführung einer Usability Inspection benötigt man zumindest einen Prototypen, d.h. in der Planungsphase ist die Methode nicht einsetzbar.
Zudem fällt den meisten Gutachtern die Erarbeitung von Lösungsvorschlägen für das Redesign oft schwer.
Unter Heuristik versteht man die Lehre von den Methoden zur Auffindung neuer wissenschaftlicher Erkenntnisse, oder die Wissenschaft von den Verfahren, Probleme zu lösen respektive eine methodische Anleitung, oder Anweisung zur Gewinnung neuer Erkenntnisse. Hierbei werden wahre Aussagen gesucht und gefunden, im Unterschied zur Logik, die lehrt, wahre Aussagen zu begründen.
Details zu diesen teilweise despektierlich als Discount-Usability bezeichneten Verfahren:
Bei der heuristischen Evaluation untersucht eine geringe Zahl an Gutachtern (empfohlen werden 3-6, Nielsen, 1992, Finding usability problems through heuristic evaluation. Proceedings ACM CHI'92 Conference (Monterey, CA, May 3-7), 373-380.) die Software auf Übereinstimmung mit bestimmten Usability Prinzipien (Heuristiken).
Heuristiken sind hierbei von Experten aufgestellte Richtlinienkataloge, die sich teilweise an Normen orientieren.
Die Gutachter untersuchen zuerst die Software in einer ein- bis zweistündigen Sitzung allein und äußern ihre Kommentare oft mündlich den dabeisitzenden Protokollanten. Danach werden die Ergebnisse zusammengefasst und eventuell mit den anderen Gutachtern diskutiert.
Oft werden bei dieser Methode zwei Durchgänge empfohlen, um die Kriterien für den zweiten Durchlauf zu optimieren, sowie erst im zweiten Durchgang die Details abzuprüfen.
Eher selten werden hierbei in einem weiteren Durchlauf Aufgabenszenarien beschrieben und abgeprüft.
Als Ergebnis entsteht eine kategorisierte und hierarchisierte Liste an erkannten Usability-Problemen mit einer Problembewertung. Diese Severity Ratings beinhalten die Kriterien Problemhäufigkeit, Problemeinfluss (wie stark wird die Aufgabendurchführung beeinträchtigt) und Persistenz (lässt sich das Problem umgehen).
Lösungen werden mit der heuristischen Evaluation nicht geliefert. Allerdings liegen diese angesichts der erkannten Probleme oft auf der Hand.
Als Vorteil ist zu sehen, dass Experten oft mehr Problembereiche erkennen als Endnutzer selbst in größeren empirischen Tests.
Einzelne Untersuchungen ergaben eine äußerst günstige Nutzen-Kostenrelation. (Jeffries, 1991, Nielsen 1994).
Weitere Anregungen zu heuristischen Bewertung von Internet-Auftritten findet sich bei Jacob Nielsen.
Cognitive Walkthrough (teilweise auch als CW bezeichnet) ist eine weitere Inspection-Technik aus dem Bereich Usability. Sie basiert auf Theorien zum explorierenden Lernen und Problemlösen und orientiert sich deutlich an der Kognitionsforschung, wobei wichtige und realistische Handlungsabläufe theoretisch untersucht werden. Es bedarf hierzu keiner funktionstüchtigen Software, so dass man die Methode früh einsetzen kann.
Cognitive Walkthrough simuliert quasi eine typische Art des Problemlöseverhaltens: die Means-End-Analyse - eine Problemlöseheuristik, die jede weitere Aktion danach auswählt, um wie viel sie die Distanz zum anvisierten Ziel verringert. Die mentalen Prozesse bei der Durchführung (wie würde der anvisierte Nutzer vorgehen?) stehen bei dieser Methode im Zentrum der Überlegungen.
Da bei jeder Entscheidung des Nutzers Training und Erfahrung eine große Rolle spielen, ist die genaue Zielgruppenbeschreibung wichtig. Betont wird bei dieser Methode besonders das Ergonomiekriterium der Erlernbarkeit, welche über die Explorationsmöglichkeiten der Software definiert wird.
Die Gutachter sammeln bei dieser Methode alle Informationen und Kenntnisse, die der Benutzer für bestimmte Handlungsschritte benötigt. Ferner halten sie alle Aktionen fest, die wahrscheinlich zu einer Fehlbedienung führen. Schließlich werden vermutete Gründe für die Fehlbedienung gegeben. Allerdings werden keine Vorschläge zur Änderung unterbreitet.
Aufgrund der Beschränkung auf spezifische Fragen der Durchführung von Aktionen ist die Anzahl der gefundenen allgemeinen Usability-Probleme bei dieser Methode relativ gering.
Das folgende Kapitel in den theoretischen Grundlagen beschäftigt sich mit der Internet-Ergonomie.
Ich helfe Ihnen bei der
Optimierung der Ergonomie in Internet-Auftritten
Weiter in den theoretischen Grundlagen - zur Internet-Ergonomie
Controlling21.de - Dr. J. Schuhmacher
Internet und Multimedia in Perfektion