User:Mantury/FittsGesetz



Fitts’s Gesetz (häufig auch Fitts’ Gesetz oder Fitts‘ Law und Fitts’s Law genannt) ist ein prädiktives Modell, welches die Dauer für menschliche Bewegungen bei Zeigeaufgaben vorhersagt. Dabei verwendet es die Distanz zum Ziel, sowie dessen Größe als Parameter. Das Modell wird häufig im Bereich der Mensch-Computer-Interaktion und Ergonomie verwendet wird, um beispielsweise Layouts oder Eingabegeräte zu vergleichen.

Das Gesetzt beschreibt die benötigte Zeit, um schnell und direkt von einem Punkt auf ein Ziel zu zeigen. Diese ergibt sich aus einer Funktion, welche die Größe des Ziels ins Verhältnis zur Distanz vom Startpunkt setzt. Fitts’s Gesetz wird verwendet, um die Aktion der Zielauswahl modellhaft in verschiedenen Kontexten zu beschreiben. Dazu zählen zum einen das physische Berühren des Objekts mit der Hand oder einem Finger, aber auch virtuelle Interaktionen, wie bei der Verwendung einer Zeigegerätes in Verbindung mit einem Computermonitor. Allgemein zeigt das Modell, dass es für den Nutzer schwieriger wird ein Ziel zu treffen, je weiter entfernt oder kleiner es ist.

Fitts’s Gesetz hat seine Voraussagekraft in unterschiedlichsten Bedingungen unter Beweis gestellt. So kann es für verschiedene Extremitäten (Hände, Finger, Füße, untere Lippe ) verwendet werden, aber auch für Head-Tracking. Zudem gilt es auch bei verschiedenen Eingabegeräten, wie der Maus oder Touchscreens. Das Gesetz findet auch in Unterwasserszenarios Anwendung. Auch bei breiten Anwendergruppen (jung, alt, männlich, weiblich ), Personen mit sonderpädagogischen Bedürfnissen und bei Personen unter Drogeneinfluss ist das Gesetz gültig.

Ursprüngliches Modell
Das ursprüngliche Paper von Paul Morris Fitts wurde 1954 veröffentlicht und stellt das Gesetz als eine Metrik zur Quantisierung der Schwierigkeit von Zielauswahlaufgaben vor. Diese Metrik basierte auf einer Analogie zu Informationstheorie, in der die Distanz zum Ziel (D) als Signalstärke und die Breite des Ziels (W) als Rauschen behandelt wurden. Daraus ergibt sich der Fitts-sche Schwierigkeitsindex (ID, index of difficulty) in Bit:

$$\text{ID} = \log_2 \Bigg(\frac{2D} {W}\Bigg)$$

Fitts gab darüber hinaus noch einen Performanzindex (IP, index of performance) in Bit pro Sekunde, um die Leistung des Nutzers darstellen zu können. Hierbei werden der Schwierigkeitsindex (ID) mit der ermittelten Bewegungszeit für die Auswahl des Ziels (MT, movement time) in Sekunden miteinander kombiniert. Laut Fitts „Die durchschnittliche Informationsrate erzeugt durch eine Abfolge von Bewegungen ist die durchschnittliche Information pro Bewegung geteilt durch die Dauer der Bewegung“. Daraus folgt:

$$\text{IP} = \Bigg(\frac{\text{ID}} {\text{MT}}\Bigg)$$

Aktuelle Forschung verweist auf den Performanzindex auch als Durchsatz (TP, throughput). Zusätzlich wird die Genauigkeit beim Auswählen eines Ziels mit in die Berechnung einbezogen.

Spätere Arbeiten nach Fitts erstellten Regressionsmodelle, die auf die Korrelation (r) für ihre Gültigkeit untersucht wurden. Die letztlich daraus entstandene Formel beschreibt einen linearen Zusammenhang zwischen der Bewegungsdauer (MT) und dem Schwierigkeitsindex, bestehend aus W und D, der Aufgabe:

$$\text{MT} = a + b \cdot \text{ID} = a + b \cdot \log_2 \Bigg(\frac{2D}{W}\Bigg)$$ Diese Formel ergibt sich aus:
 * MT ist die durchschnittliche Dauer zur Erfüllung der Bewegung zur Zielauswahl
 * a und b sind Konstanten in Bezug auf die Zeit, welche vom verwendeten Eingabegerät abhängen. Diese werden meist empirisch, über mehrere Versuchsdurchläufe und mit anschließender Regressionsanalyse, bestimmt. a definiert den Y-Achsenschnittpunkt und beschreibt die Verzögerung bis die Bewegung beginnt. Der zweite Parameter b, die Steigung, kann als Beschleunigung interpretiert werden. Hierbei wird der häufig beobachtete lineare Zusammenhang zwischen Dauer und Schwierigkeit deutlich.
 * ID ist der berechnete Schwierigkeitsindex
 * D ist die Distanz vom Startpunkt der Aufgabe zum Mittelpunkt des Ziels
 * W ist die Breite des Ziels entlang der Bewegungsachse. So wird auch die Fehlertoleranz beschrieben, da die Zielbewegung innerhalb ±$W/2$ vom Zielmittelpunkt fallen muss.

Da Eingaben auf kürzere Bewegungszeiten optimiert werden sollten, können die zu bestimmenden Parameter a und b als Performanzindikatoren für die getesteten Eingabegeräte benutzt werden. Card, Englisch und Burr verwendeten das Gesetz als Erste im Bereich der Mensch-Computer-Interaktion. Sie interpretierten $1/b$ als Performanzindex (IP, index of performance), um verschiedene Eingabegeräte miteinander zu vergleichen. Hierbei erwies sich die Computermaus als besser als der Joystick oder Richtungstasten. Laut Stuart Cards Biografie war diese Entdeckung „ein großer Einflussfaktor zur kommerziellen Einführung der Maus durch Xerox“.

Experimente mit Fitts Gesetz werden meist mit Variationen von entweder Distanz oder Zielbreit, aber selten beider Parameter. Die Vorhersagekraft des Gesetzes verschlechtert sich bei Veränderung beider Parameter über große Wertebereiche. Anzumerken ist, dass die Schwierigkeit (ID) nur über das Verhältnis von Distanz zu Zielbreite abhängig ist. Daraus folgt, dass Aufgaben sich unendlich groß skalieren lassen müssten und dabei dieselbe Schwierigkeit und Ausführungsdauer beibehalten, was praktisch nicht möglich ist. Abgesehen von diesen Fehlern, verfügt das Modell über eine außergewöhnliche belastbare Vorhersagekraft. Deshalb wird es in verschiedensten Bereichen, Computerinterfacemodalitäten und Bewegungsaufgaben verwendet und lieferte Erkenntnisse im Bereich des Interface-Designs.

Bewegungen
Eine Bewegung nach Fitts‘ Gesetz lässt sich vereinfacht in zwei Bewegungsphasen unterteilen:


 * Anfangsbewegung (initial movement). Sie ist schnell, grob und in Richtung des Zielobjektes.
 * Endbewegung (final movement). Sie verlangsamt sich zunehmend und ist dazu da, das Ziel genau zu erreichen.

Die erste Phase wird primär durch den Abstand des Ziels bestimmt. In dieser Phase muss sich schnell, jedoch unpräzise dem Ziel angenähert werden. Die zweite Phase bestimmt die Genauigkeit, mit der das Ziel getroffen wird. Nun muss sich kontrolliert zur kleiner Zielfläche bewegt werden. Da die Dauer der Aufgabe linear abhängig zur Schwierigkeit ist. Da Aufgaben jedoch dieselbe Schwierigkeit bei unterschiedlichen Größen haben können, gilt allgemein auch, dass die Distanz mehr Auswirkung auf die Dauer hat als die Breite.

Häufig wird auch Eye-Tracking als mögliches Anwendungsgebiet für Fitts‘ Law genannt. Dies ist jedoch zumindest umstritten. Aufgrund der hohen Geschwindigkeit bei Sakkadenbewegungen, ist das Auge während diesen blind. Somit ist die Zielsuche des Blickes nicht analog zu beispielsweise Handbewegungen, da die erste Phase blind geschieht.

Bits pro Sekunde: Innovation angeführt durch Informationstheorie
Die meist verbreitete Variante zur Berechnung des Schwierigkeitsindex (ID, index of difficulty) in der Mensch-Computer-Interaktion ist die Shannon-Form:

$$\text{ID} = \log_2 \Bigg(\frac{D}{W}+1\Bigg)$$

Scott MacKenzie, Professor an der York Universität, stellte diese Form vor. Der Name bezieht sich auf die formal ähnliche Formel des Shannon-Hartley-Gesetz. Dieses beschreibt die Übertragung von Information bei gegebener Bandbreite, Signalstärke und Rauschen. In Fitts‘ Gesetz entspricht die Distanz der Signalstärke und die Zielbreite dem Rauschen.

Die Schwierigkeit einer Aufgabe wir in Bit pro Sekunde angegeben. Damit wird die Menge an Information beschrieben. Dies begründet sich in der Annahme, dass Zeigen eine Informationsverarbeitungsaufgabe ist. Trotz des Fehlens einer mathematisch beweisbaren Verbindung zwischen Fitts‘ Gesetz und dem Shannon-Hartley-Theorem, wird diese Form in der aktuellen Forschung verwendet, da sich die Bewegungen mittels des informationstheoretischen Konzepts darstellen lassen. Seit 2002 wird diese Form auch in der ISO 9241 genannt und definiert so den Standard für Tests von Mensch-Maschine-Schnittstellen. In einem theoretischen Experiment hat sich jedoch gezeigt, dass der Fitts-sche Schwierigkeitsindex und die zugrunde liegende informationstheoretische Shannon-Entropie unterschiedliche Bit-Werte für die zu übertragende Information ergeben. Die Autoren nennen den Unterschied der beiden Berechnungsarten vernachlässigbar. Lediglich bei Vergleichen von Geräten der Eingabeentropie bekannt ist oder der Bewertung menschlicher Informationsverarbeitung, würde ein Vergleich zu Fehlern führen.

Anpassungen für Genauigkeiten: Einbezug der effektiven Zielbreite
Crossman veröffentlichte im Jahr 1956 eine Ergänzung, welche von Fitts selbst in einer Veröffentlichung mit Peterson im Jahr 1964 genutzt wurdenbsp;. Hierbei wird die Breite(W) des Ziels durch seine effektive Breite (We) ersetzt. We ergibt sich aus der Standardabweichung der Trefferkoordinaten über den Verlauf eines Versuchs mit konkreten D-W-Werten. Wird die Auswahl des Nutzers beispielsweise als x-Koordinaten entlang der Bewegungsachse erfasst, so ergibt sich:

$$W_e = 4.133 \times SD_x$$

Daraus folgt über die Shannon-Form:

$$\text{ID}_e = \log_2 \Bigg(\frac{D}{W_e}+1\Bigg)$$

Und schließlich kann ein angepasster Performanzindex berechnet werden, wobei MT mit der vollen Breite berechnet wird:

$$\text{IP} = \Bigg(\frac{ID_e} {MT}\Bigg)$$

Sind die Koordinaten der Auswahl normalverteilt, zieht sich We über 96% der Werteverteilung. Wurde nun im Experiment eine Fehlerrate von 4% beobachtet so ist We = W. Ist die Fehlerrate höher so gilt We > W, ist sie geringer, so ist We < W. Durch den Einbezug der effektiven Zielbreite gibt Fitts‘ Gesetz genauer wieder, worauf der Nutzer eigentlich gezielt hat und nicht das vom Experiment angebotene Ziel. So liegt der Nutzen den Performanzindex mit effektiver Breite zu berechnen darin, dass die Genauigkeit und somit der Raum ein Ziel zu treffen, miteinbezogen wird. Die Relation von Geschwindigkeit zu Genauigkeit wird so genauer dargestellt. Diese Formel wird auch in ISO 9241-9 als Referenz zur Berechnung des Durchsatzes (TP, throughput) angegeben.

Welfords model
Kurz nach der Vorstellung der ursprünglichen Modells, wurde eine 2-Faktorenvariation vorgestellt. Hier wird nun zwischen dem Einfluss der Breite des Ziels und dem Einfluss durch den Abstand zum Ziel auf die Bewegungsdauer unterschieden. Welfords Modell, vorgestellt im Jahr 1968, teilt die Parameter der Distanz und Breite in zwei unabhängige Terme auf. So werden die Einflüsse aufeinander getrennt. Dieses Modell zeigt eine verbesserte Vorhersagekraft:

$$T = a + b_1 \log_2 (D) + b_2 \log_2 (W)$$

Das das Modell nun einen weiteren Parameter hat, kann die Genauigkeit der Vorhersage nicht mit der Einfaktorform des ursprünglichen Fitts‘ Gesetz verglichen werden. Jedoch kann das neue Modell, ähnlich wie bei der Shannon-Umschreibung, angepasst werden:

$$T = a + b_1 \log_2 (D+W) + b_2 \log_2 (W) = a + b\log_2 \left(\frac{D+W}{W^k}\right)$$

Der zusätzliche Parameter k erlaubt es Winkel der Bewegung und des Ziels in das Modell einzubeziehen. So wird die Position des Nutzer relativ zur Oberfläche einbezogen. Der Exponent gewichtet den Einfluss von Bewegungswinkel zu Zielwinkel. Diese Formulierung wurde von Kopper et al. vorgestellt. Ist k=1, so kann das Modell mit dem F-Test für verschachtelte Modelle direkt mit der Shannon-Form des Fitts’ Gesetz verglichen werden. Vergleiche ergeben, dass die Shannon-Form von Welfords Modell bessere Voraussagen liefert und zudem auch robuster auf Variation im Control-Display-Gain (Verhältnis der Bewegung der Eingabe zur Bewegung des Pointers). Daraus folgt, obwohl die Shannon-Form komplexer und weniger intuitiv ist, ist beschreibt sie das empirisch beste Modell für die Evaluation für virtuelle Zeigeaufgaben.

Erweiterung auf mehrere Dimensionen
In seiner ursprünglichen Form sollte Fitts’s Gesetz nur auf eindimensionale Aufgaben angewandt werden. Jedoch mussten die Probanden im Ursprungsexperiment mehrere Styli mit unterschiedlichen Gewichten in 3 Dimensionen von einer Metallplatte zu einer anderen bewegen, was auch als reziproke Antipp-Aufgabe bezeichnet wird. So war die Breite des Ziels senkrecht zur Bewegungsrichtung, um deren Einfluss gering zu halten. Fitts’s Gesetz wird nun aber meist für Aufgaben auf Computermonitoren verwendet, in deren Kontext die Ziele in 2 Dimensionen ausgeprägt sind (Höhe und Breite).

Um das Gesetz an diesen Kontext anzupassen gibt es 2 Möglichkeiten. Für Aufgaben in hierarchischen, aufklappenden Menüstrukturen muss der Nutzer einen Pfad gegeben durch das Layout befahren. Hierzu wird das Accot-Zhai-Steering-Gesetz angewandt.

Bei sonstigen einfachen Zeigeaufgaben zeigt sich das Gesetz als robust. Jedoch sollten Anpassungen vorgenommen werden, um Fehlerraten konsistent zu erfassen und um die Geometrie der Ziele zu beschreiben. Hierfür gibt es verschiedene Möglichkeiten die Größe zu berechnen :


 * Status Quo: Horizontale Breite des Ziels messen.
 * Summenmodell: W ist Höhe zur Breite addieren
 * Flächenmodell: W ist Höhe mal Breite
 * Kleineres von beiden: W ist der kleinere Wert von Höhe oder Breite
 * W-Modell: W ist die Länge des Ziels in Bewegungsrichtung gemessen (effektive Größe)

Die Literatur verwendet dabei überwiegend das W-Modell.

Charakterisierung der Performanz
Da die Parameter a und b die Zeiten der Bewegung über verschiedene Zielanordnungen und -formen erfassen sollen, können diese auch als Performanzindikatoren für das evaluierte Nutzerinterface dienen. Hierbei muss die Varianz der unterschiedlichen Nutzer von der Varianz der unterschiedlichen Interfaces getrennt werden können. Der Parameter a sollte positiv und nahe 0 liegen, jedoch kann er auch für die Evaluierung von Durchschnittswerten ignoriert werden. Der Parameter ist auch in Fitts‘ ursprünglicher Variante Null (Soukoreff, et al. 2011) Um die Parameter aus empirischen Versuchswerten zu bestimmen gibt es unterschiedliche Methoden. Da diese unterschiedlichen Methoden zu uneindeutigen Performanzergebnissen führen, die auch Unterschiede eliminieren können, ist dies ein strittiges Thema in der Forschung.

Zudem fehlt dem Gesetz ein intrinsischer Fehlerterm. Nutzer, die aggressiv und schnell zwischen den Zielen springen erreichen diese schneller. Machen sie einen Fehler, muss lediglich eine Wiederholungen mehr gemacht werden. Da die Anzahl der Wiederholungen in der eigentlichen Formel keine Verwendung findet, wird dies in der Performanz nicht widergespiegelt. Die dadurch entstehende Fehlerrate sollte in das Modell miteinbezogen werden, da sonst die durchschnittliche Aufgabenzeit künstlich gesenkt wird.

Ziele mit zeitlicher Einschränkung
Fitts’ Gesetz wird bei Zielen mit räumlicher Dimension verwendet. Ziele können jedoch auch auf einer Zeitachse definiert sein, womit sie „zeitlich begrenzte Ziele“ sind. Hierzu zählen blinkende Ziele oder Ziele die sich auf eine Auswahlfläche zu bewegen. Hierbei kann wie bei räumlichen Aufgaben die Distanz des Ziels (hier die zeitlich Distanz Dt) und dessen Breite (hier die zeitliche Breite Wt) definiert werden. Konkret bezeichnet Dt die Zeit, die der Nutzer warten muss, bis das Ziel erscheint und Wt die Zeit, in der das Ziel zu sehen ist. Im Beispiel für ein blinkendes Ziel beschreibt Dt die Zeit zwischen dem Blinken und Wt die Anzeigedauer bis zum nächsten Abblenden. Wie auch bei räumlichen Zielen wird die Auswahl bei kleiner Breite (Wt) oder größere Distanz (Dt) schwieriger, da das Ziel im temporalen Kontext kürzer angewählt werden kann.

Die Aufgabe des Auswählens von zeitlich begrenzten Zielen wird auch „temporales Zeigen“ genannt. Das gezeigte Modell wurde zuerst 2016 im Feld der Mensch-Computer-Interaktion veröffentlicht. So können Fehlerraten, als Performanz des menschlichen Nutzers beim temporalen Zeigen mit einer Funktion für den temporalen Index der Schwierigkeit angegeben werden (IDt):

$$\text{ID}_{t} = \log_2 \Bigg(\frac{D_{t}}{W_{t}}\Bigg)$$

Folgen für das UI-Design
Aus der Formulierung von Fitts‘ Gesetz lassen sich Richtlinien für die Gestaltung von GUIs ableiten. Grundlegend sagt das Gesetz aus, dass ein Ziel so groß wie möglich sein soll, um einfacher getroffen werden zu können. Dies lässt sich aus dem W-Parameter des Schwierigkeitsindex ableiten. Spezifischer ist hier die effektive Größe des Ziels gemeint, welche entlang der Bewegungsrichtung des Nutzer durch das Ziel verläuft.

Um den D-Parameter zu optimieren, sollten Ziele, die im Kontext häufig miteinander verwendet werden, gruppiert werden.

Ziele, die an den Rändern eines klassischen Bildschirms platziert werden, sind theoretisch ideale Ziele, da sie in eine Dimension als unendlich groß angesehen werden können. Der Nutzer kann sein Zeigegerät am Rand des Bildschirms unendlich weit bewegen, ohne dass sich die Position des Cursors ändert. Somit ist die effektive Größe eines Ziels am Bildschirmrand unendlich. Diese Regel wird auch “Regel der unendlichen Kanten” genannt. Die Anwendung kann in Apples Desktopbetriebssystem MacOS gesehen werden. Hier wird die Menüleiste eines Programms immer unabhängig vom Programmfenster an der oberen Bildschirmkante angezeigt.

Die genannte Regel ist an den Ecken besonders effektiv. Hier führen zwei Kanten zusammen und können so eine unendlich große Fläche erzeugen. Microsoft Windows platziert seinen essentiellen “Start”-Knopf in der unteren linken Ecke und Microsoft Office 2007 nutzt die oberen linke Ecke für den funktionalen Office-Knopf. Die vier Ecken werden auch „magische Ecken“ genannt. Trotz dieser Regel befindet sich der “Beenden”-Knopf in Microsoft Windows in der oberen rechten Ecke. So kann der Knopf zwar in Vollbildanwendungen leicht ausgewählt werden, aber auch einfacher unbeabsichtigt. MacOS platziert den Knopf in der linken oberen Ecke des Programmfensters, wobei die Menüleiste die magische Ecke ausfüllt und der Knopf somit nicht angewählt wird.

UI-Layouts, die es ermöglichen, Menüs dynamisch an der Stelle des Cursors zu erstellen, reduzieren die Bewegungsdistanz (D) und damit die Taskdauer nochmals. Nutzer können so Funktionen direkt nahe der bisherigen Stelle ausführen. Somit muss kein neuer Bereich des UI angesteuert werden. Dies wird von den meisten Betriebssystemen bei Kontextmenüs angewandt. Der Pixel, an dem das Menü beginnt, wird als „magischer Pixel“ bezeichnet.

Boritz et al. (1991) verglichen radiale Menüs. In diesen sind alle Funktionen als Kreissektoren und somit mit gleichen Abstand um den magischem Pixel angeordnet. Diese Arbeit zeigt, dass auch die Richtung, in die eine Bewegung ausgeführt wird, miteinbezogen werden sollte. Für Rechtshänder war das Auswählen von Funktionen auf der linken Seite des radialen Menüs schwieriger als bei Funktionen auf der rechten Seite. Oben und unten angeordnete Funktionen wurden jeweils gleich schnell erreicht.