Files
task-queue-proof/README.de.md
T
Mortdecai b6d42d3237 Add 10 translations: ES, TH, FR, EO, PL, DE, PT, AR, TL, ZH
Complete translations of the full paper into:
- Spanish (README.es.md)
- Thai (README.th.md)
- French (README.fr.md)
- Esperanto (README.eo.md)
- Polish (README.pl.md)
- German (README.de.md)
- Portuguese/Brazilian (README.pt.md)
- Arabic/MSA (README.ar.md)
- Tagalog/Filipino (README.tl.md)
- Simplified Chinese (README.zh.md)

All translations preserve mathematical notation, LaTeX formulas,
citation numbers, and markdown formatting. Reference citations kept
in English with translated annotations.

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-29 00:36:57 -04:00

60 KiB
Raw Blame History

Die ungewichtete durchschnittliche Abschlusszeit ist keine faire Metrik fuer die Aufgabenplanung

Ein mathematischer Beweis, dass die ungewichtete durchschnittliche Aufgabenabschlusszeit eine verzerrte Statistik ist, die das gezielte Herauspicken einfacher Aufgaben belohnt, und dass jeder Planungsvorteil, den sie scheinbar aufdeckt, ein Artefakt der Metrik ist — keine Widerspiegelung tatsaechlichen Durchsatzes oder tatsaechlicher Servicequalitaet.


1. Einfuehrung

Viele Organisationen messen die Aufgabenausfuehrungsleistung anhand der ungewichteten mittleren Abschlusszeit: der durchschnittlichen Anzahl von Stunden (oder Tagen) zwischen Aufgabeneinreichung und Aufgabenabschluss, wobei jede Aufgabe unabhaengig von Groesse oder Prioritaet gleich gezaehlt wird.

Diese Arbeit beweist, dass diese Metrik nicht lediglich ungenau, sondern strukturell verzerrt ist. Sie kann durch Umordnung der Arbeit verbessert werden, ohne zusaetzliche Arbeit zu leisten (Satz 1), waehrend eine ordnungsgemaess gewichtete Alternative vollstaendig immun gegen Manipulationen durch die Reihenfolgeplanung ist (Satz 2). In Kombination mit einem Prioritaetssystem widerspricht die Metrik aktiv den eigenen Prioritaetsklassifikationen der Organisation (Satz 9).

Die Argumentation gliedert sich in vier Teile:

  • Teil I (Abschnitte 24) legt das mathematische Fundament: Der ungewichtete Mittelwert ist durch Shortest Processing Time (SPT)- Planung manipulierbar, der arbeitsgewichtete Mittelwert ist planungsinvariant, und die daraus resultierenden Konsequenzen fuer die Servicequalitaet sind nachweislich negativ.

  • Teil II (Abschnitte 56) erweitert das Modell auf prioritaetsklassifizierte Aufgaben, beweist, dass die Metrik gegenueber dem Prioritaetssystem adversarial wird, und schlaegt gewichtete Alternativen vor, mit einem durchgerechneten Beispiel eines IT-Service-Desks.

  • Teil III (Abschnitte 79) untersucht die organisatorische Dynamik: Was geschieht, wenn die Metrik an Kunden berichtet wird (Informationsasymmetrie), was mit Teammitgliedern geschieht, die ihre Maengel verstehen (psychischer Schaden), und was ein einzelner informierter Manager dagegen tun kann (eingeschraenkte Optimierung mit spieltheoretischer Stabilitaetsanalyse).

  • Teil IV (Abschnitte 1012) praesentiert ehrliche Gegenargumente, ordnet die Arbeit in die bestehende Literatur ein und schliesst ab.

Die Kernergebnisse bauen auf Smiths (1956) grundlegender Ablaufplanungstheorie [1] auf, erweitert durch Spieltheorie [9, 10], organisatorische Messtheorie [18, 19] und Psychologie [1117], um eine vollstaendige Kette von einem mathematischen Beweis ueber eine bestimmte Metrik bis hin zu organisatorischen Auswirkungen nachzuzeichnen.


Teil I: Mathematisches Fundament

2. Definitionen

Es seien n Aufgaben mit Bearbeitungszeiten p_1, p_2, \ldots, p_n gegeben.

Ein Ablaufplan \sigma ist eine Permutation von \{1, 2, \ldots, n\}, die Aufgaben einer Ausfuehrungsreihenfolge auf einem einzelnen Ausfuehrer zuweist.

Die Abschlusszeit der Aufgabe \sigma(k) unter Ablaufplan \sigma ist:

C_{\sigma(k)} = \sum_{j=1}^{k} p_{\sigma(j)}

Die ungewichtete mittlere Abschlusszeit ist:

\bar{C}(\sigma) = \frac{1}{n} \sum_{k=1}^{n} C_{\sigma(k)}

Die arbeitsgewichtete mittlere Abschlusszeit ist:

\bar{C}_w(\sigma) = \frac{\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)}}{\sum_{k=1}^{n} p_{\sigma(k)}}

3. Kernergebnisse

3.1 Der ungewichtete Mittelwert ist manipulierbar

Satz 1 (Smith, 1956 [1]). Der Ablaufplan, der \bar{C}(\sigma) minimiert, ist Shortest Processing Time first (SPT): Sortiere die Aufgaben so, dass p_{\sigma(1)} \le p_{\sigma(2)} \le \cdots \le p_{\sigma(n)}.

Beweis (Austauschmethode [1, 2]).

Betrachte einen beliebigen Ablaufplan \sigma, in dem zwei benachbarte Aufgaben i, j die Bedingung p_i > p_j erfuellen, wobei Aufgabe i unmittelbar vor Aufgabe j eingeplant ist. Sei t die Startzeit von Aufgabe i.

Aufgabe i endet Aufgabe j endet Summe
Vor dem Tausch (i dann j) t + p_i t + p_i + p_j 2t + 2p_i + p_j
Nach dem Tausch (j dann i) t + p_j t + p_j + p_i 2t + p_i + 2p_j

Die Aenderung der Summe der Abschlusszeiten betraegt:

(2p_i + p_j) - (p_i + 2p_j) = p_i - p_j > 0

Jeder Tausch eines laenger-vor-kuerzer-Paares benachbarter Aufgaben reduziert die Gesamtsumme strikt. Jeder Nicht-SPT-Ablaufplan enthaelt ein solches Paar. Wiederholte Tauschoperationen konvergieren zu SPT. Daher minimiert SPT \bar{C}(\sigma) eindeutig. \blacksquare

3.2 Der arbeitsgewichtete Mittelwert ist planungsinvariant

Satz 2. Die arbeitsgewichtete mittlere Abschlusszeit \bar{C}_w(\sigma) ist fuer jeden Ablaufplan \sigma identisch.

Beweis.

Expandiere den Zaehler:

\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)} = \sum_{k=1}^{n} p_{\sigma(k)} \sum_{j=1}^{k} p_{\sigma(j)}

Reindiziere, indem a = \sigma(k) und b = \sigma(j) gesetzt wird. Die Doppelsumme zaehlt jedes geordnete Paar (a, b), bei dem b nicht spaeter als a eingeplant ist:

= \sum_{\substack{a, b \\ b \preceq_\sigma a}} p_a \, p_b

Fuer jedes Paar (a, b) mit a \ne b gilt genau eine der Beziehungen \{b \preceq_\sigma a\} oder \{a \prec_\sigma b\}. Die Diagonalterme (a = b) tragen p_a^2 bei, unabhaengig von der Reihenfolge. Daher:

\sum_{\substack{a, b \\ b \preceq_\sigma a}} p_a \, p_b = \sum_{a} p_a^2 + \sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b

Zusammen mit der komplementaeren Summe decken die beiden Nebendiagonalsummen alle ungeordneten Paare ab:

\sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b + \sum_{\substack{a \ne b \\ a \prec_\sigma b}} p_a \, p_b = \sum_{a \ne b} p_a \, p_b

Die rechte Seite ist planungsunabhaengig. Aufgrund der Symmetrie von p_a p_b sind beide Nebendiagonalsummen gleich:

\sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b = \frac{1}{2} \sum_{a \ne b} p_a \, p_b

Daher:

\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)} = \sum_a p_a^2 + \frac{1}{2} \sum_{a \ne b} p_a \, p_b = \frac{1}{2}\left(\sum_a p_a\right)^2 + \frac{1}{2}\sum_a p_a^2

Dieser Ausdruck enthaelt keinen Bezug auf \sigma. Da der Nenner \sum p_a ebenfalls planungsunabhaengig ist:

\bar{C}_w(\sigma) = \frac{\frac{1}{2}\left(\sum p_a\right)^2 + \frac{1}{2}\sum p_a^2}{\sum p_a}

ist ueber alle Ablaufplaene konstant. \blacksquare

Dies ist ein Beispiel der Erhaltungssaetze in der Ablaufplanung, die von Coffman, Shanthikumar und Yao [20] identifiziert wurden. Die Invarianz entspricht der Messung, wie lange eine Einheit Arbeit wartet, anstatt wie lange eine Aufgabe wartet — die ungewichtete Statistik zaehlt Abschluesse statt Arbeit, weshalb sie manipulierbar ist. (Siehe auch Little [3, 4] fuer den warteschlangentheoretischen Kontext, mit dem Vorbehalt, dass Littles Gesetz direkt nur auf stationaere Systeme anwendbar ist, nicht auf den hier analysierten Batch-Fall.)

3.3 Anschauliches Beispiel

Zwei Aufgaben: A mit p_A = 1 Stunde, B mit p_B = 10 Stunden.

Ablaufplan C_A C_B Ungewichteter Mittelwert Arbeitsgewichteter Mittelwert
SPT (A zuerst) 1 11 6,0 111/11 ≈ 10,09
Umgekehrt (B zuerst) 11 10 10,5 111/11 ≈ 10,09

SPT erscheint 4,5 Stunden besser bei der ungewichteten Metrik, bietet aber keinerlei Verbesserung bei der arbeitsgewichteten Metrik. Der scheinbare Vorteil existiert nur, weil die ungewichtete Statistik einer 1-Stunden-Aufgabe das gleiche „Stimmrecht" einraeumt wie einer 10-Stunden-Aufgabe.


4. Konsequenzen fuer die Servicequalitaet

4.1 Aushungerung grosser Aufgaben

Satz 3 (Metrik-Verzerrung). Jede Planungsstrategie, die die ungewichtete mittlere Abschlusszeit minimiert, maximiert zwangslaeufig die Abschlusszeit der groessten Aufgabe.

Beweis. SPT platziert die groesste Aufgabe an letzter Stelle. Ihre Abschlusszeit entspricht der gesamten Bearbeitungszeit \sum p_i, was die maximal moegliche Abschlusszeit fuer jede einzelne Aufgabe darstellt. Unter jedem Ablaufplan, der die groesste Aufgabe nicht an die letzte Stelle setzt, wird diese Aufgabe strikt frueher abgeschlossen. \blacksquare

Dies schafft einen Anreiz zur Aushungerung: Rationale Akteure, die die ungewichtete Statistik optimieren, werden grosse Aufgaben zugunsten kleiner auf unbestimmte Zeit zurueckstellen. Austin [18] identifizierte dieses allgemeine Muster — dass unvollstaendige Messung Anreize schafft, die gemessene Dimension auf Kosten der ungemessenen zu optimieren — im Kontext des organisatorischen Leistungsmanagements. Satz 3 liefert den spezifischen Mechanismus fuer die Aufgabenplanung.

4.2 Maximale Abschlusszeit fuer die groesste Aufgabe

Satz 4 (SPT maximiert eindeutig die Abschlusszeit der groessten Aufgabe). Unter allen Ablaufplaenen ist SPT die einzige Strategie, die der groessten Aufgabe die maximal moegliche Abschlusszeit (\sum p_i) zuweist.

Beweis. SPT sortiert Aufgaben in aufsteigender Reihenfolge von p_i und platziert die groesste Aufgabe p_{\max} an die letzte Position. Die letzte Aufgabe in jedem Ablaufplan hat die Abschlusszeit \sum_{i=1}^{n} p_i, was das Maximum ist, das eine einzelne Aufgabe erhalten kann. Unter jedem Ablaufplan, der p_{\max} nicht an die letzte Stelle setzt, wird sie strikt vor \sum p_i abgeschlossen. \blacksquare

Korollar 4.1. Ein Team, das die ungewichtete mittlere Abschlusszeit optimiert, wird systematisch die schlechteste Erfahrung fuer Kunden mit den komplexesten Beduerfnissen liefern. Dies ist kein Nebeneffekt — es ist der Mechanismus, durch den sich die Metrik verbessert.

Anmerkung zu Verlangsamungsverhaeltnissen. SPT komprimiert tatsaechlich die Verlangsamungsverhaeltnisse (S_i = C_i / p_i), da groessere Aufgaben in spaeteren Positionen grosse Nenner haben, die die akkumulierte Summe absorbieren. Zum Beispiel bei den Aufgaben [1, 5, 10]: SPT ergibt Verlangsamungen [1, 1.2, 1.6] (niedrige Varianz), waehrend LPT [1, 3, 16] ergibt (hohe Varianz). Der Schaden von SPT fuer Kunden mit grossen Aufgaben ist nicht im Verlangsamungsverhaeltnis sichtbar — er ist in der absoluten Abschlusszeit sichtbar. Diese Unterscheidung ist wichtig: Die Literatur zur Fairness in der Ablaufplanung [21, 22, 23] hat die Unfairness von SPT/SRPT primaer anhand verlangsamungsbasierter Masse diskutiert, die die absolute Verzoegerungslast, die unten bewiesen wird, verschleiern koennen.

4.3 Verzoegerungskonzentration

Satz 5 (SPT konzentriert Verzoegerung auf die groesste Aufgabe). Unter SPT traegt die groesste Aufgabe mehr absolute Verzoegerung als unter jedem anderen Ablaufplan.

Beweis. Definiere die absolute Verzoegerung als \Delta_i = C_i - p_i (Wartezeit, unabhaengig von der eigenen Groesse). Unter SPT befindet sich die groesste Aufgabe an Position n mit:

\Delta_{\max\text{-task}}^{\text{SPT}} = C_n - p_n = \sum_{i=1}^{n-1} p_i

Dies ist die Summe der Bearbeitungszeiten aller anderen Aufgaben — die maximal moegliche Verzoegerung fuer eine einzelne Aufgabe. Unter jedem Ablaufplan, in dem die groesste Aufgabe nicht an letzter Stelle steht, ist ihre Verzoegerung strikt geringer. Gleichzeitig gibt SPT der kleinsten Aufgabe eine Verzoegerung von null (\Delta_1^{\text{SPT}} = 0). Die gesamte Warteschlangenlast wird von kleinen auf grosse Aufgaben verlagert. \blacksquare

SPT minimiert die gesamte Verzoegerung (gut fuer die aggregierte Effizienz), indem es die Verzoegerung auf die Aufgaben konzentriert, die sie in Bezug auf das Verlangsamungsverhaeltnis am besten absorbieren koennen. Aber in absoluten Zahlen — Stunden des Wartens — traegt die groesste Aufgabe die volle Last.

4.4 Durchsatzinvarianz

Satz 6 (Durchsatzinvarianz). Die ueber einen beliebigen Zeithorizont T geleistete Gesamtarbeit ist unter allen Planungsstrategien identisch.

Beweis. Der Ausfuehrer verarbeitet Arbeit mit einer festen Rate. Ueber einen beliebigen Horizont T \ge \sum p_i ist die geleistete Gesamtarbeit genau \sum p_i, unabhaengig von der Reihenfolge. Fuer den stationaeren Fall mit laufenden Ankuenften wird der langfristige Durchsatz durch die Bedienrate \mu bestimmt und ist vollstaendig unabhaengig von der Ablaufplanung:

\lim_{T \to \infty} \frac{W(T)}{T} = \mu \quad \text{fuer alle Ablaufplaene } \sigma

\blacksquare

Korollar 6.1. Ein Team, das von einer beliebigen Planungsstrategie auf SPT umstellt, wird eine Verbesserung der ungewichteten mittleren Abschlusszeit beobachten — bei keinerlei Aenderung des tatsaechlichen Durchsatzes. Die Metrik verbessert sich. Die Leistung nicht.

4.5 Der kombinierte Effekt

Zusammenfassung der Saetze 4, 5 und 6:

Kenngroesse Auswirkung der Optimierung des ungewichteten Mittelwerts
Durchsatz (Arbeit/Zeit) Keine Aenderung (Satz 6)
Verzoegerung fuer kleine Aufgaben Minimiert — naehert sich null (SPT)
Verzoegerung fuer grosse Aufgaben Maximiert — traegt die gesamte Warteschlangenlast (Satz 5)
Abschlusszeit der groessten Aufgabe Maximal moeglich: \sum p_i (Satz 4)

Der Nettoeffekt auf die wahrgenommene Qualitaet ist negativ, weil:

  1. Verlustaversion ist asymmetrisch [8]. Ein Kunde, dessen 100-Stunden-Aufgabe deprioritisiert wird, erlebt ein grosses, auffaelliges Negativ. Ein Kunde, dessen 1-Stunden-Aufgabe beschleunigt wird, erlebt ein kleines, oft unbemerktes Positiv.

  2. Aufwaendige Aufgaben korrelieren mit wertvollen Kunden. Grosse Aufgaben stammen ueberproportional haeufig von Grosskunden, komplexen Vertraegen oder kritischen Geschaeftsanforderungen.

  3. Aushungerung kumuliert sich. In einem kontinuierlichen System (Satz 3) koennen grosse Aufgaben unbegrenzt aufgeschoben werden, da staendig neue kleine Aufgaben eintreffen.

Satz 7 (Das Kernergebnis). Fuer ein Team, das Aufgaben unterschiedlicher Groesse bearbeitet, bewirkt die Einfuehrung der ungewichteten mittleren Abschlusszeit als Leistungsmetrik:

(a) Keinerlei Produktivitaetsgewinn (Satz 6), waehrend (b) der groessten Aufgabe die maximal moegliche Abschlusszeit zugewiesen wird (Satz 4), und (c) die gesamte Warteverzoegerung auf die groessten Aufgaben konzentriert wird, waehrend die Verzoegerung fuer die kleinsten eliminiert wird (Satz 5).

Dies ist kein Kompromiss. Die Metrik erzeugt einen reinen Transfer von Servicequalitaet von aufwandsintensiven Kunden zu aufwandsarmen Kunden, ohne jeglichen Nettoarbeitsgewinn. \blacksquare


Teil II: Prioritaetssysteme

5. Versagen unter Prioritaetsklassifikation

Die vorangegangenen Abschnitte haben bewiesen, dass die ungewichtete mittlere Abschlusszeit verzerrt ist, wenn Aufgaben in ihrer Groesse variieren. Wir zeigen nun, dass die Einfuehrung eines Prioritaetssystems — wie es praktisch alle realen Teams verwenden — dazu fuehrt, dass die Metrik nicht nur verzerrt, sondern aktiv adversarial gegenueber den erklaerten Zielen der Organisation wird.

5.1 Erweitertes Modell: Aufgaben mit Prioritaet

Jede Aufgabe i habe eine Bearbeitungszeit p_i und eine Prioritaetsklasse q_i \in \{1, 2, 3, 4\}, wobei 1 die hoechste Prioritaet (kritisch) und 4 die niedrigste (kosmetisch/Erweiterung) darstellt. Prioritaetsgewichte werden wie folgt zugewiesen:

w(q) = \begin{cases} 8 & q = 1 \text{ (Kritisch)} \\ 4 & q = 2 \text{ (Hoch)} \\ 2 & q = 3 \text{ (Mittel)} \\ 1 & q = 4 \text{ (Niedrig)} \end{cases}

Die spezifischen Gewichte sind illustrativ; die Ergebnisse gelten fuer jede streng monoton fallende Gewichtsfunktion. Die entscheidende Eigenschaft ist, dass die Prioritaet nach Geschaeftsauswirkung vergeben wird, nicht nach Aufgabengroesse.

5.2 Die Metrik widerspricht dem Prioritaetssystem

Satz 8 (Prioritaets-Groessen-Inversion). Wenn die Prioritaet unabhaengig von der Aufgabengroesse ist, wird der Ablaufplan, der die ungewichtete mittlere Abschlusszeit minimiert (SPT), im Erwartungswert Aufgaben niedriger Prioritaet vor Aufgaben hoher Prioritaet mit groesserer Bearbeitungszeit abschliessen.

Beweis. SPT ordnet Aufgaben nach p_i aufsteigend, unabhaengig von q_i. Betrachte zwei Aufgaben:

  • Aufgabe A: p_A = 40 Stunden, q_A = 1 (Kritisch — z.B. Serverausfall)
  • Aufgabe B: p_B = 0.5 Stunden, q_B = 4 (Niedrig — z.B. kosmetische UI-Korrektur)

SPT plant B vor A ein. Der ungewichtete Mittelwert fuer dieses Paar:

\bar{C}^{\text{SPT}} = \frac{0.5 + 40.5}{2} = 20.5 \qquad \bar{C}^{\text{priority}} = \frac{40 + 40.5}{2} = 40.25

Die Metrik erklaert SPT fuer fast doppelt so gut — obwohl eine kosmetische Korrektur bearbeitet wird, waehrend ein Serverausfall andauert.

Im Allgemeinen hat die SPT-Reihenfolge, wenn q_i statistisch unabhaengig von p_i ist, eine Korrelation von null mit der Prioritaet. In der Praxis erfordern kritische Aufgaben (Ausfaelle, Sicherheitsvorfaelle, Datenverlust) oft mehr Arbeit als Aufgaben niedriger Prioritaet, sodass die Metrik plausiblerweise anti-korreliert mit dem Prioritaetssystem ist. \blacksquare

5.3 Informationsvernichtung

Der ungewichtete Mittelwert reduziert eine dreidimensionale Aufgabe (p_i, q_i, C_i) auf ein eindimensionales Signal (C_i) und mittelt dann gleichfoermig. Dabei wird die Prioritaet vollstaendig verworfen und die Groesse implizit invertiert.

Satz 9 (Informationsvernichtung). Sei I(\sigma) die Transinformation zwischen der impliziten Prioritaetsrangfolge des Ablaufplans (Position) und der tatsaechlichen Prioritaetszuweisung q_i. Fuer SPT gilt:

I(\sigma_{\text{SPT}}) = 0 \quad \text{wenn } p_i \perp q_i

Beweis. SPT weist Positionen ausschliesslich basierend auf p_i zu. Wenn p_i und q_i unabhaengig sind, liefert die Kenntnis der Position einer Aufgabe im SPT-Ablaufplan keinerlei Information ueber ihre Prioritaet. \blacksquare

Korollar 9.1. Ein Team, das die ungewichtete mittlere Abschlusszeit optimiert, betreibt ein Planungssystem, das keinerlei Information ueber seine eigene Prioritaetsklassifikation traegt. Das Prioritaetsfeld in ihrem Ticketsystem ist hinsichtlich der Ausfuehrungsreihenfolge dekorativ.

Dies ist ein Beispiel dessen, was Austin [18] als das grundlegende Problem unvollstaendiger Messung bezeichnet: Wenn das Messsystem nur eine Teilmenge der relevanten Dimensionen erfasst, verschlechtert die Optimierung der Messung systematisch die nicht gemessenen Dimensionen.

5.4 Prioritaetsgewichtete Verzoegerungskosten

Definiere die prioritaetsgewichteten Verzoegerungskosten eines Ablaufplans:

D(\sigma) = \sum_{i=1}^{n} w(q_i) \cdot C_i

Satz 10 (SPT und prioritaetsgewichtete Verzoegerungskosten). Der optimale Ablaufplan zur Minimierung von D(\sigma) ist WSJF: Ordnung nach w(q_i)/p_i absteigend [1, 5]. Die SPT-Ordnung — nach 1/p_i absteigend — ignoriert die Prioritaet vollstaendig und erzeugt hoehere $D$-Werte als prioritaetsrespektierende Alternativen, wenn Prioritaet mit der Aufgabengroesse korreliert.

Beweis. Durch die Austauschmethode veraendert das Vertauschen benachbarter Aufgaben i, j den Wert von D um:

\Delta D = w(q_j) \cdot p_i - w(q_i) \cdot p_j

Der Tausch verbessert D, wenn w(q_j)/p_j > w(q_i)/p_i, aber j nach i eingeplant ist. Daher ist die optimale Reihenfolge absteigendes w(q_i)/p_i — die WSJF-Regel. SPT entspricht WSJF nur dann, wenn w(q_i) = \text{const} (alle Aufgaben haben gleiche Prioritaet).

Beispiel. Kritisch (w = 8, p = 3) und Niedrig (w = 1, p = 2):

  • SPT (Niedrig zuerst): D = 1 \cdot 2 + 8 \cdot 5 = 42
  • WSJF (Kritisch zuerst): D = 8 \cdot 3 + 1 \cdot 5 = 29

SPT verursacht 45% mehr prioritaetsgewichtete Verzoegerung. In der Praxis sind kritische Aufgaben tendenziell groesser (Ausfaelle, Sicherheitsvorfaelle), was die Divergenz systematisch macht. \blacksquare


6. Loesungsvorschlaege

6.1 Prioritaetsgewichtete Metriken

Ersetze die ungewichtete mittlere Abschlusszeit durch den Priority-Weighted Completion Score (PWCS):

\text{PWCS}(\sigma) = \frac{\sum_{i=1}^{n} w(q_i) \cdot \frac{C_i}{p_i}}{\sum_{i=1}^{n} w(q_i)}

Dies ist das prioritaetsgewichtete mittlere Verlangsamungsverhaeltnis. Es misst, wie lange jede Aufgabe relativ zu ihrer Groesse gewartet hat, gewichtet danach, wie wichtig diese Aufgabe war. Niedrigere Werte sind besser.

Eigenschaften:

  1. Prioritaetsrespektierend. Verzoegerungen bei kritischen Aufgaben kosten 8-mal mehr als Verzoegerungen bei Aufgaben niedriger Prioritaet.
  2. Groessenfair. Verwendet das Verlangsamungsverhaeltnis C_i / p_i, sodass grosse Aufgaben nicht dafuer bestraft werden, dass sie gross sind.
  3. Nicht durch SPT manipulierbar. Eine Umordnung nach Bearbeitungszeit verbessert den Wert nicht systematisch.
  4. Reduziert sich auf den ungewichteten Mittelwert bei uniformen Aufgaben. Eine strikte Verallgemeinerung.

6.2 Optimale Strategie: WSJF

Satz 11. Der Ablaufplan, der die prioritaetsgewichtete Abschlusszeit \text{PWCT}(\sigma) = \sum w(q_i) \cdot C_i / \sum w(q_i) minimiert, bearbeitet Aufgaben in der Reihenfolge absteigender w(q_i)/p_i — die Weighted Shortest Job First (WSJF)-Regel [1, 5].

Beweis. Durch die Austauschmethode (wie in Satz 10) verbessert der Tausch benachbarter Aufgaben i, j den PWCT-Wert, wenn w(q_j)/p_j > w(q_i)/p_i, aber j nach i eingeplant ist. Die optimale Reihenfolge ist daher absteigendes w(q_i)/p_i. \blacksquare

Innerhalb einer Prioritaetsklasse reduziert sich dies auf SPT (kuerzeste zuerst). Ueber Klassen hinweg schlaegt eine kritische 4-Stunden-Aufgabe (w/p = 2.0) eine niedrigprioritaere 1-Stunden-Aufgabe (w/p = 1.0).

Praktischer Vorbehalt. Reines WSJF kann winzige Aufgaben niedriger Prioritaet vor grosse kritische Aufgaben setzen (eine 15-Minuten-Aufgabe niedriger Prioritaet hat w/p = 1/0.25 = 4.0 und schlaegt eine 6-stuendige kritische Aufgabe mit w/p = 8/6 = 1.33). In der Praxis wird dies durch die Durchsetzung einer strikten Prioritaetsklassenordnung und die Anwendung von WSJF nur innerhalb jeder Klasse abgemildert.

6.3 Anwendungsbeispiel: IT-Service-Desk

Betrachte ein IT-Team mit der folgenden Ticket-Warteschlange:

Ticket Prioritaet Typ Gesch. Stunden
T1 P1 (Kritisch) E-Mail-Server ausgefallen 6
T2 P2 (Hoch) VPN fuer Remote-Team fehlerhaft 4
T3 P3 (Mittel) Laptop-Einrichtung fuer neuen Mitarbeiter 2
T4 P4 (Niedrig) Desktop-Hintergrundrichtlinie aktualisieren 0,5
T5 P3 (Mittel) Softwarelizenz installieren 1
T6 P1 (Kritisch) Datenbank-Backup fehlerhaft 3
T7 P2 (Hoch) Druckerflotte offline 2
T8 P4 (Niedrig) Alten gemeinsamen Laufwerksordner archivieren 0,25

SPT-Reihenfolge (Optimierung des ungewichteten Mittelwerts): T8, T4, T5, T3, T7, T6, T2, T1

Pos Ticket Prioritaet Stunden Abschluss Verlangsamung
1 T8 (Ordner archivieren) P4 Niedrig 0,25 0,25 1,0
2 T4 (Hintergrund) P4 Niedrig 0,5 0,75 1,5
3 T5 (Software) P3 Mittel 1 1,75 1,75
4 T3 (Laptop) P3 Mittel 2 3,75 1,875
5 T7 (Drucker) P2 Hoch 2 5,75 2,875
6 T6 (Backups) P1 Krit. 3 8,75 2,917
7 T2 (VPN) P2 Hoch 4 12,75 3,188
8 T1 (E-Mail) P1 Krit. 6 18,75 3,125

Praktisches WSJF (Prioritaetsklasse zuerst, SPT innerhalb der Klasse):

Pos Ticket Prioritaet Stunden Abschluss
1 T6 (Backups) P1 Krit. 3 3
2 T1 (E-Mail) P1 Krit. 6 9
3 T7 (Drucker) P2 Hoch 2 11
4 T2 (VPN) P2 Hoch 4 15
5 T5 (Software) P3 Mittel 1 16
6 T3 (Laptop) P3 Mittel 2 18
7 T8 (Archiv) P4 Niedrig 0,25 18,25
8 T4 (Hintergrund) P4 Niedrig 0,5 18,75

Vergleich:

Metrik SPT Praktisches WSJF Gewinner
Ungewichteter mittlerer Abschluss 6,56 Std. 13,63 Std. SPT
P1 mittlere Loesungszeit 13,75 Std. 6 Std. WSJF
P2 mittlere Loesungszeit 9,25 Std. 13 Std. SPT
Zeit zur Reparatur des E-Mail-Servers 18,75 Std. 9 Std. WSJF
Zeit zur Reparatur der Datenbank-Backups 8,75 Std. 3 Std. WSJF
Zeit zur Aktualisierung des Hintergrunds 0,75 Std. 18,75 Std. SPT

Die aggregierten prioritaetsgewichteten Abschlusszeiten sind nahezu identisch (PWCT: 10,2 vs. 10,17), da die Aggregation den Verteilungsschaden verbirgt. Der eigentliche Unterschied liegt in der Aufschluesselung nach Prioritaetsklasse: Der E-Mail-Server ist unter SPT 18,75 Stunden ausgefallen, gegenueber 9 Stunden unter WSJF. Die Datenbank-Backups versagen 8,75 Stunden gegenueber 3.

Die ungewichtete Metrik berichtet zuversichtlich, dass SPT mehr als doppelt so effizient ist (6,56 vs. 13,63), und belohnt das Team, das Desktop-Hintergruende aktualisiert hat, waehrend der E-Mail-Server brannte.

6.4 Empfohlenes Metrik-Set

Selbst prioritaetsgewichtete aggregierte Metriken koennen gute von schlechten Ablaufplaenen nicht unterscheiden, da die Aggregation Verteilungsschaeden verbirgt. Keine einzelne Metrik genuegt. Ein vollstaendiges Messsystem sollte erfassen:

Metrik Was sie misst Formel
Mittlerer Abschluss nach Prioritaetsklasse Reaktionsfaehigkeit pro Klasse \bar{C} gefiltert nach q
P1 mittlere Loesungszeit Reaktion auf kritische Vorfaelle \bar{C} fuer q = 1
Durchsatz Rohe Arbeitskapazitaet Geleistete Arbeitsstunden / Kalenderzeit
Alterungsverletzungen Verhinderung von Aushungerung Aufgaben, die SLA nach Prioritaet ueberschreiten
Maximale Abschlusszeit (P1/P2) Schlechtester kritischer Reaktionsfall \max(C_i) fuer q \le 2

Die zentrale Erkenntnis: Metriken pro Prioritaetsklasse decken Planungsfehler auf, die aggregierte Metriken verbergen.


Teil III: Organisatorische Dynamik

7. Wenn die Metrik das Produkt ist

Die Abschnitte 26 setzen voraus, dass die Kundenzufriedenheit eine Funktion der erlebten Servicequalitaet ist. Es gibt jedoch ein Szenario, in dem diese Annahme versagt und das gesamte Argument in sich zusammenfaellt.

7.1 Die selbstreferenzielle Metrik

Angenommen, der Anbieter berichtet den ungewichteten Mittelwert direkt an den Kunden — auf einem Dashboard, in einem SLA-Bericht, auf einer Marketingseite — und die Zufriedenheit des Kunden leitet sich primaer aus dieser Zahl ab:

U_{\text{client}} = f\!\left(\bar{C}(\sigma)\right), \quad f' < 0

Unter diesem Modell maximiert SPT tatsaechlich die Kundenzufriedenheit (Satz 1). Der Durchsatz bleibt unveraendert (Satz 6). Das Geschaeftsergebnis verbessert sich: gleiche Arbeit erledigt, zufriedenerer Kunde.

Jeder Satz in dieser Arbeit bleibt mathematisch korrekt. Aber die Schlussfolgerung invertiert sich. Die Metrik ist nicht laenger ein Proxy, der manipuliert werden kann — sie ist die Servicequalitaet, weil der Kunde zugestimmt hat, die Qualitaet anhand der aggregierten Zahl zu bewerten.

7.2 Die Oekonomie

Dies erzeugt ein kohaerentes, stabiles Gleichgewicht:

Akteur Verhalten Ergebnis
Anbieter Optimiert ungewichteten Mittelwert (SPT) Metrik verbessert sich, keine Mehrarbeit
Kunde Liest Dashboard, sieht niedrigen Durchschnitt Meldet Zufriedenheit
Management Sieht zufriedenen Kunden + gute Metrik Belohnt das Team

Der Anbieter erzeugt Zufriedenheit zu null Grenzkosten, indem er eine Zahl optimiert, die der Kunde als Proxy fuer Qualitaet akzeptiert hat.

7.3 Die Fragilitaet

Dieses Gleichgewicht ist nur stabil, solange der Kunde seine eigene Erfahrung nie ueberprueft. Es bricht zusammen, wenn:

  1. Der Kunde sein eigenes Ticket ueberprueft. Ein CTO, dessen E-Mail-Server 18,75 Stunden ausgefallen war, wird sich nicht durch „Durchschnittliche Loesungszeit: 6,56 Stunden" beruhigen lassen. Die Kunden, die am ehesten ueberprueft, sind genau diejenigen, die den schlechtesten Service erhalten (Satz 4).

  2. Ein Wettbewerber SLAs pro Ticket anbietet. „P1 innerhalb von 4 Stunden geloest" schlaegt „durchschnittliche Loesungszeit unter 7 Stunden" fuer jeden Kunden mit kritischen Beduerfnissen.

  3. Das Team die Metrik verinnerlicht. Wenn das Team glaubt, die Metrik spiegle die tatsaechliche Leistung wider, verliert es die Faehigkeit zu erkennen, wenn kritische Arbeit vernachlaessigt wird. Die Metrik wird zu einer epistemischen Gefahr.

7.4 Das allgemeine Muster

Dieses Muster — Proxy ersetzt Qualitaet, Proxy wird optimiert, Qualitaet divergiert, System ist stabil bis es von der Realitaet getestet wird — wiederholt sich in verschiedenen Domaenen. Muller [19] dokumentiert es ausfuehrlich als „Metrik-Fixierung"; Campbell [24] formalisierte den korrumpierenden Effekt der Verwendung von Indikatoren als Ziele.

Domaene Proxy-Metrik Zugrunde liegende Qualitaet Divergenz
IT-Support Durchschn. Loesungszeit Verfuegbarkeit kritischer Systeme Server 19 Std. ausgefallen, Durchschnitt sagt 6,5
Bildung Testergebnisse Tatsaechliches Lernen Lehren fuer den Test
Gesundheitswesen Patientendurchsatz Patientenergebnisse Schnellere Entlassungen, hoehere Wiederaufnahme
Finanzen Quartalsergebnisse Langfristiger Wert Kostensenkung blaest EPS auf, erodiert Faehigkeiten
Software Velocity (Story Points) Produktqualitaet Punkteinflation, halbfertige Features

7.5 Informationsasymmetrie

Modelliere das System als Spiel zwischen Anbieter (A) und Kunde (K). A beobachtet die einzelnen \{C_i\} und waehlt \sigma; K beobachtet nur \bar{C}(\sigma). Dies ist ein Moral-Hazard-Problem [10]: Die optimale Strategie von A ist, das beobachtbare Signal zu minimieren, unabhaengig von der nicht beobachtbaren Verteilung.

Das Gleichgewicht ist ein Pooling-Gleichgewicht [9]: Die berichtete Metrik von A sieht unabhaengig von der zugrunde liegenden prioritaetsgewichteten Leistung identisch aus. Es ist stabil, bis K Zugang zu den einzelnen $C_i$-Werten erhaelt — ueber ein Kundenportal, die Transparenz eines Wettbewerbers oder einen hinreichend schmerzhaften Vorfall.

7.6 Die unbequeme Schlussfolgerung

Die ehrliche Antwort auf „Schadet die Optimierung des ungewichteten Mittelwerts dem Geschaeft?" lautet: Nicht unbedingt, solange der Kunde nie hinter die Zahl schaut. Die ehrliche Antwort auf „Ist das nachhaltig?" lautet: Es ist genau so nachhaltig wie jedes System, in dem der Verkaeufer mehr weiss als der Kaeufer — stabil ueber laengere Zeitraeume, dann rapider Zusammenbruch, wenn die Asymmetrie durchbrochen wird.


8. Die psychologischen Kosten des Wissens

Abschnitt 7 modellierte den Anbieter als einheitlichen Akteur. Aber Teams bestehen aus Individuen. Wenn ein Teammitglied den Beweis versteht — wenn es weiss, dass die Metrik synthetisch ist, dass das Dashboard Theater ist, dass der E-Mail-Server immer noch ausgefallen ist, waehrend es Hintergrund-Tickets schliesst — entsteht ein neuer Kostenfaktor, den das Gleichgewichtsmodell ausgelassen hat.

8.1 Die verborgene Variable: Teamwissen

Akteur Beobachtet einzelne C_i Beobachtet \bar{C} Versteht den Beweis
Management Moeglicherweise Ja Variiert
Teammitglied Ja Ja Ja (in diesem Szenario)
Kunde Nein Ja Nein

Das Teammitglied hat vollstaendige Information. Es sieht die Ticket-Warteschlange. Es weiss, dass der E-Mail-Server seit 7 Uhr ausgefallen ist. Es weiss, dass es ein Hintergrund-Ticket schliesst, weil es die Zahl verbessert. Und es weiss warum.

8.2 Kognitive Dissonanz unter vollstaendiger Information

Kognitive Dissonanz [11] entsteht, wenn ein Individuum widerspruechliche Kognitionen hat. Ohne zu verstehen warum, kann der Widerspruch rationalisiert werden: „Das Management weiss es besser." Das Verstaendnis des Beweises beseitigt die Ambiguitaet. Das Teammitglied haelt nun:

  • Kognition A: „Ich bin ein kompetenter Fachmann. Meine Aufgabe ist es, wichtige Probleme zu loesen."
  • Kognition B: „Ich schliesse ein Hintergrund-Ticket, waehrend der E-Mail-Server ausgefallen ist, weil die Metrik mathematisch verzerrt ist (Satz 1), die Umordnung keinen Durchsatz erzeugt (Satz 6), und der einzige Nutzniesser das Dashboard ist (Abschnitt 7). Ich kann dies beweisen."

Die Dissonanz ist nun tragend. Die verfuegbaren Loesungen — berufliche Identitaet aufgeben, den Beweis ablehnen, fuer Veraenderung eintreten oder kuendigen — verursachen jeweils Kosten, die vorher nicht existierten.

8.3 Selbstbestimmungstheorie: Drei verletzte Beduerfnisse

Decis und Ryans Selbstbestimmungstheorie [12, 13] identifiziert drei Beduerfnisse, die intrinsische Motivation vorhersagen:

Autonomie. Die Metrik schraenkt Entscheidungen in einer Weise ein, die das Teammitglied als mathematisch suboptimal erkennt. Ein Mitarbeiter, der versteht, dass der Prozess nachweislich kontraproduktiv ist, kann sich bei dessen Befolgung nicht autonom fuehlen.

Kompetenz. Die Metrik belohnt scheinbare Effektivitaet (niedriges \bar{C}), waehrend sie gegenueber tatsaechlicher Effektivitaet invariant ist (Satz 6). Echte Kompetenz — den E-Mail-Server zuerst zu reparieren — wird von der Metrik bestraft.

Soziale Eingebundenheit. Das Teammitglied weiss, dass der E-Mail-Server des Kunden ausgefallen ist. Es koennte helfen. Stattdessen aktualisiert es Hintergruende — nicht weil es jemandem hilft, sondern weil es einer Zahl hilft. Die Verbindung zwischen Arbeit und menschlicher Wirkung ist gekappt, und das Teammitglied kann die getrennten Enden sehen.

8.4 Moralische Verletzung

Moralische Verletzung [16, 17] ist der dauerhafte Schaden, der durch „Begehen, Nicht-Verhindern, Bezeugen oder Erfahren von Handlungen, die tief verwurzelte moralische Ueberzeugungen verletzen" [17] verursacht wird. Das Konzept wurde seitdem auf geschaeftliche Kontexte erweitert [25]. Die entscheidende Unterscheidung zu Burnout: Burnout ist Erschoepfung durch zu viel Arbeit. Moralische Verletzung ist Schaden durch das Tun des Falschen.

Ein Teammitglied, das weiss, dass der E-Mail-Server ausgefallen ist, das weiss, dass es ihn reparieren sollte, stattdessen ein Hintergrund-Ticket schliesst und dies tut, weil die Metrik es verlangt, erlebt die strukturellen Bedingungen fuer moralische Verletzung.

8.5 Erlernte Hilflosigkeit und Metrik-Fatalismus

Seligmans erlernte Hilflosigkeit [14, 15] beschreibt, wie die Konfrontation mit unkontrollierbaren negativen Ergebnissen zu Passivitaet fuehrt. Die Abfolge:

  1. Die Metrik ist fehlerhaft (Beweis verstanden).
  2. Fuer Veraenderung eintreten.
  3. Abgelehnt („die Zahlen sind gut, mach keine Wellen").
  4. Wiederholung mit abnehmender Ueberzeugung.
  5. Endzustand: „Die Metrik ist wie sie ist. Ich schliesse einfach Tickets."

Dies ist keine Faulheit. Es ist die rationale Reaktion auf ein System, das korrektes Verhalten bestraft und inkorrektes Verhalten belohnt, wenn das Individuum keine Macht hat, das System zu aendern.

8.6 Die adversariale Selektionsspirale

Kombination des Gleichgewichts aus Abschnitt 7 mit der Fluktuationsdynamik:

  1. Organisation fuehrt ungewichteten Mittelwert ein. Metrik sieht gut aus (SPT).
  2. Bewusste, kompetente Teammitglieder erleiden psychologische Kosten (8.28.5).
  3. Diese Mitglieder gehen. Sie werden durch Mitglieder ersetzt, die die Maengel der Metrik nicht verstehen oder denen sie gleichgueltig sind.
  4. Die Metrik sieht weiterhin gut aus — sie tut dies unter SPT immer, unabhaengig von der Teamkompetenz (Korollar 6.1).
  5. Die tatsaechliche Servicequalitaet verschlechtert sich, aber die Metrik kann dies nicht erkennen (Korollar 9.1).
  6. Zurueck zu Schritt 1.

Die Metrik selektiert gegen die Personen, die das System verbessern wuerden, und fuer die Personen, die es nicht in Frage stellen werden. Das System stabilisiert sich auf einem niedrigeren Kompetenzniveau, unsichtbar fuer seinen eigenen Messapparat.

8.7 Das vollstaendige Kostenmodell

Abschnitt 7 (sichtbar) Abschnitt 8 (verborgen)
Kunde zufrieden (gute Zahl) Team unzufrieden (schlechte Realitaet)
Durchsatz unveraendert Freiwilliges Engagement zurueckgezogen
Metrik verbessert sich Kompetente Mitglieder gehen
Geschaeftsoekonomie stabil Institutionelle Kompetenz degeneriert

Diese wirken auf unterschiedlichen Zeitskalen: Das Gleichgewicht ist quartalsweise sichtbar; die Kompetenzdegradation wird ueber Jahre sichtbar. Das vollstaendige Modell lautet: Die Metrik funktioniert, und sie ist destruktiv, und die Destruktion ist fuer die Metrik unsichtbar. Die Metrik ist frischer Anstrich auf korrodiertem Bewehrungsstahl.


9. Manager-Internalisierung: Die umsetzbare Loesung

Die Abschnitte 26 sagen: Lehne die Metrik ab. Abschnitt 7 sagt: Die Metrik funktioniert (fuer das Geschaeft). Abschnitt 8 sagt: Sie zerstoert das Team. In der Praxis koennen die meisten Manager die Metrik nicht einseitig aendern. Die beste Loesung ist eine unternehmensweite Metrikreform. Die umsetzbare Loesung ist, was ein einzelner informierter Manager jetzt tun kann.

9.1 Die Strategie

Ein Manager, der den Beweis versteht, kann die Limitierungen der Metrik internalisieren, ohne sie an das Team weiterzugeben:

  1. Primaer nach Prioritaet planen. Das Team bearbeitet kritische Aufgaben zuerst.
  2. Taktisch kleine Aufgaben einstreuen. Wenn eine kleine Aufgabe niedriger Prioritaet abgeschlossen werden kann, ohne die hochprioritaere Arbeit wesentlich zu verzoegern, erledige sie. Nicht weil die Metrik es verlangt, sondern weil sie ebenfalls erledigt werden muss und fast nichts kostet.
  3. Niemals die Metrik als Motivation offenlegen. „Erledige diese schnelle Aufgabe, waehrend wir auf den Rueckruf des Lieferanten zum P1 warten" — nicht „Wir muessen unseren Durchschnitt senken." Die intrinsische Motivation des Teams bleibt intakt (Abschnitt 8). Der Manager absorbiert die Last des Metrik-Managements.

9.2 Formalisierung

Das Optimierungsproblem des Managers ist eine eingeschraenkte Optimierung:

\min_{\sigma} \sum_{i=1}^{n} w(q_i) \cdot C_i \quad \text{unter der Nebenbedingung} \quad \bar{C}(\sigma) \le \bar{C}_{\text{target}}

Satz 12 (Begrenzte Metrikkosten der Prioritaetsplanung). Ein Manager, der SPT innerhalb jeder Prioritaetsklasse und Prioritaetsordnung zwischen den Klassen anwendet, wird eine Metrik nahe dem SPT-optimalen Wert erzielen — die Luecke entsteht nur durch zwischenklassige Inversionen.

Beweisskizze. Innerhalb jeder Prioritaetsklasse ist SPT kostenlos (alle Aufgaben haben gleiche Prioritaet). Die einzige Abweichung vom globalen SPT ist die Ordnung zwischen den Klassen. Jede klassenuebergreifende Inversion kostet hoechstens p_{\text{large}} - p_{\text{small}} in der ungewichteten Summe, und diese Inversionen sind durch die Anzahl der Klassen begrenzt. In der Praxis liegt die Luecke typischerweise innerhalb von 1020% des SPT-Optimums. \blacksquare

9.3 Der Manager als Informationsbarriere

Ebene Sieht Metrik Sieht Prioritaeten Sieht Beweis
Organisation Ja Nominell Nein
Manager Ja Ja Ja
Team Nein (abgeschirmt) Ja Irrelevant
Kunde Ja (Dashboard) Ueber SLA Nein

Der Manager ist der einzige Akteur, der alle drei Informationsstuecke besitzt. Dies ist keine Manipulation — er erledigt die richtige Arbeit in der richtigen Reihenfolge, und die Metrik ist akzeptabel, weil SPT innerhalb der Klassen kostenlos ist.

9.4 Der Zusammenbruch im Wettbewerb

Diese Strategie versagt, wenn die Metrik wettbewerblich zwischen Teams eingesetzt wird.

Fall 1: Kooperativ — Teams werden auf Paritaet gemessen, nicht auf Rangfolge. Jeder Manager wendet unabhaengig die Internalisierungsstrategie an. Die Metrik ist dekorativ, aber harmlos. Dies ist ein Koordinationsspiel mit einem stabilen kooperativen Gleichgewicht.

Fall 2: Wettbewerblich — Teams werden nach \bar{C} rangiert. Dies ist ein Gefangenendilemma:

Team B: Prioritaet zuerst Team B: SPT
Team A: Prioritaet zuerst (Gute Arbeit, Gute Arbeit) (A sieht schlecht aus, B sieht gut aus)
Team A: SPT (A sieht gut aus, B sieht schlecht aus) (Beide sehen gut aus, beide machen falsche Arbeit)

Das Nash-Gleichgewicht ist (SPT, SPT). Die Internalisierungsstrategie ist ein kooperatives Gleichgewicht, das unter Wettbewerb nicht stabil ist.

9.5 Geltungsbereich

Bedingung Tragfaehigkeit
Metrik zur Gesundheitspruefung / Paritaet verwendet Tragfaehig
Metrik sichtbar, aber nicht rangiert Tragfaehig
Metrik teamuebergreifend rangiert Fragil — erfordert Kooperation aller Manager
Metrik an Verguetung / Ressourcen gekoppelt Nicht tragfaehig — Gefangenendilemma dominiert
Metrikreform auf Organisationsebene moeglich Unnoetig — behebe stattdessen die Metrik

Die beste Loesung ist unternehmensweit. Die umsetzbare Loesung ist ein Manager, der diesen Beweis versteht, sein Team vor der Metrik abschirmt, nach Prioritaet plant und SPT nur innerhalb von Prioritaetsklassen einsetzt, um die Zahl in einem akzeptablen Rahmen zu halten.


Teil IV: Bewertung

10. Advocatus Diaboli

Intellektuelle Ehrlichkeit erfordert die Anerkennung der Grenzen der Argumentation.

10.1 Einfachheit hat einen realen Wert

Argument. Der ungewichtete Mittelwert erfordert keine Prioritaetsgewichte, keine Aufgabengroessenschaetzungen, keine Kalibrierung.

Bewertung: Korrekt. Aber die ungewichtete Metrik vermeidet keine Annahmen — sie verbirgt sie, indem sie implizit alle Gewichte auf 1 und alle Groessen auf 1 setzt. Eine bekannt ungenaue Schaetzung der Aufgabengroesse ist immer noch informativer als die implizite Annahme, dass alle Groessen gleich sind.

10.2 Minimierung der Anzahl wartender Personen

Argument. SPT minimiert die gesamten Personen-Stunden des Wartens. Wenn jede Aufgabe einen Kunden repraesentiert, ist dies optimal.

Bewertung: Mathematisch korrekt. Wenn Sie eine Zulassungsstelle betreiben und die Zeit jeder Person gleich wertvoll ist, ist SPT die richtige Strategie. Sie versagt, wenn Aufgaben nicht im Verhaeltnis 1:1 zu Kunden stehen, die Wartekosten nicht einheitlich sind oder die Metrik zur Bewertung von Teams statt zur Bedienung einer buchstaeblichen Warteschlange verwendet wird.

10.3 SPT als Triage-Heuristik

Argument. Wenn sich Aufgabengroessen eng buendeln, approximiert SPT FIFO und der ungewichtete Mittelwert approximiert den gewichteten Mittelwert.

Bewertung: Korrekt. Der Variationskoeffizient CV = \sigma_p / \bar{p} bestimmt das Ausmass der Verzerrung:

CV Aufgabengroessenverteilung Verzerrung
< 0,3 Eng (Callcenter) Vernachlaessigbar
0,3 1,0 Moderat (gemischte IT) Moderat
> 1,0 Breit (typische IT-Warteschlange) Schwerwiegend

Ein typischer IT-Desk umfasst 15 Minuten bis 40+ Stunden (CV > 2). Die Verzerrung ist kein Grenzfall — sie ist der Normalfall.

10.4 Manipulation erfordert boeswillige Absicht

Argument. Die Saetze zeigen, dass die Metrik manipuliert werden kann, nicht dass sie manipuliert wird.

Bewertung: Dies ist das staerkste Gegenargument. Wenn die Metrik rein informativ ist und niemals Verhalten beeinflusst, fehlt der Manipulationsanreiz. Allerdings wird jede Metrik, die dem Management berichtet, an OKRs gekoppelt oder in Retrospektiven diskutiert wird, Verhalten beeinflussen. Dies ist Goodharts Gesetz [6, 7] — und es gilt fuer gut gemeinte Teams ebenso zuverlaessig wie fuer zynische. Die Verschiebung geschieht organisch: Drei einfache Tickets abzuschliessen „fuehlt sich produktiv an", waehrend die Metrik das Gefuehl bestaetigt.

10.5 Wann der ungewichtete Mittelwert vertretbar ist

Die Metrik ist nur dann vertretbar, wenn alle vier Bedingungen gleichzeitig gelten:

  1. Aufgabengroessen sind annaehernd einheitlich (CV < 0,3)
  2. Keine Prioritaetsdifferenzierung (alle Aufgaben gleich wichtig)
  3. Jede Aufgabe repraesentiert genau einen Kunden
  4. Die Metrik wird nicht zur Bewertung, Belohnung oder Verhaltenssteuerung eingesetzt

Diese Bedingungen sind in den Systemen, in denen die Metrik am haeufigsten eingesetzt wird, selten erfuellt.


11. Verwandte Arbeiten

Diese Arbeit steht an der Schnittstelle mehrerer Literaturbereiche, die zuvor nicht miteinander verbunden wurden.

11.1 Ablaufplanungstheorie und Fairness

Smith [1] etablierte das SPT-Optimalitaetsergebnis und die WSJF-Regel im Jahr 1956. Conway, Maxwell und Miller [2] lieferten die umfassende Lehrbuchdarstellung. Die Fairness groessenbasierter Planungsstrategien wurde in der Ablaufplanung fuer Computersysteme diskutiert: Bansal und Harchol-Balter [22] untersuchten die SRPT-Unfairness; Wierman und Harchol-Balter [23] formalisierten Fairness-Klassifikationen gegenueber Processor-Sharing; Angel, Bampis und Pascual [21] massen die SPT-Ablaufplanqualitaet anhand fairer Optimalitaetskriterien.

Diese frueheren Arbeiten analysieren Fairness in der CPU- und Server-Ablaufplanung. Die vorliegende Arbeit wendet dieselben mathematischen Ergebnisse auf organisatorisches Aufgabenmanagement an, bei dem der „Scheduler" ein menschliches Team ist, die „Jobs" Kundenanfragen mit geschaeftsrelevanten Prioritaeten sind und die „Zielfunktion" eine Management-Metrik ist. Der Mechanismus ist identisch; die Konsequenzen unterscheiden sich, weil organisatorische Ablaufplanung Prioritaetssysteme, Kundenbeziehungen und psychologische Kosten hat, die CPU-Ablaufplanung nicht hat.

11.2 Messdysfunktion

Austin [18] bewies, dass unvollstaendige Messung — die Messung nur einer Teilmenge der relevanten Dimensionen — Anreize schafft, die gemessenen Dimensionen auf Kosten der ungemessenen zu optimieren, und dass dieser Effekt nicht nur moeglich, sondern unvermeidlich ist, wenn die Messung an Belohnungen gekoppelt wird. Sein Rahmen der Informationsasymmetrie entspricht eng Abschnitt 7. Die vorliegende Arbeit liefert den spezifischen mathematischen Mechanismus (Saetze 12) fuer den Fall der Aufgabenplanung und erweitert die Argumentation durch Psychologie (Abschnitt 8), um die vollstaendige Kette organisatorischen Schadens nachzuzeichnen.

Muller [19] dokumentierte „Metrik-Fixierung" in Bildung, Gesundheitswesen, Polizei und Finanzen und lieferte umfangreiche empirische Belege fuer die in Abschnitt 7.4 theoretisierten Muster. Campbell [24] formalisierte den korrumpierenden Effekt der Verwendung von Indikatoren als Ziele und ergaenzte damit Goodharts urspruengliche Beobachtung [6] und Stratherns Verallgemeinerung [7].

Bevan und Hood [26] dokumentierten empirisch Manipulationsverhalten im englischen oeffentlichen Gesundheitssystem — einschliesslich genau der Muster des „Ziel getroffen und den Sinn verfehlt", die in unserem Abschnitt 5.2 beschrieben werden.

11.3 Psychologische Kosten von Metrikdysfunktion

Die Anwendung moralischer Verletzung (Shay [16], Litz et al. [17]) auf geschaeftliche Kontexte hat juengere Vorlaeufer: Eine Studie im Journal of Business Ethics von 2024 [25] erweiterte das Konstrukt explizit auf gewinnorientierte Arbeitsplaetze und fand strukturelle Bedingungen, die den in Abschnitt 8.4 beschriebenen aehneln. Moore [27] analysierte moralisches Disengagement — die kognitive Umstrukturierung, die unethisches Verhalten unter organisatorischem Druck ermoeglicht. Die vorliegende Arbeit behandelt das komplementaere Phaenomen: den Schaden fuer Individuen, die sich weigern, sich zu distanzieren.

11.4 Was ist neu

Die einzelnen Komponenten — SPT-Optimalitaet, Goodharts Gesetz, Messdysfunktion, moralische Verletzung — haben alle Vorlaeufer. Die Beitraege dieser Arbeit sind:

  1. Der Erhaltungssatz (Satz 2) praeskriptiv verwendet — als konstruktives Argument, dass arbeitsgewichtete Abschlusszeit nicht manipuliert werden kann, anstatt als theoretisches Ablaufplanungsergebnis.

  2. Der spezifische Beweis, dass Prioritaetsklassen die Metrik algebraisch adversarial machen (Saetze 89) — nicht lediglich empirisch schlecht, sondern strukturell widerspruechlich, mit null Transinformation zwischen Ablaufplan und Prioritaetssystem.

  3. Die integrierte Kette vom mathematischen Beweis ueber Informationsasymmetrie ueber psychologischen Schaden zur adversarialen Selektionsspirale — die Verfolgung einer einzelnen Metrik von Smith (1956) bis zur organisatorischen Aushoelung.

  4. Die Manager-Internalisierungsstrategie (Abschnitt 9) mit formaler spieltheoretischer Analyse ihrer Stabilitaet und Zusammenbruchbedingungen unter teamuebergreifendem Wettbewerb.

  5. Die Anwendung der Ablaufplanungstheorie auf organisatorische Managementkritik — der Beweis, dass eine gaengig verwendete Team-Metrik spezifische, quantifizierbare Pathologien aufweist, anstatt anekdotisch oder aus allgemeinen Prinzipien zu argumentieren.


12. Schlussfolgerung

Die ungewichtete durchschnittliche Abschlusszeit ist eine verzerrte Statistik, die:

  1. Durch Planungsstrategie manipuliert werden kann (Satz 1), im Gegensatz zur arbeitsgewichteten Abschlusszeit, die planungsinvariant ist (Satz 2).
  2. Die Aushungerung grosser Aufgaben incentiviert (Satz 3).
  3. Die Kundenzufriedenheit verschlechtert, ohne kompensierenden Produktivitaetsgewinn (Satz 7).
  4. Prioritaetssystemen aktiv widerspricht, indem sie keinerlei Information ueber die Geschaeftsauswirkungsklassifikation traegt (Satz 9).
  5. Prioritaet vollstaendig ignoriert in ihrer Planungsempfehlung und suboptimale prioritaetsgewichtete Verzoegerung erzeugt, wann immer Prioritaet und Groesse nicht perfekt invers korreliert sind (Satz 10).

Eine Metrik, die durch Umordnung der Arbeit verbessert werden kann — ohne zusaetzliche Arbeit zu leisten — misst die Planungsstrategie, nicht die Kapazitaet des Systems. In Kombination mit einem Prioritaetssystem empfiehlt sie den Ablaufplan, der den groessten Schaden an der hoechstprioritaeren Arbeit anrichtet.

Wenn die Metrik an Kunden berichtet wird, erzeugt sie eine Informationsasymmetrie (Abschnitt 7), deren Geschaeftsgleichgewicht profitabel, aber fragil ist. Wenn Teammitglieder ihre Maengel verstehen, verletzt sie deren intrinsische Motivation und selektiert fuer den Weggang der kompetentesten Personen (Abschnitt 8). Ein einzelner informierter Manager kann diese Effekte durch eingeschraenkte Optimierung teilweise abmildern (Abschnitt 9), aber diese kooperative Strategie ist unter teamuebergreifendem Wettbewerb nicht stabil.

Der ungewichtete Mittelwert ist nur unter engen Bedingungen vertretbar (Abschnitt 10.5): einheitliche Aufgabengroessen, keine Prioritaeten, Eins-zu-eins-Zuordnung von Kunden zu Aufgaben und kein Verhaltenseinfluss. Diese Bedingungen sind selten erfuellt.

Die ungewichtete durchschnittliche Abschlusszeit ist kein faires oder genaues Mass fuer die Aufgabenausfuehrungsleistung. Ihre Einfuehrung als Team-Metrik wird rational zur Aushungerung komplexer Arbeit, zur Verletzung erklaerter Prioritaeten, zu ungerechten Kundenergebnissen und zur Illusion von Produktivitaet fuehren, wo keine existiert.

Die beste Loesung ist eine organisatorische Metrikreform. Die umsetzbare Loesung ist ein Manager, der diesen Beweis versteht.


Literaturverzeichnis

Ablaufplanungstheorie

[1] Smith, W. E. (1956). Various optimizers for single-stage production. Naval Research Logistics Quarterly, 3(12), 5966. doi:10.1002/nav.3800030106

Ursprung des SPT-Optimalitaetsergebnisses (Satz 1), der Regel fuer die gewichtete Abschlusszeit w_i/p_i absteigend (WSJF, Satz 11) und der Beweistechnik des paarweisen Austauschs benachbarter Aufgaben (Austauschmethode), die durchgehend verwendet wird.

[2] Conway, R. W., Maxwell, W. L., & Miller, L. W. (1967). Theory of Scheduling. Addison-Wesley.

Standardlehrbuch zur Einmaschinenablaufplanungstheorie, das Smiths Ergebnisse erweitert.

[3] Little, J. D. C. (1961). A proof for the queuing formula: L = λW. Operations Research, 9(3), 383387. doi:10.1287/opre.9.3.383

Erster rigoroser Beweis von Littles Gesetz. Referenziert in Abschnitt 3.2 fuer den warteschlangentheoretischen Kontext.

[4] Little, J. D. C. (2011). Little's Law as viewed on its 50th anniversary. Operations Research, 59(3), 536549. doi:10.1287/opre.1110.0941

Rueckblick mit Diskussion von Umfang, Einschraenkungen und haeufigen Fehlanwendungen.

[5] Reinertsen, D. G. (2009). The Principles of Product Development Flow: Second Generation Lean Product Development. Celeritas Publishing. ISBN: 978-0-9844512-0-8.

Popularisierte WSJF und „Cost of Delay / Duration" in agilen/schlanken Kontexten. Die mathematische Grundlage ist Smith (1956) [1].

Messung und Anreize

[6] Goodhart, C. A. E. (1984). Problems of monetary management: The U.K. experience. In Monetary Theory and Practice (pp. 91121). Macmillan.

Quelle von Goodharts Gesetz: „Jede beobachtete statistische Regelmaessigkeit wird dazu neigen zusammenzubrechen, sobald Druck auf sie zu Kontrollzwecken ausgeuebt wird."

[7] Strathern, M. (1997). 'Improving ratings': Audit in the British university system. European Review, 5(3), 305321. doi:10.1002/(SICI)1234-981X(199707)5:3<305::AID-EURO184>3.0.CO;2-4

Verallgemeinerung von Goodharts Gesetz: „Wenn ein Mass zum Ziel wird, hoert es auf, ein gutes Mass zu sein."

Verhaltensoekonomie

[8] Kahneman, D., & Tversky, A. (1979). Prospect theory: An analysis of decision under risk. Econometrica, 47(2), 263292. doi:10.2307/1914185

Etablierte die Verlustaversion. Referenziert in Abschnitt 4.5.

Spieltheorie und Vertragstheorie

[9] Akerlof, G. A. (1970). The market for "lemons": Quality uncertainty and the market mechanism. The Quarterly Journal of Economics, 84(3), 488500. doi:10.2307/1879431

Informationsasymmetrie und adverse Selektion. Das Pooling-Gleichgewicht in Abschnitt 7.5 ist strukturell analog.

[10] Hölmstrom, B. (1979). Moral hazard and observability. The Bell Journal of Economics, 10(1), 7491. doi:10.2307/3003320

Formale Behandlung von Moral Hazard. Das Metrik-Berichtsszenario in Abschnitt 7.5 ist ein Moral-Hazard-Problem.

Psychologie

[11] Festinger, L. (1957). A Theory of Cognitive Dissonance. Stanford University Press. ISBN: 978-0-8047-0131-0.

Grundlegende Theorie. Referenziert in Abschnitt 8.2.

[12] Deci, E. L., & Ryan, R. M. (1985). Intrinsic Motivation and Self-Determination in Human Behavior. Plenum Press. ISBN: 978-0-306-42022-1.

Originaldarstellung der Selbstbestimmungstheorie. Referenziert in Abschnitt 8.3.

[13] Ryan, R. M., & Deci, E. L. (2000). Self-determination theory and the facilitation of intrinsic motivation, social development, and well-being. American Psychologist, 55(1), 6878. doi:10.1037/0003-066X.55.1.68

SDT-Ueberblick, der Beduerfnisbefriedigung mit intrinsischer Motivation und Wohlbefinden verknuepft.

[14] Seligman, M. E. P., & Maier, S. F. (1967). Failure to escape traumatic shock. Journal of Experimental Psychology, 74(1), 19. doi:10.1037/h0024514

Urspruengliche Demonstration der erlernten Hilflosigkeit. Referenziert in Abschnitt 8.5.

[15] Seligman, M. E. P. (1975). Helplessness: On Depression, Development, and Death. W. H. Freeman. ISBN: 978-0-7167-0752-3.

Erweiterte Darstellung, die erlernte Hilflosigkeit mit menschlicher Depression und institutionellem Verhalten verbindet.

[16] Shay, J. (1994). Achilles in Vietnam: Combat Trauma and the Undoing of Character. Atheneum / Simon & Schuster. ISBN: 978-0-689-12182-3.

Einfuehrung des Konzepts der moralischen Verletzung. Referenziert in Abschnitt 8.4.

[17] Litz, B. T., Stein, N., Delaney, E., Lebowitz, L., Nash, W. P., Silva, C., & Maguen, S. (2009). Moral injury and moral repair in war veterans: A preliminary model and intervention strategy. Clinical Psychology Review, 29(8), 695706. doi:10.1016/j.cpr.2009.07.003

Formalisierte moralische Verletzung als klinisches Konstrukt. Definition zitiert in Abschnitt 8.4.

Organisatorische Messung

[18] Austin, R. D. (1996). Measuring and Managing Performance in Organizations. Dorset House. ISBN: 978-0-932633-36-1.

Bewies, dass unvollstaendige Messung unvermeidlich Anreize schafft, die gemessenen Dimensionen auf Kosten der ungemessenen zu optimieren. Der Rahmen der Informationsasymmetrie entspricht eng Abschnitt 7. Der wichtigste einzelne Vorlaeufer der Argumentation dieser Arbeit.

[19] Muller, J. Z. (2018). The Tyranny of Metrics. Princeton University Press. ISBN: 978-0-691-17495-2.

Umfassende Behandlung der „Metrik-Fixierung" in Bildung, Gesundheitswesen, Polizei und Finanzen. Umfangreiche empirische Belege fuer die in Abschnitt 7.4 theoretisierten Muster.

Fairness in der Ablaufplanung

[20] Coffman, E. G., Shanthikumar, J. G., & Yao, D. D. (1992). Multiclass queueing systems: Polymatroid structure and optimal scheduling control. Operations Research, 40(S2), S293S299.

Erhaltungssaetze in der Ablaufplanung. Die Planungsinvarianz der arbeitsgewichteten Abschlusszeit (Satz 2) ist ein Beispiel dieser Erhaltungssaetze.

[21] Angel, E., Bampis, E., & Pascual, F. (2008). How good are SPT schedules for fair optimality criteria? Annals of Operations Research, 159(1), 5364. doi:10.1007/s10479-007-0267-0

Misst direkt die Qualitaet von SPT-Ablaufplaenen anhand von Fairness-Kriterien. Naechster Vorlaeufer in der Ablaufplanungstheorie zur Fairness-Analyse in Abschnitt 4.

[22] Bansal, N., & Harchol-Balter, M. (2001). Analysis of SRPT scheduling: Investigating unfairness. ACM SIGMETRICS Performance Evaluation Review, 29(1), 279290. doi:10.1145/384268.378792

Untersucht die Ueberzeugung, dass SRPT grosse Auftraege in der Computerablaufplanung unfair benachteiligt. Argumentiert, dass die Unfairness geringer ist als angenommen, erkennt aber die Grundspannung an.

[23] Wierman, A., & Harchol-Balter, M. (2003). Classifying scheduling policies with respect to unfairness in an M/GI/1. ACM SIGMETRICS Performance Evaluation Review, 31(1), 238249.

Formalisiert Fairness-Definitionen fuer Planungsstrategien durch Vergleich mit Processor-Sharing.

Weitere Referenzen

[24] Campbell, D. T. (1979). Assessing the impact of planned social change. Evaluation and Program Planning, 2(1), 6790. doi:10.1016/0149-7189(79)90048-X

Campbells Gesetz: „Je mehr ein quantitativer sozialer Indikator fuer soziale Entscheidungsfindung verwendet wird, desto mehr wird er Korruptionsdruck ausgesetzt sein und desto eher wird er die sozialen Prozesse, die er ueberwachen soll, verzerren und korrumpieren." Ergaenzt Goodharts Gesetz [6].

[25] Ferreira, C. M., et al. (2024). It's business: A qualitative study of moral injury in business settings. Journal of Business Ethics. doi:10.1007/s10551-024-05615-0

Erweitert moralische Verletzung auf gewinnorientierte Arbeitsplaetze. Validiert die Anwendung von Shay/Litz in Abschnitt 8.4 ueber militaerische und Gesundheitskontexte hinaus.

[26] Bevan, G., & Hood, C. (2006). What's measured is what matters: Targets and gaming in the English public health care system. Public Administration, 84(3), 517538. doi:10.1111/j.1467-9299.2006.00600.x

Dokumentiert empirisch Manipulationsverhalten einschliesslich „Ziel getroffen und den Sinn verfehlt". Liefert reale Belege fuer den Prioritaets-Metrik-Widerspruch in Abschnitt 5.2.

[27] Moore, C. (2012). Why employees do bad things: Moral disengagement and unethical organizational behavior. Personnel Psychology, 65(1), 148. doi:10.1111/j.1744-6570.2011.01237.x

Analysiert moralisches Disengagement — die kognitive Umstrukturierung, die unethisches Verhalten ermoeglicht. Abschnitt 8 behandelt das komplementaere Phaenomen: den Schaden fuer Individuen, die sich weigern, sich zu distanzieren.


Dieser Beweis wurde im Gespraech entwickelt und am 28.03.2026 formalisiert.