Complete translations of the full paper into: - Spanish (README.es.md) - Thai (README.th.md) - French (README.fr.md) - Esperanto (README.eo.md) - Polish (README.pl.md) - German (README.de.md) - Portuguese/Brazilian (README.pt.md) - Arabic/MSA (README.ar.md) - Tagalog/Filipino (README.tl.md) - Simplified Chinese (README.zh.md) All translations preserve mathematical notation, LaTeX formulas, citation numbers, and markdown formatting. Reference citations kept in English with translated annotations. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
60 KiB
Die ungewichtete durchschnittliche Abschlusszeit ist keine faire Metrik fuer die Aufgabenplanung
Ein mathematischer Beweis, dass die ungewichtete durchschnittliche Aufgabenabschlusszeit eine verzerrte Statistik ist, die das gezielte Herauspicken einfacher Aufgaben belohnt, und dass jeder Planungsvorteil, den sie scheinbar aufdeckt, ein Artefakt der Metrik ist — keine Widerspiegelung tatsaechlichen Durchsatzes oder tatsaechlicher Servicequalitaet.
1. Einfuehrung
Viele Organisationen messen die Aufgabenausfuehrungsleistung anhand der ungewichteten mittleren Abschlusszeit: der durchschnittlichen Anzahl von Stunden (oder Tagen) zwischen Aufgabeneinreichung und Aufgabenabschluss, wobei jede Aufgabe unabhaengig von Groesse oder Prioritaet gleich gezaehlt wird.
Diese Arbeit beweist, dass diese Metrik nicht lediglich ungenau, sondern strukturell verzerrt ist. Sie kann durch Umordnung der Arbeit verbessert werden, ohne zusaetzliche Arbeit zu leisten (Satz 1), waehrend eine ordnungsgemaess gewichtete Alternative vollstaendig immun gegen Manipulationen durch die Reihenfolgeplanung ist (Satz 2). In Kombination mit einem Prioritaetssystem widerspricht die Metrik aktiv den eigenen Prioritaetsklassifikationen der Organisation (Satz 9).
Die Argumentation gliedert sich in vier Teile:
-
Teil I (Abschnitte 2–4) legt das mathematische Fundament: Der ungewichtete Mittelwert ist durch Shortest Processing Time (SPT)- Planung manipulierbar, der arbeitsgewichtete Mittelwert ist planungsinvariant, und die daraus resultierenden Konsequenzen fuer die Servicequalitaet sind nachweislich negativ.
-
Teil II (Abschnitte 5–6) erweitert das Modell auf prioritaetsklassifizierte Aufgaben, beweist, dass die Metrik gegenueber dem Prioritaetssystem adversarial wird, und schlaegt gewichtete Alternativen vor, mit einem durchgerechneten Beispiel eines IT-Service-Desks.
-
Teil III (Abschnitte 7–9) untersucht die organisatorische Dynamik: Was geschieht, wenn die Metrik an Kunden berichtet wird (Informationsasymmetrie), was mit Teammitgliedern geschieht, die ihre Maengel verstehen (psychischer Schaden), und was ein einzelner informierter Manager dagegen tun kann (eingeschraenkte Optimierung mit spieltheoretischer Stabilitaetsanalyse).
-
Teil IV (Abschnitte 10–12) praesentiert ehrliche Gegenargumente, ordnet die Arbeit in die bestehende Literatur ein und schliesst ab.
Die Kernergebnisse bauen auf Smiths (1956) grundlegender Ablaufplanungstheorie [1] auf, erweitert durch Spieltheorie [9, 10], organisatorische Messtheorie [18, 19] und Psychologie [11–17], um eine vollstaendige Kette von einem mathematischen Beweis ueber eine bestimmte Metrik bis hin zu organisatorischen Auswirkungen nachzuzeichnen.
Teil I: Mathematisches Fundament
2. Definitionen
Es seien n Aufgaben mit Bearbeitungszeiten p_1, p_2, \ldots, p_n gegeben.
Ein Ablaufplan \sigma ist eine Permutation von \{1, 2, \ldots, n\},
die Aufgaben einer Ausfuehrungsreihenfolge auf einem einzelnen Ausfuehrer
zuweist.
Die Abschlusszeit der Aufgabe \sigma(k) unter Ablaufplan \sigma ist:
C_{\sigma(k)} = \sum_{j=1}^{k} p_{\sigma(j)}
Die ungewichtete mittlere Abschlusszeit ist:
\bar{C}(\sigma) = \frac{1}{n} \sum_{k=1}^{n} C_{\sigma(k)}
Die arbeitsgewichtete mittlere Abschlusszeit ist:
\bar{C}_w(\sigma) = \frac{\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)}}{\sum_{k=1}^{n} p_{\sigma(k)}}
3. Kernergebnisse
3.1 Der ungewichtete Mittelwert ist manipulierbar
Satz 1 (Smith, 1956 [1]). Der Ablaufplan, der
\bar{C}(\sigma) minimiert, ist Shortest Processing Time first (SPT):
Sortiere die Aufgaben so, dass
p_{\sigma(1)} \le p_{\sigma(2)} \le \cdots \le p_{\sigma(n)}.
Beweis (Austauschmethode [1, 2]).
Betrachte einen beliebigen Ablaufplan \sigma, in dem zwei benachbarte
Aufgaben i, j die Bedingung p_i > p_j erfuellen, wobei Aufgabe i
unmittelbar vor Aufgabe j eingeplant ist. Sei t die Startzeit von
Aufgabe i.
Aufgabe i endet |
Aufgabe j endet |
Summe | |
|---|---|---|---|
Vor dem Tausch (i dann j) |
t + p_i |
t + p_i + p_j |
2t + 2p_i + p_j |
Nach dem Tausch (j dann i) |
t + p_j |
t + p_j + p_i |
2t + p_i + 2p_j |
Die Aenderung der Summe der Abschlusszeiten betraegt:
(2p_i + p_j) - (p_i + 2p_j) = p_i - p_j > 0
Jeder Tausch eines laenger-vor-kuerzer-Paares benachbarter Aufgaben
reduziert die Gesamtsumme strikt. Jeder Nicht-SPT-Ablaufplan enthaelt ein
solches Paar. Wiederholte Tauschoperationen konvergieren zu SPT. Daher
minimiert SPT \bar{C}(\sigma) eindeutig. \blacksquare
3.2 Der arbeitsgewichtete Mittelwert ist planungsinvariant
Satz 2. Die arbeitsgewichtete mittlere Abschlusszeit \bar{C}_w(\sigma)
ist fuer jeden Ablaufplan \sigma identisch.
Beweis.
Expandiere den Zaehler:
\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)} = \sum_{k=1}^{n} p_{\sigma(k)} \sum_{j=1}^{k} p_{\sigma(j)}
Reindiziere, indem a = \sigma(k) und b = \sigma(j) gesetzt wird. Die
Doppelsumme zaehlt jedes geordnete Paar (a, b), bei dem b nicht
spaeter als a eingeplant ist:
= \sum_{\substack{a, b \\ b \preceq_\sigma a}} p_a \, p_b
Fuer jedes Paar (a, b) mit a \ne b gilt genau eine der Beziehungen
\{b \preceq_\sigma a\} oder \{a \prec_\sigma b\}. Die Diagonalterme
(a = b) tragen p_a^2 bei, unabhaengig von der Reihenfolge. Daher:
\sum_{\substack{a, b \\ b \preceq_\sigma a}} p_a \, p_b = \sum_{a} p_a^2 + \sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b
Zusammen mit der komplementaeren Summe decken die beiden Nebendiagonalsummen alle ungeordneten Paare ab:
\sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b + \sum_{\substack{a \ne b \\ a \prec_\sigma b}} p_a \, p_b = \sum_{a \ne b} p_a \, p_b
Die rechte Seite ist planungsunabhaengig. Aufgrund der Symmetrie von
p_a p_b sind beide Nebendiagonalsummen gleich:
\sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b = \frac{1}{2} \sum_{a \ne b} p_a \, p_b
Daher:
\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)} = \sum_a p_a^2 + \frac{1}{2} \sum_{a \ne b} p_a \, p_b = \frac{1}{2}\left(\sum_a p_a\right)^2 + \frac{1}{2}\sum_a p_a^2
Dieser Ausdruck enthaelt keinen Bezug auf \sigma. Da der Nenner
\sum p_a ebenfalls planungsunabhaengig ist:
\bar{C}_w(\sigma) = \frac{\frac{1}{2}\left(\sum p_a\right)^2 + \frac{1}{2}\sum p_a^2}{\sum p_a}
ist ueber alle Ablaufplaene konstant. \blacksquare
Dies ist ein Beispiel der Erhaltungssaetze in der Ablaufplanung, die von Coffman, Shanthikumar und Yao [20] identifiziert wurden. Die Invarianz entspricht der Messung, wie lange eine Einheit Arbeit wartet, anstatt wie lange eine Aufgabe wartet — die ungewichtete Statistik zaehlt Abschluesse statt Arbeit, weshalb sie manipulierbar ist. (Siehe auch Little [3, 4] fuer den warteschlangentheoretischen Kontext, mit dem Vorbehalt, dass Littles Gesetz direkt nur auf stationaere Systeme anwendbar ist, nicht auf den hier analysierten Batch-Fall.)
3.3 Anschauliches Beispiel
Zwei Aufgaben: A mit p_A = 1 Stunde, B mit p_B = 10 Stunden.
| Ablaufplan | C_A |
C_B |
Ungewichteter Mittelwert | Arbeitsgewichteter Mittelwert |
|---|---|---|---|---|
| SPT (A zuerst) | 1 | 11 | 6,0 | 111/11 ≈ 10,09 |
| Umgekehrt (B zuerst) | 11 | 10 | 10,5 | 111/11 ≈ 10,09 |
SPT erscheint 4,5 Stunden besser bei der ungewichteten Metrik, bietet aber keinerlei Verbesserung bei der arbeitsgewichteten Metrik. Der scheinbare Vorteil existiert nur, weil die ungewichtete Statistik einer 1-Stunden-Aufgabe das gleiche „Stimmrecht" einraeumt wie einer 10-Stunden-Aufgabe.
4. Konsequenzen fuer die Servicequalitaet
4.1 Aushungerung grosser Aufgaben
Satz 3 (Metrik-Verzerrung). Jede Planungsstrategie, die die ungewichtete mittlere Abschlusszeit minimiert, maximiert zwangslaeufig die Abschlusszeit der groessten Aufgabe.
Beweis. SPT platziert die groesste Aufgabe an letzter Stelle. Ihre
Abschlusszeit entspricht der gesamten Bearbeitungszeit \sum p_i, was
die maximal moegliche Abschlusszeit fuer jede einzelne Aufgabe darstellt.
Unter jedem Ablaufplan, der die groesste Aufgabe nicht an die letzte
Stelle setzt, wird diese Aufgabe strikt frueher abgeschlossen.
\blacksquare
Dies schafft einen Anreiz zur Aushungerung: Rationale Akteure, die die ungewichtete Statistik optimieren, werden grosse Aufgaben zugunsten kleiner auf unbestimmte Zeit zurueckstellen. Austin [18] identifizierte dieses allgemeine Muster — dass unvollstaendige Messung Anreize schafft, die gemessene Dimension auf Kosten der ungemessenen zu optimieren — im Kontext des organisatorischen Leistungsmanagements. Satz 3 liefert den spezifischen Mechanismus fuer die Aufgabenplanung.
4.2 Maximale Abschlusszeit fuer die groesste Aufgabe
Satz 4 (SPT maximiert eindeutig die Abschlusszeit der groessten Aufgabe).
Unter allen Ablaufplaenen ist SPT die einzige Strategie, die der groessten
Aufgabe die maximal moegliche Abschlusszeit (\sum p_i) zuweist.
Beweis. SPT sortiert Aufgaben in aufsteigender Reihenfolge von p_i
und platziert die groesste Aufgabe p_{\max} an die letzte Position. Die
letzte Aufgabe in jedem Ablaufplan hat die Abschlusszeit
\sum_{i=1}^{n} p_i, was das Maximum ist, das eine einzelne Aufgabe
erhalten kann. Unter jedem Ablaufplan, der p_{\max} nicht an die letzte
Stelle setzt, wird sie strikt vor \sum p_i abgeschlossen.
\blacksquare
Korollar 4.1. Ein Team, das die ungewichtete mittlere Abschlusszeit optimiert, wird systematisch die schlechteste Erfahrung fuer Kunden mit den komplexesten Beduerfnissen liefern. Dies ist kein Nebeneffekt — es ist der Mechanismus, durch den sich die Metrik verbessert.
Anmerkung zu Verlangsamungsverhaeltnissen. SPT komprimiert
tatsaechlich die Verlangsamungsverhaeltnisse (S_i = C_i / p_i), da
groessere Aufgaben in spaeteren Positionen grosse Nenner haben, die die
akkumulierte Summe absorbieren. Zum Beispiel bei den Aufgaben [1, 5, 10]:
SPT ergibt Verlangsamungen [1, 1.2, 1.6] (niedrige Varianz), waehrend
LPT [1, 3, 16] ergibt (hohe Varianz). Der Schaden von SPT fuer Kunden
mit grossen Aufgaben ist nicht im Verlangsamungsverhaeltnis sichtbar — er
ist in der absoluten Abschlusszeit sichtbar. Diese Unterscheidung ist
wichtig: Die Literatur zur Fairness in der Ablaufplanung [21, 22, 23] hat
die Unfairness von SPT/SRPT primaer anhand verlangsamungsbasierter Masse
diskutiert, die die absolute Verzoegerungslast, die unten bewiesen wird,
verschleiern koennen.
4.3 Verzoegerungskonzentration
Satz 5 (SPT konzentriert Verzoegerung auf die groesste Aufgabe). Unter SPT traegt die groesste Aufgabe mehr absolute Verzoegerung als unter jedem anderen Ablaufplan.
Beweis. Definiere die absolute Verzoegerung als \Delta_i = C_i - p_i
(Wartezeit, unabhaengig von der eigenen Groesse). Unter SPT befindet sich
die groesste Aufgabe an Position n mit:
\Delta_{\max\text{-task}}^{\text{SPT}} = C_n - p_n = \sum_{i=1}^{n-1} p_i
Dies ist die Summe der Bearbeitungszeiten aller anderen Aufgaben — die
maximal moegliche Verzoegerung fuer eine einzelne Aufgabe. Unter jedem
Ablaufplan, in dem die groesste Aufgabe nicht an letzter Stelle steht, ist
ihre Verzoegerung strikt geringer. Gleichzeitig gibt SPT der kleinsten
Aufgabe eine Verzoegerung von null (\Delta_1^{\text{SPT}} = 0). Die
gesamte Warteschlangenlast wird von kleinen auf grosse Aufgaben
verlagert. \blacksquare
SPT minimiert die gesamte Verzoegerung (gut fuer die aggregierte Effizienz), indem es die Verzoegerung auf die Aufgaben konzentriert, die sie in Bezug auf das Verlangsamungsverhaeltnis am besten absorbieren koennen. Aber in absoluten Zahlen — Stunden des Wartens — traegt die groesste Aufgabe die volle Last.
4.4 Durchsatzinvarianz
Satz 6 (Durchsatzinvarianz). Die ueber einen beliebigen Zeithorizont
T geleistete Gesamtarbeit ist unter allen Planungsstrategien identisch.
Beweis. Der Ausfuehrer verarbeitet Arbeit mit einer festen Rate. Ueber
einen beliebigen Horizont T \ge \sum p_i ist die geleistete
Gesamtarbeit genau \sum p_i, unabhaengig von der Reihenfolge. Fuer den
stationaeren Fall mit laufenden Ankuenften wird der langfristige Durchsatz
durch die Bedienrate \mu bestimmt und ist vollstaendig unabhaengig von
der Ablaufplanung:
\lim_{T \to \infty} \frac{W(T)}{T} = \mu \quad \text{fuer alle Ablaufplaene } \sigma
\blacksquare
Korollar 6.1. Ein Team, das von einer beliebigen Planungsstrategie auf SPT umstellt, wird eine Verbesserung der ungewichteten mittleren Abschlusszeit beobachten — bei keinerlei Aenderung des tatsaechlichen Durchsatzes. Die Metrik verbessert sich. Die Leistung nicht.
4.5 Der kombinierte Effekt
Zusammenfassung der Saetze 4, 5 und 6:
| Kenngroesse | Auswirkung der Optimierung des ungewichteten Mittelwerts |
|---|---|
| Durchsatz (Arbeit/Zeit) | Keine Aenderung (Satz 6) |
| Verzoegerung fuer kleine Aufgaben | Minimiert — naehert sich null (SPT) |
| Verzoegerung fuer grosse Aufgaben | Maximiert — traegt die gesamte Warteschlangenlast (Satz 5) |
| Abschlusszeit der groessten Aufgabe | Maximal moeglich: \sum p_i (Satz 4) |
Der Nettoeffekt auf die wahrgenommene Qualitaet ist negativ, weil:
-
Verlustaversion ist asymmetrisch [8]. Ein Kunde, dessen 100-Stunden-Aufgabe deprioritisiert wird, erlebt ein grosses, auffaelliges Negativ. Ein Kunde, dessen 1-Stunden-Aufgabe beschleunigt wird, erlebt ein kleines, oft unbemerktes Positiv.
-
Aufwaendige Aufgaben korrelieren mit wertvollen Kunden. Grosse Aufgaben stammen ueberproportional haeufig von Grosskunden, komplexen Vertraegen oder kritischen Geschaeftsanforderungen.
-
Aushungerung kumuliert sich. In einem kontinuierlichen System (Satz 3) koennen grosse Aufgaben unbegrenzt aufgeschoben werden, da staendig neue kleine Aufgaben eintreffen.
Satz 7 (Das Kernergebnis). Fuer ein Team, das Aufgaben unterschiedlicher Groesse bearbeitet, bewirkt die Einfuehrung der ungewichteten mittleren Abschlusszeit als Leistungsmetrik:
(a) Keinerlei Produktivitaetsgewinn (Satz 6), waehrend (b) der groessten Aufgabe die maximal moegliche Abschlusszeit zugewiesen wird (Satz 4), und (c) die gesamte Warteverzoegerung auf die groessten Aufgaben konzentriert wird, waehrend die Verzoegerung fuer die kleinsten eliminiert wird (Satz 5).
Dies ist kein Kompromiss. Die Metrik erzeugt einen reinen Transfer von
Servicequalitaet von aufwandsintensiven Kunden zu aufwandsarmen Kunden,
ohne jeglichen Nettoarbeitsgewinn. \blacksquare
Teil II: Prioritaetssysteme
5. Versagen unter Prioritaetsklassifikation
Die vorangegangenen Abschnitte haben bewiesen, dass die ungewichtete mittlere Abschlusszeit verzerrt ist, wenn Aufgaben in ihrer Groesse variieren. Wir zeigen nun, dass die Einfuehrung eines Prioritaetssystems — wie es praktisch alle realen Teams verwenden — dazu fuehrt, dass die Metrik nicht nur verzerrt, sondern aktiv adversarial gegenueber den erklaerten Zielen der Organisation wird.
5.1 Erweitertes Modell: Aufgaben mit Prioritaet
Jede Aufgabe i habe eine Bearbeitungszeit p_i und eine
Prioritaetsklasse q_i \in \{1, 2, 3, 4\}, wobei 1 die hoechste
Prioritaet (kritisch) und 4 die niedrigste (kosmetisch/Erweiterung)
darstellt. Prioritaetsgewichte werden wie folgt zugewiesen:
w(q) = \begin{cases} 8 & q = 1 \text{ (Kritisch)} \\ 4 & q = 2 \text{ (Hoch)} \\ 2 & q = 3 \text{ (Mittel)} \\ 1 & q = 4 \text{ (Niedrig)} \end{cases}
Die spezifischen Gewichte sind illustrativ; die Ergebnisse gelten fuer jede streng monoton fallende Gewichtsfunktion. Die entscheidende Eigenschaft ist, dass die Prioritaet nach Geschaeftsauswirkung vergeben wird, nicht nach Aufgabengroesse.
5.2 Die Metrik widerspricht dem Prioritaetssystem
Satz 8 (Prioritaets-Groessen-Inversion). Wenn die Prioritaet unabhaengig von der Aufgabengroesse ist, wird der Ablaufplan, der die ungewichtete mittlere Abschlusszeit minimiert (SPT), im Erwartungswert Aufgaben niedriger Prioritaet vor Aufgaben hoher Prioritaet mit groesserer Bearbeitungszeit abschliessen.
Beweis. SPT ordnet Aufgaben nach p_i aufsteigend, unabhaengig von
q_i. Betrachte zwei Aufgaben:
- Aufgabe A:
p_A = 40Stunden,q_A = 1(Kritisch — z.B. Serverausfall) - Aufgabe B:
p_B = 0.5Stunden,q_B = 4(Niedrig — z.B. kosmetische UI-Korrektur)
SPT plant B vor A ein. Der ungewichtete Mittelwert fuer dieses Paar:
\bar{C}^{\text{SPT}} = \frac{0.5 + 40.5}{2} = 20.5 \qquad \bar{C}^{\text{priority}} = \frac{40 + 40.5}{2} = 40.25
Die Metrik erklaert SPT fuer fast doppelt so gut — obwohl eine kosmetische Korrektur bearbeitet wird, waehrend ein Serverausfall andauert.
Im Allgemeinen hat die SPT-Reihenfolge, wenn q_i statistisch
unabhaengig von p_i ist, eine Korrelation von null mit der
Prioritaet. In der Praxis erfordern kritische Aufgaben (Ausfaelle,
Sicherheitsvorfaelle, Datenverlust) oft mehr Arbeit als Aufgaben
niedriger Prioritaet, sodass die Metrik plausiblerweise
anti-korreliert mit dem Prioritaetssystem ist. \blacksquare
5.3 Informationsvernichtung
Der ungewichtete Mittelwert reduziert eine dreidimensionale Aufgabe
(p_i, q_i, C_i) auf ein eindimensionales Signal (C_i) und mittelt
dann gleichfoermig. Dabei wird die Prioritaet vollstaendig verworfen und
die Groesse implizit invertiert.
Satz 9 (Informationsvernichtung). Sei I(\sigma) die
Transinformation zwischen der impliziten Prioritaetsrangfolge des
Ablaufplans (Position) und der tatsaechlichen Prioritaetszuweisung q_i.
Fuer SPT gilt:
I(\sigma_{\text{SPT}}) = 0 \quad \text{wenn } p_i \perp q_i
Beweis. SPT weist Positionen ausschliesslich basierend auf p_i zu.
Wenn p_i und q_i unabhaengig sind, liefert die Kenntnis der Position
einer Aufgabe im SPT-Ablaufplan keinerlei Information ueber ihre
Prioritaet. \blacksquare
Korollar 9.1. Ein Team, das die ungewichtete mittlere Abschlusszeit optimiert, betreibt ein Planungssystem, das keinerlei Information ueber seine eigene Prioritaetsklassifikation traegt. Das Prioritaetsfeld in ihrem Ticketsystem ist hinsichtlich der Ausfuehrungsreihenfolge dekorativ.
Dies ist ein Beispiel dessen, was Austin [18] als das grundlegende Problem unvollstaendiger Messung bezeichnet: Wenn das Messsystem nur eine Teilmenge der relevanten Dimensionen erfasst, verschlechtert die Optimierung der Messung systematisch die nicht gemessenen Dimensionen.
5.4 Prioritaetsgewichtete Verzoegerungskosten
Definiere die prioritaetsgewichteten Verzoegerungskosten eines Ablaufplans:
D(\sigma) = \sum_{i=1}^{n} w(q_i) \cdot C_i
Satz 10 (SPT und prioritaetsgewichtete Verzoegerungskosten). Der
optimale Ablaufplan zur Minimierung von D(\sigma) ist WSJF: Ordnung
nach w(q_i)/p_i absteigend [1, 5]. Die SPT-Ordnung — nach 1/p_i
absteigend — ignoriert die Prioritaet vollstaendig und erzeugt hoehere
$D$-Werte als prioritaetsrespektierende Alternativen, wenn Prioritaet mit
der Aufgabengroesse korreliert.
Beweis. Durch die Austauschmethode veraendert das Vertauschen
benachbarter Aufgaben i, j den Wert von D um:
\Delta D = w(q_j) \cdot p_i - w(q_i) \cdot p_j
Der Tausch verbessert D, wenn w(q_j)/p_j > w(q_i)/p_i, aber j
nach i eingeplant ist. Daher ist die optimale Reihenfolge absteigendes
w(q_i)/p_i — die WSJF-Regel. SPT entspricht WSJF nur dann, wenn
w(q_i) = \text{const} (alle Aufgaben haben gleiche Prioritaet).
Beispiel. Kritisch (w = 8, p = 3) und Niedrig (w = 1, p = 2):
- SPT (Niedrig zuerst):
D = 1 \cdot 2 + 8 \cdot 5 = 42 - WSJF (Kritisch zuerst):
D = 8 \cdot 3 + 1 \cdot 5 = 29
SPT verursacht 45% mehr prioritaetsgewichtete Verzoegerung. In der Praxis
sind kritische Aufgaben tendenziell groesser (Ausfaelle,
Sicherheitsvorfaelle), was die Divergenz systematisch macht.
\blacksquare
6. Loesungsvorschlaege
6.1 Prioritaetsgewichtete Metriken
Ersetze die ungewichtete mittlere Abschlusszeit durch den Priority-Weighted Completion Score (PWCS):
\text{PWCS}(\sigma) = \frac{\sum_{i=1}^{n} w(q_i) \cdot \frac{C_i}{p_i}}{\sum_{i=1}^{n} w(q_i)}
Dies ist das prioritaetsgewichtete mittlere Verlangsamungsverhaeltnis. Es misst, wie lange jede Aufgabe relativ zu ihrer Groesse gewartet hat, gewichtet danach, wie wichtig diese Aufgabe war. Niedrigere Werte sind besser.
Eigenschaften:
- Prioritaetsrespektierend. Verzoegerungen bei kritischen Aufgaben kosten 8-mal mehr als Verzoegerungen bei Aufgaben niedriger Prioritaet.
- Groessenfair. Verwendet das Verlangsamungsverhaeltnis
C_i / p_i, sodass grosse Aufgaben nicht dafuer bestraft werden, dass sie gross sind. - Nicht durch SPT manipulierbar. Eine Umordnung nach Bearbeitungszeit verbessert den Wert nicht systematisch.
- Reduziert sich auf den ungewichteten Mittelwert bei uniformen Aufgaben. Eine strikte Verallgemeinerung.
6.2 Optimale Strategie: WSJF
Satz 11. Der Ablaufplan, der die prioritaetsgewichtete Abschlusszeit
\text{PWCT}(\sigma) = \sum w(q_i) \cdot C_i / \sum w(q_i) minimiert,
bearbeitet Aufgaben in der Reihenfolge absteigender w(q_i)/p_i — die
Weighted Shortest Job First (WSJF)-Regel [1, 5].
Beweis. Durch die Austauschmethode (wie in Satz 10) verbessert der
Tausch benachbarter Aufgaben i, j den PWCT-Wert, wenn
w(q_j)/p_j > w(q_i)/p_i, aber j nach i eingeplant ist. Die
optimale Reihenfolge ist daher absteigendes w(q_i)/p_i.
\blacksquare
Innerhalb einer Prioritaetsklasse reduziert sich dies auf SPT (kuerzeste
zuerst). Ueber Klassen hinweg schlaegt eine kritische 4-Stunden-Aufgabe
(w/p = 2.0) eine niedrigprioritaere 1-Stunden-Aufgabe (w/p = 1.0).
Praktischer Vorbehalt. Reines WSJF kann winzige Aufgaben niedriger
Prioritaet vor grosse kritische Aufgaben setzen (eine 15-Minuten-Aufgabe
niedriger Prioritaet hat w/p = 1/0.25 = 4.0 und schlaegt eine
6-stuendige kritische Aufgabe mit w/p = 8/6 = 1.33). In der Praxis wird
dies durch die Durchsetzung einer strikten Prioritaetsklassenordnung
und die Anwendung von WSJF nur innerhalb jeder Klasse abgemildert.
6.3 Anwendungsbeispiel: IT-Service-Desk
Betrachte ein IT-Team mit der folgenden Ticket-Warteschlange:
| Ticket | Prioritaet | Typ | Gesch. Stunden |
|---|---|---|---|
| T1 | P1 (Kritisch) | E-Mail-Server ausgefallen | 6 |
| T2 | P2 (Hoch) | VPN fuer Remote-Team fehlerhaft | 4 |
| T3 | P3 (Mittel) | Laptop-Einrichtung fuer neuen Mitarbeiter | 2 |
| T4 | P4 (Niedrig) | Desktop-Hintergrundrichtlinie aktualisieren | 0,5 |
| T5 | P3 (Mittel) | Softwarelizenz installieren | 1 |
| T6 | P1 (Kritisch) | Datenbank-Backup fehlerhaft | 3 |
| T7 | P2 (Hoch) | Druckerflotte offline | 2 |
| T8 | P4 (Niedrig) | Alten gemeinsamen Laufwerksordner archivieren | 0,25 |
SPT-Reihenfolge (Optimierung des ungewichteten Mittelwerts): T8, T4, T5, T3, T7, T6, T2, T1
| Pos | Ticket | Prioritaet | Stunden | Abschluss | Verlangsamung |
|---|---|---|---|---|---|
| 1 | T8 (Ordner archivieren) | P4 Niedrig | 0,25 | 0,25 | 1,0 |
| 2 | T4 (Hintergrund) | P4 Niedrig | 0,5 | 0,75 | 1,5 |
| 3 | T5 (Software) | P3 Mittel | 1 | 1,75 | 1,75 |
| 4 | T3 (Laptop) | P3 Mittel | 2 | 3,75 | 1,875 |
| 5 | T7 (Drucker) | P2 Hoch | 2 | 5,75 | 2,875 |
| 6 | T6 (Backups) | P1 Krit. | 3 | 8,75 | 2,917 |
| 7 | T2 (VPN) | P2 Hoch | 4 | 12,75 | 3,188 |
| 8 | T1 (E-Mail) | P1 Krit. | 6 | 18,75 | 3,125 |
Praktisches WSJF (Prioritaetsklasse zuerst, SPT innerhalb der Klasse):
| Pos | Ticket | Prioritaet | Stunden | Abschluss |
|---|---|---|---|---|
| 1 | T6 (Backups) | P1 Krit. | 3 | 3 |
| 2 | T1 (E-Mail) | P1 Krit. | 6 | 9 |
| 3 | T7 (Drucker) | P2 Hoch | 2 | 11 |
| 4 | T2 (VPN) | P2 Hoch | 4 | 15 |
| 5 | T5 (Software) | P3 Mittel | 1 | 16 |
| 6 | T3 (Laptop) | P3 Mittel | 2 | 18 |
| 7 | T8 (Archiv) | P4 Niedrig | 0,25 | 18,25 |
| 8 | T4 (Hintergrund) | P4 Niedrig | 0,5 | 18,75 |
Vergleich:
| Metrik | SPT | Praktisches WSJF | Gewinner |
|---|---|---|---|
| Ungewichteter mittlerer Abschluss | 6,56 Std. | 13,63 Std. | SPT |
| P1 mittlere Loesungszeit | 13,75 Std. | 6 Std. | WSJF |
| P2 mittlere Loesungszeit | 9,25 Std. | 13 Std. | SPT |
| Zeit zur Reparatur des E-Mail-Servers | 18,75 Std. | 9 Std. | WSJF |
| Zeit zur Reparatur der Datenbank-Backups | 8,75 Std. | 3 Std. | WSJF |
| Zeit zur Aktualisierung des Hintergrunds | 0,75 Std. | 18,75 Std. | SPT |
Die aggregierten prioritaetsgewichteten Abschlusszeiten sind nahezu identisch (PWCT: 10,2 vs. 10,17), da die Aggregation den Verteilungsschaden verbirgt. Der eigentliche Unterschied liegt in der Aufschluesselung nach Prioritaetsklasse: Der E-Mail-Server ist unter SPT 18,75 Stunden ausgefallen, gegenueber 9 Stunden unter WSJF. Die Datenbank-Backups versagen 8,75 Stunden gegenueber 3.
Die ungewichtete Metrik berichtet zuversichtlich, dass SPT mehr als doppelt so effizient ist (6,56 vs. 13,63), und belohnt das Team, das Desktop-Hintergruende aktualisiert hat, waehrend der E-Mail-Server brannte.
6.4 Empfohlenes Metrik-Set
Selbst prioritaetsgewichtete aggregierte Metriken koennen gute von schlechten Ablaufplaenen nicht unterscheiden, da die Aggregation Verteilungsschaeden verbirgt. Keine einzelne Metrik genuegt. Ein vollstaendiges Messsystem sollte erfassen:
| Metrik | Was sie misst | Formel |
|---|---|---|
| Mittlerer Abschluss nach Prioritaetsklasse | Reaktionsfaehigkeit pro Klasse | \bar{C} gefiltert nach q |
| P1 mittlere Loesungszeit | Reaktion auf kritische Vorfaelle | \bar{C} fuer q = 1 |
| Durchsatz | Rohe Arbeitskapazitaet | Geleistete Arbeitsstunden / Kalenderzeit |
| Alterungsverletzungen | Verhinderung von Aushungerung | Aufgaben, die SLA nach Prioritaet ueberschreiten |
| Maximale Abschlusszeit (P1/P2) | Schlechtester kritischer Reaktionsfall | \max(C_i) fuer q \le 2 |
Die zentrale Erkenntnis: Metriken pro Prioritaetsklasse decken Planungsfehler auf, die aggregierte Metriken verbergen.
Teil III: Organisatorische Dynamik
7. Wenn die Metrik das Produkt ist
Die Abschnitte 2–6 setzen voraus, dass die Kundenzufriedenheit eine Funktion der erlebten Servicequalitaet ist. Es gibt jedoch ein Szenario, in dem diese Annahme versagt und das gesamte Argument in sich zusammenfaellt.
7.1 Die selbstreferenzielle Metrik
Angenommen, der Anbieter berichtet den ungewichteten Mittelwert direkt an den Kunden — auf einem Dashboard, in einem SLA-Bericht, auf einer Marketingseite — und die Zufriedenheit des Kunden leitet sich primaer aus dieser Zahl ab:
U_{\text{client}} = f\!\left(\bar{C}(\sigma)\right), \quad f' < 0
Unter diesem Modell maximiert SPT tatsaechlich die Kundenzufriedenheit (Satz 1). Der Durchsatz bleibt unveraendert (Satz 6). Das Geschaeftsergebnis verbessert sich: gleiche Arbeit erledigt, zufriedenerer Kunde.
Jeder Satz in dieser Arbeit bleibt mathematisch korrekt. Aber die Schlussfolgerung invertiert sich. Die Metrik ist nicht laenger ein Proxy, der manipuliert werden kann — sie ist die Servicequalitaet, weil der Kunde zugestimmt hat, die Qualitaet anhand der aggregierten Zahl zu bewerten.
7.2 Die Oekonomie
Dies erzeugt ein kohaerentes, stabiles Gleichgewicht:
| Akteur | Verhalten | Ergebnis |
|---|---|---|
| Anbieter | Optimiert ungewichteten Mittelwert (SPT) | Metrik verbessert sich, keine Mehrarbeit |
| Kunde | Liest Dashboard, sieht niedrigen Durchschnitt | Meldet Zufriedenheit |
| Management | Sieht zufriedenen Kunden + gute Metrik | Belohnt das Team |
Der Anbieter erzeugt Zufriedenheit zu null Grenzkosten, indem er eine Zahl optimiert, die der Kunde als Proxy fuer Qualitaet akzeptiert hat.
7.3 Die Fragilitaet
Dieses Gleichgewicht ist nur stabil, solange der Kunde seine eigene Erfahrung nie ueberprueft. Es bricht zusammen, wenn:
-
Der Kunde sein eigenes Ticket ueberprueft. Ein CTO, dessen E-Mail-Server 18,75 Stunden ausgefallen war, wird sich nicht durch „Durchschnittliche Loesungszeit: 6,56 Stunden" beruhigen lassen. Die Kunden, die am ehesten ueberprueft, sind genau diejenigen, die den schlechtesten Service erhalten (Satz 4).
-
Ein Wettbewerber SLAs pro Ticket anbietet. „P1 innerhalb von 4 Stunden geloest" schlaegt „durchschnittliche Loesungszeit unter 7 Stunden" fuer jeden Kunden mit kritischen Beduerfnissen.
-
Das Team die Metrik verinnerlicht. Wenn das Team glaubt, die Metrik spiegle die tatsaechliche Leistung wider, verliert es die Faehigkeit zu erkennen, wenn kritische Arbeit vernachlaessigt wird. Die Metrik wird zu einer epistemischen Gefahr.
7.4 Das allgemeine Muster
Dieses Muster — Proxy ersetzt Qualitaet, Proxy wird optimiert, Qualitaet divergiert, System ist stabil bis es von der Realitaet getestet wird — wiederholt sich in verschiedenen Domaenen. Muller [19] dokumentiert es ausfuehrlich als „Metrik-Fixierung"; Campbell [24] formalisierte den korrumpierenden Effekt der Verwendung von Indikatoren als Ziele.
| Domaene | Proxy-Metrik | Zugrunde liegende Qualitaet | Divergenz |
|---|---|---|---|
| IT-Support | Durchschn. Loesungszeit | Verfuegbarkeit kritischer Systeme | Server 19 Std. ausgefallen, Durchschnitt sagt 6,5 |
| Bildung | Testergebnisse | Tatsaechliches Lernen | Lehren fuer den Test |
| Gesundheitswesen | Patientendurchsatz | Patientenergebnisse | Schnellere Entlassungen, hoehere Wiederaufnahme |
| Finanzen | Quartalsergebnisse | Langfristiger Wert | Kostensenkung blaest EPS auf, erodiert Faehigkeiten |
| Software | Velocity (Story Points) | Produktqualitaet | Punkteinflation, halbfertige Features |
7.5 Informationsasymmetrie
Modelliere das System als Spiel zwischen Anbieter (A) und Kunde (K). A
beobachtet die einzelnen \{C_i\} und waehlt \sigma; K beobachtet nur
\bar{C}(\sigma). Dies ist ein Moral-Hazard-Problem [10]: Die
optimale Strategie von A ist, das beobachtbare Signal zu minimieren,
unabhaengig von der nicht beobachtbaren Verteilung.
Das Gleichgewicht ist ein Pooling-Gleichgewicht [9]: Die berichtete Metrik von A sieht unabhaengig von der zugrunde liegenden prioritaetsgewichteten Leistung identisch aus. Es ist stabil, bis K Zugang zu den einzelnen $C_i$-Werten erhaelt — ueber ein Kundenportal, die Transparenz eines Wettbewerbers oder einen hinreichend schmerzhaften Vorfall.
7.6 Die unbequeme Schlussfolgerung
Die ehrliche Antwort auf „Schadet die Optimierung des ungewichteten Mittelwerts dem Geschaeft?" lautet: Nicht unbedingt, solange der Kunde nie hinter die Zahl schaut. Die ehrliche Antwort auf „Ist das nachhaltig?" lautet: Es ist genau so nachhaltig wie jedes System, in dem der Verkaeufer mehr weiss als der Kaeufer — stabil ueber laengere Zeitraeume, dann rapider Zusammenbruch, wenn die Asymmetrie durchbrochen wird.
8. Die psychologischen Kosten des Wissens
Abschnitt 7 modellierte den Anbieter als einheitlichen Akteur. Aber Teams bestehen aus Individuen. Wenn ein Teammitglied den Beweis versteht — wenn es weiss, dass die Metrik synthetisch ist, dass das Dashboard Theater ist, dass der E-Mail-Server immer noch ausgefallen ist, waehrend es Hintergrund-Tickets schliesst — entsteht ein neuer Kostenfaktor, den das Gleichgewichtsmodell ausgelassen hat.
8.1 Die verborgene Variable: Teamwissen
| Akteur | Beobachtet einzelne C_i |
Beobachtet \bar{C} |
Versteht den Beweis |
|---|---|---|---|
| Management | Moeglicherweise | Ja | Variiert |
| Teammitglied | Ja | Ja | Ja (in diesem Szenario) |
| Kunde | Nein | Ja | Nein |
Das Teammitglied hat vollstaendige Information. Es sieht die Ticket-Warteschlange. Es weiss, dass der E-Mail-Server seit 7 Uhr ausgefallen ist. Es weiss, dass es ein Hintergrund-Ticket schliesst, weil es die Zahl verbessert. Und es weiss warum.
8.2 Kognitive Dissonanz unter vollstaendiger Information
Kognitive Dissonanz [11] entsteht, wenn ein Individuum widerspruechliche Kognitionen hat. Ohne zu verstehen warum, kann der Widerspruch rationalisiert werden: „Das Management weiss es besser." Das Verstaendnis des Beweises beseitigt die Ambiguitaet. Das Teammitglied haelt nun:
- Kognition A: „Ich bin ein kompetenter Fachmann. Meine Aufgabe ist es, wichtige Probleme zu loesen."
- Kognition B: „Ich schliesse ein Hintergrund-Ticket, waehrend der E-Mail-Server ausgefallen ist, weil die Metrik mathematisch verzerrt ist (Satz 1), die Umordnung keinen Durchsatz erzeugt (Satz 6), und der einzige Nutzniesser das Dashboard ist (Abschnitt 7). Ich kann dies beweisen."
Die Dissonanz ist nun tragend. Die verfuegbaren Loesungen — berufliche Identitaet aufgeben, den Beweis ablehnen, fuer Veraenderung eintreten oder kuendigen — verursachen jeweils Kosten, die vorher nicht existierten.
8.3 Selbstbestimmungstheorie: Drei verletzte Beduerfnisse
Decis und Ryans Selbstbestimmungstheorie [12, 13] identifiziert drei Beduerfnisse, die intrinsische Motivation vorhersagen:
Autonomie. Die Metrik schraenkt Entscheidungen in einer Weise ein, die das Teammitglied als mathematisch suboptimal erkennt. Ein Mitarbeiter, der versteht, dass der Prozess nachweislich kontraproduktiv ist, kann sich bei dessen Befolgung nicht autonom fuehlen.
Kompetenz. Die Metrik belohnt scheinbare Effektivitaet (niedriges
\bar{C}), waehrend sie gegenueber tatsaechlicher Effektivitaet
invariant ist (Satz 6). Echte Kompetenz — den E-Mail-Server zuerst zu
reparieren — wird von der Metrik bestraft.
Soziale Eingebundenheit. Das Teammitglied weiss, dass der E-Mail-Server des Kunden ausgefallen ist. Es koennte helfen. Stattdessen aktualisiert es Hintergruende — nicht weil es jemandem hilft, sondern weil es einer Zahl hilft. Die Verbindung zwischen Arbeit und menschlicher Wirkung ist gekappt, und das Teammitglied kann die getrennten Enden sehen.
8.4 Moralische Verletzung
Moralische Verletzung [16, 17] ist der dauerhafte Schaden, der durch „Begehen, Nicht-Verhindern, Bezeugen oder Erfahren von Handlungen, die tief verwurzelte moralische Ueberzeugungen verletzen" [17] verursacht wird. Das Konzept wurde seitdem auf geschaeftliche Kontexte erweitert [25]. Die entscheidende Unterscheidung zu Burnout: Burnout ist Erschoepfung durch zu viel Arbeit. Moralische Verletzung ist Schaden durch das Tun des Falschen.
Ein Teammitglied, das weiss, dass der E-Mail-Server ausgefallen ist, das weiss, dass es ihn reparieren sollte, stattdessen ein Hintergrund-Ticket schliesst und dies tut, weil die Metrik es verlangt, erlebt die strukturellen Bedingungen fuer moralische Verletzung.
8.5 Erlernte Hilflosigkeit und Metrik-Fatalismus
Seligmans erlernte Hilflosigkeit [14, 15] beschreibt, wie die Konfrontation mit unkontrollierbaren negativen Ergebnissen zu Passivitaet fuehrt. Die Abfolge:
- Die Metrik ist fehlerhaft (Beweis verstanden).
- Fuer Veraenderung eintreten.
- Abgelehnt („die Zahlen sind gut, mach keine Wellen").
- Wiederholung mit abnehmender Ueberzeugung.
- Endzustand: „Die Metrik ist wie sie ist. Ich schliesse einfach Tickets."
Dies ist keine Faulheit. Es ist die rationale Reaktion auf ein System, das korrektes Verhalten bestraft und inkorrektes Verhalten belohnt, wenn das Individuum keine Macht hat, das System zu aendern.
8.6 Die adversariale Selektionsspirale
Kombination des Gleichgewichts aus Abschnitt 7 mit der Fluktuationsdynamik:
- Organisation fuehrt ungewichteten Mittelwert ein. Metrik sieht gut aus (SPT).
- Bewusste, kompetente Teammitglieder erleiden psychologische Kosten (8.2–8.5).
- Diese Mitglieder gehen. Sie werden durch Mitglieder ersetzt, die die Maengel der Metrik nicht verstehen oder denen sie gleichgueltig sind.
- Die Metrik sieht weiterhin gut aus — sie tut dies unter SPT immer, unabhaengig von der Teamkompetenz (Korollar 6.1).
- Die tatsaechliche Servicequalitaet verschlechtert sich, aber die Metrik kann dies nicht erkennen (Korollar 9.1).
- Zurueck zu Schritt 1.
Die Metrik selektiert gegen die Personen, die das System verbessern wuerden, und fuer die Personen, die es nicht in Frage stellen werden. Das System stabilisiert sich auf einem niedrigeren Kompetenzniveau, unsichtbar fuer seinen eigenen Messapparat.
8.7 Das vollstaendige Kostenmodell
| Abschnitt 7 (sichtbar) | Abschnitt 8 (verborgen) |
|---|---|
| Kunde zufrieden (gute Zahl) | Team unzufrieden (schlechte Realitaet) |
| Durchsatz unveraendert | Freiwilliges Engagement zurueckgezogen |
| Metrik verbessert sich | Kompetente Mitglieder gehen |
| Geschaeftsoekonomie stabil | Institutionelle Kompetenz degeneriert |
Diese wirken auf unterschiedlichen Zeitskalen: Das Gleichgewicht ist quartalsweise sichtbar; die Kompetenzdegradation wird ueber Jahre sichtbar. Das vollstaendige Modell lautet: Die Metrik funktioniert, und sie ist destruktiv, und die Destruktion ist fuer die Metrik unsichtbar. Die Metrik ist frischer Anstrich auf korrodiertem Bewehrungsstahl.
9. Manager-Internalisierung: Die umsetzbare Loesung
Die Abschnitte 2–6 sagen: Lehne die Metrik ab. Abschnitt 7 sagt: Die Metrik funktioniert (fuer das Geschaeft). Abschnitt 8 sagt: Sie zerstoert das Team. In der Praxis koennen die meisten Manager die Metrik nicht einseitig aendern. Die beste Loesung ist eine unternehmensweite Metrikreform. Die umsetzbare Loesung ist, was ein einzelner informierter Manager jetzt tun kann.
9.1 Die Strategie
Ein Manager, der den Beweis versteht, kann die Limitierungen der Metrik internalisieren, ohne sie an das Team weiterzugeben:
- Primaer nach Prioritaet planen. Das Team bearbeitet kritische Aufgaben zuerst.
- Taktisch kleine Aufgaben einstreuen. Wenn eine kleine Aufgabe niedriger Prioritaet abgeschlossen werden kann, ohne die hochprioritaere Arbeit wesentlich zu verzoegern, erledige sie. Nicht weil die Metrik es verlangt, sondern weil sie ebenfalls erledigt werden muss und fast nichts kostet.
- Niemals die Metrik als Motivation offenlegen. „Erledige diese schnelle Aufgabe, waehrend wir auf den Rueckruf des Lieferanten zum P1 warten" — nicht „Wir muessen unseren Durchschnitt senken." Die intrinsische Motivation des Teams bleibt intakt (Abschnitt 8). Der Manager absorbiert die Last des Metrik-Managements.
9.2 Formalisierung
Das Optimierungsproblem des Managers ist eine eingeschraenkte Optimierung:
\min_{\sigma} \sum_{i=1}^{n} w(q_i) \cdot C_i \quad \text{unter der Nebenbedingung} \quad \bar{C}(\sigma) \le \bar{C}_{\text{target}}
Satz 12 (Begrenzte Metrikkosten der Prioritaetsplanung). Ein Manager, der SPT innerhalb jeder Prioritaetsklasse und Prioritaetsordnung zwischen den Klassen anwendet, wird eine Metrik nahe dem SPT-optimalen Wert erzielen — die Luecke entsteht nur durch zwischenklassige Inversionen.
Beweisskizze. Innerhalb jeder Prioritaetsklasse ist SPT kostenlos
(alle Aufgaben haben gleiche Prioritaet). Die einzige Abweichung vom
globalen SPT ist die Ordnung zwischen den Klassen. Jede
klassenuebergreifende Inversion kostet hoechstens
p_{\text{large}} - p_{\text{small}} in der ungewichteten Summe, und
diese Inversionen sind durch die Anzahl der Klassen begrenzt. In der
Praxis liegt die Luecke typischerweise innerhalb von 10–20% des
SPT-Optimums. \blacksquare
9.3 Der Manager als Informationsbarriere
| Ebene | Sieht Metrik | Sieht Prioritaeten | Sieht Beweis |
|---|---|---|---|
| Organisation | Ja | Nominell | Nein |
| Manager | Ja | Ja | Ja |
| Team | Nein (abgeschirmt) | Ja | Irrelevant |
| Kunde | Ja (Dashboard) | Ueber SLA | Nein |
Der Manager ist der einzige Akteur, der alle drei Informationsstuecke besitzt. Dies ist keine Manipulation — er erledigt die richtige Arbeit in der richtigen Reihenfolge, und die Metrik ist akzeptabel, weil SPT innerhalb der Klassen kostenlos ist.
9.4 Der Zusammenbruch im Wettbewerb
Diese Strategie versagt, wenn die Metrik wettbewerblich zwischen Teams eingesetzt wird.
Fall 1: Kooperativ — Teams werden auf Paritaet gemessen, nicht auf Rangfolge. Jeder Manager wendet unabhaengig die Internalisierungsstrategie an. Die Metrik ist dekorativ, aber harmlos. Dies ist ein Koordinationsspiel mit einem stabilen kooperativen Gleichgewicht.
Fall 2: Wettbewerblich — Teams werden nach \bar{C} rangiert. Dies
ist ein Gefangenendilemma:
| Team B: Prioritaet zuerst | Team B: SPT | |
|---|---|---|
| Team A: Prioritaet zuerst | (Gute Arbeit, Gute Arbeit) | (A sieht schlecht aus, B sieht gut aus) |
| Team A: SPT | (A sieht gut aus, B sieht schlecht aus) | (Beide sehen gut aus, beide machen falsche Arbeit) |
Das Nash-Gleichgewicht ist (SPT, SPT). Die Internalisierungsstrategie ist ein kooperatives Gleichgewicht, das unter Wettbewerb nicht stabil ist.
9.5 Geltungsbereich
| Bedingung | Tragfaehigkeit |
|---|---|
| Metrik zur Gesundheitspruefung / Paritaet verwendet | Tragfaehig |
| Metrik sichtbar, aber nicht rangiert | Tragfaehig |
| Metrik teamuebergreifend rangiert | Fragil — erfordert Kooperation aller Manager |
| Metrik an Verguetung / Ressourcen gekoppelt | Nicht tragfaehig — Gefangenendilemma dominiert |
| Metrikreform auf Organisationsebene moeglich | Unnoetig — behebe stattdessen die Metrik |
Die beste Loesung ist unternehmensweit. Die umsetzbare Loesung ist ein Manager, der diesen Beweis versteht, sein Team vor der Metrik abschirmt, nach Prioritaet plant und SPT nur innerhalb von Prioritaetsklassen einsetzt, um die Zahl in einem akzeptablen Rahmen zu halten.
Teil IV: Bewertung
10. Advocatus Diaboli
Intellektuelle Ehrlichkeit erfordert die Anerkennung der Grenzen der Argumentation.
10.1 Einfachheit hat einen realen Wert
Argument. Der ungewichtete Mittelwert erfordert keine Prioritaetsgewichte, keine Aufgabengroessenschaetzungen, keine Kalibrierung.
Bewertung: Korrekt. Aber die ungewichtete Metrik vermeidet keine Annahmen — sie verbirgt sie, indem sie implizit alle Gewichte auf 1 und alle Groessen auf 1 setzt. Eine bekannt ungenaue Schaetzung der Aufgabengroesse ist immer noch informativer als die implizite Annahme, dass alle Groessen gleich sind.
10.2 Minimierung der Anzahl wartender Personen
Argument. SPT minimiert die gesamten Personen-Stunden des Wartens. Wenn jede Aufgabe einen Kunden repraesentiert, ist dies optimal.
Bewertung: Mathematisch korrekt. Wenn Sie eine Zulassungsstelle betreiben und die Zeit jeder Person gleich wertvoll ist, ist SPT die richtige Strategie. Sie versagt, wenn Aufgaben nicht im Verhaeltnis 1:1 zu Kunden stehen, die Wartekosten nicht einheitlich sind oder die Metrik zur Bewertung von Teams statt zur Bedienung einer buchstaeblichen Warteschlange verwendet wird.
10.3 SPT als Triage-Heuristik
Argument. Wenn sich Aufgabengroessen eng buendeln, approximiert SPT FIFO und der ungewichtete Mittelwert approximiert den gewichteten Mittelwert.
Bewertung: Korrekt. Der Variationskoeffizient CV = \sigma_p / \bar{p} bestimmt das Ausmass der Verzerrung:
CV |
Aufgabengroessenverteilung | Verzerrung |
|---|---|---|
| < 0,3 | Eng (Callcenter) | Vernachlaessigbar |
| 0,3 – 1,0 | Moderat (gemischte IT) | Moderat |
| > 1,0 | Breit (typische IT-Warteschlange) | Schwerwiegend |
Ein typischer IT-Desk umfasst 15 Minuten bis 40+ Stunden (CV > 2). Die
Verzerrung ist kein Grenzfall — sie ist der Normalfall.
10.4 Manipulation erfordert boeswillige Absicht
Argument. Die Saetze zeigen, dass die Metrik manipuliert werden kann, nicht dass sie manipuliert wird.
Bewertung: Dies ist das staerkste Gegenargument. Wenn die Metrik rein informativ ist und niemals Verhalten beeinflusst, fehlt der Manipulationsanreiz. Allerdings wird jede Metrik, die dem Management berichtet, an OKRs gekoppelt oder in Retrospektiven diskutiert wird, Verhalten beeinflussen. Dies ist Goodharts Gesetz [6, 7] — und es gilt fuer gut gemeinte Teams ebenso zuverlaessig wie fuer zynische. Die Verschiebung geschieht organisch: Drei einfache Tickets abzuschliessen „fuehlt sich produktiv an", waehrend die Metrik das Gefuehl bestaetigt.
10.5 Wann der ungewichtete Mittelwert vertretbar ist
Die Metrik ist nur dann vertretbar, wenn alle vier Bedingungen gleichzeitig gelten:
- Aufgabengroessen sind annaehernd einheitlich (
CV < 0,3) - Keine Prioritaetsdifferenzierung (alle Aufgaben gleich wichtig)
- Jede Aufgabe repraesentiert genau einen Kunden
- Die Metrik wird nicht zur Bewertung, Belohnung oder Verhaltenssteuerung eingesetzt
Diese Bedingungen sind in den Systemen, in denen die Metrik am haeufigsten eingesetzt wird, selten erfuellt.
11. Verwandte Arbeiten
Diese Arbeit steht an der Schnittstelle mehrerer Literaturbereiche, die zuvor nicht miteinander verbunden wurden.
11.1 Ablaufplanungstheorie und Fairness
Smith [1] etablierte das SPT-Optimalitaetsergebnis und die WSJF-Regel im Jahr 1956. Conway, Maxwell und Miller [2] lieferten die umfassende Lehrbuchdarstellung. Die Fairness groessenbasierter Planungsstrategien wurde in der Ablaufplanung fuer Computersysteme diskutiert: Bansal und Harchol-Balter [22] untersuchten die SRPT-Unfairness; Wierman und Harchol-Balter [23] formalisierten Fairness-Klassifikationen gegenueber Processor-Sharing; Angel, Bampis und Pascual [21] massen die SPT-Ablaufplanqualitaet anhand fairer Optimalitaetskriterien.
Diese frueheren Arbeiten analysieren Fairness in der CPU- und Server-Ablaufplanung. Die vorliegende Arbeit wendet dieselben mathematischen Ergebnisse auf organisatorisches Aufgabenmanagement an, bei dem der „Scheduler" ein menschliches Team ist, die „Jobs" Kundenanfragen mit geschaeftsrelevanten Prioritaeten sind und die „Zielfunktion" eine Management-Metrik ist. Der Mechanismus ist identisch; die Konsequenzen unterscheiden sich, weil organisatorische Ablaufplanung Prioritaetssysteme, Kundenbeziehungen und psychologische Kosten hat, die CPU-Ablaufplanung nicht hat.
11.2 Messdysfunktion
Austin [18] bewies, dass unvollstaendige Messung — die Messung nur einer Teilmenge der relevanten Dimensionen — Anreize schafft, die gemessenen Dimensionen auf Kosten der ungemessenen zu optimieren, und dass dieser Effekt nicht nur moeglich, sondern unvermeidlich ist, wenn die Messung an Belohnungen gekoppelt wird. Sein Rahmen der Informationsasymmetrie entspricht eng Abschnitt 7. Die vorliegende Arbeit liefert den spezifischen mathematischen Mechanismus (Saetze 1–2) fuer den Fall der Aufgabenplanung und erweitert die Argumentation durch Psychologie (Abschnitt 8), um die vollstaendige Kette organisatorischen Schadens nachzuzeichnen.
Muller [19] dokumentierte „Metrik-Fixierung" in Bildung, Gesundheitswesen, Polizei und Finanzen und lieferte umfangreiche empirische Belege fuer die in Abschnitt 7.4 theoretisierten Muster. Campbell [24] formalisierte den korrumpierenden Effekt der Verwendung von Indikatoren als Ziele und ergaenzte damit Goodharts urspruengliche Beobachtung [6] und Stratherns Verallgemeinerung [7].
Bevan und Hood [26] dokumentierten empirisch Manipulationsverhalten im englischen oeffentlichen Gesundheitssystem — einschliesslich genau der Muster des „Ziel getroffen und den Sinn verfehlt", die in unserem Abschnitt 5.2 beschrieben werden.
11.3 Psychologische Kosten von Metrikdysfunktion
Die Anwendung moralischer Verletzung (Shay [16], Litz et al. [17]) auf geschaeftliche Kontexte hat juengere Vorlaeufer: Eine Studie im Journal of Business Ethics von 2024 [25] erweiterte das Konstrukt explizit auf gewinnorientierte Arbeitsplaetze und fand strukturelle Bedingungen, die den in Abschnitt 8.4 beschriebenen aehneln. Moore [27] analysierte moralisches Disengagement — die kognitive Umstrukturierung, die unethisches Verhalten unter organisatorischem Druck ermoeglicht. Die vorliegende Arbeit behandelt das komplementaere Phaenomen: den Schaden fuer Individuen, die sich weigern, sich zu distanzieren.
11.4 Was ist neu
Die einzelnen Komponenten — SPT-Optimalitaet, Goodharts Gesetz, Messdysfunktion, moralische Verletzung — haben alle Vorlaeufer. Die Beitraege dieser Arbeit sind:
-
Der Erhaltungssatz (Satz 2) praeskriptiv verwendet — als konstruktives Argument, dass arbeitsgewichtete Abschlusszeit nicht manipuliert werden kann, anstatt als theoretisches Ablaufplanungsergebnis.
-
Der spezifische Beweis, dass Prioritaetsklassen die Metrik algebraisch adversarial machen (Saetze 8–9) — nicht lediglich empirisch schlecht, sondern strukturell widerspruechlich, mit null Transinformation zwischen Ablaufplan und Prioritaetssystem.
-
Die integrierte Kette vom mathematischen Beweis ueber Informationsasymmetrie ueber psychologischen Schaden zur adversarialen Selektionsspirale — die Verfolgung einer einzelnen Metrik von Smith (1956) bis zur organisatorischen Aushoelung.
-
Die Manager-Internalisierungsstrategie (Abschnitt 9) mit formaler spieltheoretischer Analyse ihrer Stabilitaet und Zusammenbruchbedingungen unter teamuebergreifendem Wettbewerb.
-
Die Anwendung der Ablaufplanungstheorie auf organisatorische Managementkritik — der Beweis, dass eine gaengig verwendete Team-Metrik spezifische, quantifizierbare Pathologien aufweist, anstatt anekdotisch oder aus allgemeinen Prinzipien zu argumentieren.
12. Schlussfolgerung
Die ungewichtete durchschnittliche Abschlusszeit ist eine verzerrte Statistik, die:
- Durch Planungsstrategie manipuliert werden kann (Satz 1), im Gegensatz zur arbeitsgewichteten Abschlusszeit, die planungsinvariant ist (Satz 2).
- Die Aushungerung grosser Aufgaben incentiviert (Satz 3).
- Die Kundenzufriedenheit verschlechtert, ohne kompensierenden Produktivitaetsgewinn (Satz 7).
- Prioritaetssystemen aktiv widerspricht, indem sie keinerlei Information ueber die Geschaeftsauswirkungsklassifikation traegt (Satz 9).
- Prioritaet vollstaendig ignoriert in ihrer Planungsempfehlung und suboptimale prioritaetsgewichtete Verzoegerung erzeugt, wann immer Prioritaet und Groesse nicht perfekt invers korreliert sind (Satz 10).
Eine Metrik, die durch Umordnung der Arbeit verbessert werden kann — ohne zusaetzliche Arbeit zu leisten — misst die Planungsstrategie, nicht die Kapazitaet des Systems. In Kombination mit einem Prioritaetssystem empfiehlt sie den Ablaufplan, der den groessten Schaden an der hoechstprioritaeren Arbeit anrichtet.
Wenn die Metrik an Kunden berichtet wird, erzeugt sie eine Informationsasymmetrie (Abschnitt 7), deren Geschaeftsgleichgewicht profitabel, aber fragil ist. Wenn Teammitglieder ihre Maengel verstehen, verletzt sie deren intrinsische Motivation und selektiert fuer den Weggang der kompetentesten Personen (Abschnitt 8). Ein einzelner informierter Manager kann diese Effekte durch eingeschraenkte Optimierung teilweise abmildern (Abschnitt 9), aber diese kooperative Strategie ist unter teamuebergreifendem Wettbewerb nicht stabil.
Der ungewichtete Mittelwert ist nur unter engen Bedingungen vertretbar (Abschnitt 10.5): einheitliche Aufgabengroessen, keine Prioritaeten, Eins-zu-eins-Zuordnung von Kunden zu Aufgaben und kein Verhaltenseinfluss. Diese Bedingungen sind selten erfuellt.
Die ungewichtete durchschnittliche Abschlusszeit ist kein faires oder genaues Mass fuer die Aufgabenausfuehrungsleistung. Ihre Einfuehrung als Team-Metrik wird rational zur Aushungerung komplexer Arbeit, zur Verletzung erklaerter Prioritaeten, zu ungerechten Kundenergebnissen und zur Illusion von Produktivitaet fuehren, wo keine existiert.
Die beste Loesung ist eine organisatorische Metrikreform. Die umsetzbare Loesung ist ein Manager, der diesen Beweis versteht.
Literaturverzeichnis
Ablaufplanungstheorie
[1] Smith, W. E. (1956). Various optimizers for single-stage production. Naval Research Logistics Quarterly, 3(1–2), 59–66. doi:10.1002/nav.3800030106
Ursprung des SPT-Optimalitaetsergebnisses (Satz 1), der Regel fuer die gewichtete Abschlusszeit
w_i/p_iabsteigend (WSJF, Satz 11) und der Beweistechnik des paarweisen Austauschs benachbarter Aufgaben (Austauschmethode), die durchgehend verwendet wird.
[2] Conway, R. W., Maxwell, W. L., & Miller, L. W. (1967). Theory of Scheduling. Addison-Wesley.
Standardlehrbuch zur Einmaschinenablaufplanungstheorie, das Smiths Ergebnisse erweitert.
[3] Little, J. D. C. (1961). A proof for the queuing formula: L = λW. Operations Research, 9(3), 383–387. doi:10.1287/opre.9.3.383
Erster rigoroser Beweis von Littles Gesetz. Referenziert in Abschnitt 3.2 fuer den warteschlangentheoretischen Kontext.
[4] Little, J. D. C. (2011). Little's Law as viewed on its 50th anniversary. Operations Research, 59(3), 536–549. doi:10.1287/opre.1110.0941
Rueckblick mit Diskussion von Umfang, Einschraenkungen und haeufigen Fehlanwendungen.
[5] Reinertsen, D. G. (2009). The Principles of Product Development Flow: Second Generation Lean Product Development. Celeritas Publishing. ISBN: 978-0-9844512-0-8.
Popularisierte WSJF und „Cost of Delay / Duration" in agilen/schlanken Kontexten. Die mathematische Grundlage ist Smith (1956) [1].
Messung und Anreize
[6] Goodhart, C. A. E. (1984). Problems of monetary management: The U.K. experience. In Monetary Theory and Practice (pp. 91–121). Macmillan.
Quelle von Goodharts Gesetz: „Jede beobachtete statistische Regelmaessigkeit wird dazu neigen zusammenzubrechen, sobald Druck auf sie zu Kontrollzwecken ausgeuebt wird."
[7] Strathern, M. (1997). 'Improving ratings': Audit in the British university system. European Review, 5(3), 305–321. doi:10.1002/(SICI)1234-981X(199707)5:3<305::AID-EURO184>3.0.CO;2-4
Verallgemeinerung von Goodharts Gesetz: „Wenn ein Mass zum Ziel wird, hoert es auf, ein gutes Mass zu sein."
Verhaltensoekonomie
[8] Kahneman, D., & Tversky, A. (1979). Prospect theory: An analysis of decision under risk. Econometrica, 47(2), 263–292. doi:10.2307/1914185
Etablierte die Verlustaversion. Referenziert in Abschnitt 4.5.
Spieltheorie und Vertragstheorie
[9] Akerlof, G. A. (1970). The market for "lemons": Quality uncertainty and the market mechanism. The Quarterly Journal of Economics, 84(3), 488–500. doi:10.2307/1879431
Informationsasymmetrie und adverse Selektion. Das Pooling-Gleichgewicht in Abschnitt 7.5 ist strukturell analog.
[10] Hölmstrom, B. (1979). Moral hazard and observability. The Bell Journal of Economics, 10(1), 74–91. doi:10.2307/3003320
Formale Behandlung von Moral Hazard. Das Metrik-Berichtsszenario in Abschnitt 7.5 ist ein Moral-Hazard-Problem.
Psychologie
[11] Festinger, L. (1957). A Theory of Cognitive Dissonance. Stanford University Press. ISBN: 978-0-8047-0131-0.
Grundlegende Theorie. Referenziert in Abschnitt 8.2.
[12] Deci, E. L., & Ryan, R. M. (1985). Intrinsic Motivation and Self-Determination in Human Behavior. Plenum Press. ISBN: 978-0-306-42022-1.
Originaldarstellung der Selbstbestimmungstheorie. Referenziert in Abschnitt 8.3.
[13] Ryan, R. M., & Deci, E. L. (2000). Self-determination theory and the facilitation of intrinsic motivation, social development, and well-being. American Psychologist, 55(1), 68–78. doi:10.1037/0003-066X.55.1.68
SDT-Ueberblick, der Beduerfnisbefriedigung mit intrinsischer Motivation und Wohlbefinden verknuepft.
[14] Seligman, M. E. P., & Maier, S. F. (1967). Failure to escape traumatic shock. Journal of Experimental Psychology, 74(1), 1–9. doi:10.1037/h0024514
Urspruengliche Demonstration der erlernten Hilflosigkeit. Referenziert in Abschnitt 8.5.
[15] Seligman, M. E. P. (1975). Helplessness: On Depression, Development, and Death. W. H. Freeman. ISBN: 978-0-7167-0752-3.
Erweiterte Darstellung, die erlernte Hilflosigkeit mit menschlicher Depression und institutionellem Verhalten verbindet.
[16] Shay, J. (1994). Achilles in Vietnam: Combat Trauma and the Undoing of Character. Atheneum / Simon & Schuster. ISBN: 978-0-689-12182-3.
Einfuehrung des Konzepts der moralischen Verletzung. Referenziert in Abschnitt 8.4.
[17] Litz, B. T., Stein, N., Delaney, E., Lebowitz, L., Nash, W. P., Silva, C., & Maguen, S. (2009). Moral injury and moral repair in war veterans: A preliminary model and intervention strategy. Clinical Psychology Review, 29(8), 695–706. doi:10.1016/j.cpr.2009.07.003
Formalisierte moralische Verletzung als klinisches Konstrukt. Definition zitiert in Abschnitt 8.4.
Organisatorische Messung
[18] Austin, R. D. (1996). Measuring and Managing Performance in Organizations. Dorset House. ISBN: 978-0-932633-36-1.
Bewies, dass unvollstaendige Messung unvermeidlich Anreize schafft, die gemessenen Dimensionen auf Kosten der ungemessenen zu optimieren. Der Rahmen der Informationsasymmetrie entspricht eng Abschnitt 7. Der wichtigste einzelne Vorlaeufer der Argumentation dieser Arbeit.
[19] Muller, J. Z. (2018). The Tyranny of Metrics. Princeton University Press. ISBN: 978-0-691-17495-2.
Umfassende Behandlung der „Metrik-Fixierung" in Bildung, Gesundheitswesen, Polizei und Finanzen. Umfangreiche empirische Belege fuer die in Abschnitt 7.4 theoretisierten Muster.
Fairness in der Ablaufplanung
[20] Coffman, E. G., Shanthikumar, J. G., & Yao, D. D. (1992). Multiclass queueing systems: Polymatroid structure and optimal scheduling control. Operations Research, 40(S2), S293–S299.
Erhaltungssaetze in der Ablaufplanung. Die Planungsinvarianz der arbeitsgewichteten Abschlusszeit (Satz 2) ist ein Beispiel dieser Erhaltungssaetze.
[21] Angel, E., Bampis, E., & Pascual, F. (2008). How good are SPT schedules for fair optimality criteria? Annals of Operations Research, 159(1), 53–64. doi:10.1007/s10479-007-0267-0
Misst direkt die Qualitaet von SPT-Ablaufplaenen anhand von Fairness-Kriterien. Naechster Vorlaeufer in der Ablaufplanungstheorie zur Fairness-Analyse in Abschnitt 4.
[22] Bansal, N., & Harchol-Balter, M. (2001). Analysis of SRPT scheduling: Investigating unfairness. ACM SIGMETRICS Performance Evaluation Review, 29(1), 279–290. doi:10.1145/384268.378792
Untersucht die Ueberzeugung, dass SRPT grosse Auftraege in der Computerablaufplanung unfair benachteiligt. Argumentiert, dass die Unfairness geringer ist als angenommen, erkennt aber die Grundspannung an.
[23] Wierman, A., & Harchol-Balter, M. (2003). Classifying scheduling policies with respect to unfairness in an M/GI/1. ACM SIGMETRICS Performance Evaluation Review, 31(1), 238–249.
Formalisiert Fairness-Definitionen fuer Planungsstrategien durch Vergleich mit Processor-Sharing.
Weitere Referenzen
[24] Campbell, D. T. (1979). Assessing the impact of planned social change. Evaluation and Program Planning, 2(1), 67–90. doi:10.1016/0149-7189(79)90048-X
Campbells Gesetz: „Je mehr ein quantitativer sozialer Indikator fuer soziale Entscheidungsfindung verwendet wird, desto mehr wird er Korruptionsdruck ausgesetzt sein und desto eher wird er die sozialen Prozesse, die er ueberwachen soll, verzerren und korrumpieren." Ergaenzt Goodharts Gesetz [6].
[25] Ferreira, C. M., et al. (2024). It's business: A qualitative study of moral injury in business settings. Journal of Business Ethics. doi:10.1007/s10551-024-05615-0
Erweitert moralische Verletzung auf gewinnorientierte Arbeitsplaetze. Validiert die Anwendung von Shay/Litz in Abschnitt 8.4 ueber militaerische und Gesundheitskontexte hinaus.
[26] Bevan, G., & Hood, C. (2006). What's measured is what matters: Targets and gaming in the English public health care system. Public Administration, 84(3), 517–538. doi:10.1111/j.1467-9299.2006.00600.x
Dokumentiert empirisch Manipulationsverhalten einschliesslich „Ziel getroffen und den Sinn verfehlt". Liefert reale Belege fuer den Prioritaets-Metrik-Widerspruch in Abschnitt 5.2.
[27] Moore, C. (2012). Why employees do bad things: Moral disengagement and unethical organizational behavior. Personnel Psychology, 65(1), 1–48. doi:10.1111/j.1744-6570.2011.01237.x
Analysiert moralisches Disengagement — die kognitive Umstrukturierung, die unethisches Verhalten ermoeglicht. Abschnitt 8 behandelt das komplementaere Phaenomen: den Schaden fuer Individuen, die sich weigern, sich zu distanzieren.
Dieser Beweis wurde im Gespraech entwickelt und am 28.03.2026 formalisiert.