diff --git a/README.ar.md b/README.ar.md new file mode 100644 index 0000000..f92961d --- /dev/null +++ b/README.ar.md @@ -0,0 +1,1190 @@ +# المتوسط غير المرجّح لوقت الإنجاز ليس مقياسًا عادلًا لجدولة المهام + +برهان رياضي على أن المتوسط غير المرجّح لوقت إنجاز المهام إحصائية منحازة +تحفّز على انتقاء المهام السهلة، وأن أي ميزة جدولة يبدو أنها تكشفها هي +مجرد أثر ناتج عن المقياس ذاته — لا انعكاس للإنتاجية الحقيقية أو جودة +الخدمة. + +--- + +## 1. المقدمة + +تقيس كثير من المؤسسات أداء تنفيذ المهام بواسطة **المتوسط غير المرجّح +لوقت الإنجاز**: أي متوسط عدد الساعات (أو الأيام) بين تقديم المهمة +وإنهائها، حيث تُحتسب كل مهمة بالتساوي بغض النظر عن حجمها أو أولويتها. + +تُثبت هذه الورقة أن هذا المقياس ليس مجرد مقياس غير دقيق بل هو منحاز +بنيويًا. يمكن تحسينه بإعادة ترتيب العمل دون أداء أي عمل إضافي (المبرهنة 1)، +في حين أن البديل المرجّح بالعمل محصّن تمامًا ضد التلاعب بالجدولة (المبرهنة 2). +وعند دمجه مع نظام أولويات، يتناقض المقياس فعليًا مع تصنيفات الأولوية +الخاصة بالمؤسسة ذاتها (المبرهنة 9). + +تسير الحجة في أربعة أجزاء: + +- **الجزء الأول** (الأقسام 2–4) يؤسس القاعدة الرياضية: + المتوسط غير المرجّح قابل للتلاعب عبر جدولة أقصر وقت معالجة أولًا + (SPT — Shortest Processing Time)، + والمتوسط المرجّح بالعمل ثابت بغض النظر عن الجدولة، والنتائج المترتبة + على جودة الخدمة سلبية بصورة قابلة للإثبات. + +- **الجزء الثاني** (الأقسام 5–6) يوسّع النموذج ليشمل المهام المصنّفة + حسب الأولوية، ويثبت أن المقياس يصبح عدائيًا تجاه نظام الأولويات، + ويقترح بدائل مرجّحة مع مثال تطبيقي لمكتب خدمة تقنية معلومات. + +- **الجزء الثالث** (الأقسام 7–9) يفحص الديناميكيات المؤسسية: ماذا يحدث + حين يُبلَّغ العميل بالمقياس (عدم تماثل المعلومات)، وماذا يحدث لأعضاء + الفريق الذين يدركون عيوبه (الأذى النفسي)، وما الذي يمكن لمدير واحد + مطّلع أن يفعله حيال ذلك (التحسين المقيّد مع تحليل استقرار نظريّة + الألعاب). + +- **الجزء الرابع** (الأقسام 10–12) يعرض حججًا مضادة صادقة، ويضع العمل + في سياق الأدبيات القائمة، ويختتم. + +تستند النتائج الجوهرية إلى نظرية الجدولة التأسيسية لسميث (1956) [1]، +موسَّعة عبر نظرية الألعاب [9، 10]، ونظرية القياس المؤسسي [18، 19]، +وعلم النفس [11–17] لرسم سلسلة كاملة من برهان رياضي حول مقياس محدد +إلى نتائج مؤسسية. + +--- + +# الجزء الأول: الأساس الرياضي + +## 2. التعريفات + +لتكن هناك **n** مهمة بأوقات معالجة $p_1, p_2, \ldots, p_n$. + +**الجدول** $\sigma$ هو تبديل (permutation) للمجموعة $\{1, 2, \ldots, n\}$ +يعيّن المهام لترتيب التنفيذ على منفّذ واحد. + +**وقت إنجاز** المهمة $\sigma(k)$ ضمن الجدول $\sigma$ هو: + +$$C_{\sigma(k)} = \sum_{j=1}^{k} p_{\sigma(j)}$$ + +**المتوسط غير المرجّح لوقت الإنجاز** هو: + +$$\bar{C}(\sigma) = \frac{1}{n} \sum_{k=1}^{n} C_{\sigma(k)}$$ + +**المتوسط المرجّح بالعمل لوقت الإنجاز** هو: + +$$\bar{C}_w(\sigma) = \frac{\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)}}{\sum_{k=1}^{n} p_{\sigma(k)}}$$ + +--- + +## 3. النتائج الجوهرية + +### 3.1 المتوسط غير المرجّح قابل للتلاعب + +**المبرهنة 1** (Smith, 1956 [1])**.** الجدول الذي يقلّل +$\bar{C}(\sigma)$ هو جدولة أقصر وقت معالجة أولًا (SPT): رتّب المهام بحيث +$p_{\sigma(1)} \le p_{\sigma(2)} \le \cdots \le p_{\sigma(n)}$. + +**البرهان (حجة التبادل [1، 2]).** + +لنأخذ أي جدول $\sigma$ تكون فيه مهمتان متجاورتان $i, j$ تحققان +$p_i > p_j$ حيث تُجدوَل المهمة $i$ مباشرة قبل المهمة $j$. ليكن $t$ +وقت بدء المهمة $i$. + +| | إنجاز المهمة $i$ | إنجاز المهمة $j$ | المجموع | +|---|---|---|---| +| **قبل التبادل** ($i$ ثم $j$) | $t + p_i$ | $t + p_i + p_j$ | $2t + 2p_i + p_j$ | +| **بعد التبادل** ($j$ ثم $i$) | $t + p_j$ | $t + p_j + p_i$ | $2t + p_i + 2p_j$ | + +التغيّر في مجموع أوقات الإنجاز هو: + +$$(2p_i + p_j) - (p_i + 2p_j) = p_i - p_j > 0$$ + +كل تبادل لزوج متجاور (أطول قبل أقصر) يقلّل المجموع الكلي تقليلًا قاطعًا. +أي جدول غير SPT يحتوي على مثل هذا الزوج. التبادلات المتكررة تتقارب +نحو SPT. لذلك فإن SPT يقلّل $\bar{C}(\sigma)$ بصورة فريدة. $\blacksquare$ + +### 3.2 المتوسط المرجّح بالعمل ثابت بغض النظر عن الجدولة + +**المبرهنة 2.** المتوسط المرجّح بالعمل لوقت الإنجاز $\bar{C}_w(\sigma)$ +هو نفسه لكل جدول $\sigma$. + +**البرهان.** + +بتوسيع البسط: + +$$\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)} = \sum_{k=1}^{n} p_{\sigma(k)} \sum_{j=1}^{k} p_{\sigma(j)}$$ + +بإعادة الفهرسة حيث $a = \sigma(k)$ و $b = \sigma(j)$. المجموع المزدوج +يعدّ كل زوج مرتّب $(a, b)$ حيث $b$ مجدوَل في موعد لا يتأخر عن $a$: + +$$= \sum_{\substack{a, b \\ b \preceq_\sigma a}} p_a \, p_b$$ + +لأي زوج $(a, b)$ حيث $a \ne b$، يتحقق أحد الشرطين حصرًا: +$\{b \preceq_\sigma a\}$ أو $\{a \prec_\sigma b\}$. الحدود القُطرية +($a = b$) تُسهم بـ $p_a^2$ بغض النظر عن الترتيب. لذلك: + +$$\sum_{\substack{a, b \\ b \preceq_\sigma a}} p_a \, p_b = \sum_{a} p_a^2 + \sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b$$ + +مع المجموع المتمّم، يغطي المجموعان خارج القُطر جميع الأزواج غير المرتبة: + +$$\sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b + \sum_{\substack{a \ne b \\ a \prec_\sigma b}} p_a \, p_b = \sum_{a \ne b} p_a \, p_b$$ + +الطرف الأيمن مستقل عن الجدول. بالتماثل في $p_a p_b$، +المجموعان خارج القُطر متساويان: + +$$\sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b = \frac{1}{2} \sum_{a \ne b} p_a \, p_b$$ + +وبالتالي: + +$$\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)} = \sum_a p_a^2 + \frac{1}{2} \sum_{a \ne b} p_a \, p_b = \frac{1}{2}\left(\sum_a p_a\right)^2 + \frac{1}{2}\sum_a p_a^2$$ + +هذا التعبير لا يحتوي على أي إشارة إلى $\sigma$. بما أن المقام +$\sum p_a$ مستقل أيضًا عن الجدول: + +$$\bar{C}_w(\sigma) = \frac{\frac{1}{2}\left(\sum p_a\right)^2 + \frac{1}{2}\sum p_a^2}{\sum p_a}$$ + +هو **ثابت عبر جميع الجداول**. $\blacksquare$ + +هذا مثال على قوانين الحفظ في الجدولة التي حددها +Coffman وShanthikumar وYao [20]. يقابل هذا الثبات قياس مدة انتظار +وحدة *العمل* بدلًا من مدة انتظار *المهمة* — فالإحصائية غير المرجّحة تعدّ +الإنجازات لا العمل، وهذا ما يجعلها قابلة للتلاعب. (انظر أيضًا +Little [3، 4] للسياق في نظرية الطوابير، مع التنبيه أن قانون Little +ينطبق مباشرة فقط على الأنظمة في الحالة المستقرة، لا على حالة الدُّفعة +المحلّلة هنا.) + +### 3.3 مثال توضيحي + +مهمتان: $A$ بوقت معالجة $p_A = 1$ ساعة، و$B$ بوقت معالجة $p_B = 10$ ساعات. + +| الجدول | $C_A$ | $C_B$ | المتوسط غير المرجّح | المتوسط المرجّح بالعمل | +|----------|-------|-------|-----------------|-------------------| +| SPT (A أولًا) | 1 | 11 | 6.0 | 111/11 ≈ 10.09 | +| العكس (B أولًا) | 11 | 10 | 10.5 | 111/11 ≈ 10.09 | + +يبدو أن SPT **أفضل بـ 4.5 ساعة** على المقياس غير المرجّح لكنه يوفر +**صفر تحسين** على المقياس المرجّح بالعمل. الميزة الظاهرية موجودة فقط +لأن الإحصائية غير المرجّحة تتيح لمهمة مدتها ساعة واحدة أن "تصوّت" +بالتساوي مع مهمة مدتها 10 ساعات. + +--- + +## 4. التبعات على جودة الخدمة + +### 4.1 تجويع المهام الكبيرة + +**المبرهنة 3 (انحياز المقياس).** أي سياسة جدولة تقلّل المتوسط غير المرجّح +لوقت الإنجاز تُعظّم بالضرورة وقت إنجاز أكبر مهمة. + +**البرهان.** يضع SPT أكبر مهمة في الموضع الأخير. وقت إنجازها يساوي +إجمالي وقت المعالجة $\sum p_i$، وهو أقصى وقت إنجاز ممكن لأي مهمة +فردية. ضمن أي جدول لا يضع أكبر مهمة في الموضع الأخير، تُنجَز تلك المهمة +في وقت أبكر بشكل قاطع. $\blacksquare$ + +هذا يُنشئ **حافز التجويع**: الفاعلون العقلانيون الذين يُحسّنون الإحصائية +غير المرجّحة سيؤجلون المهام الكبيرة إلى أجل غير مسمى لصالح المهام الصغيرة. +حدّد Austin [18] هذا النمط العام — أن القياس الناقص يخلق حوافز لتحسين +البُعد المقاس على حساب الأبعاد غير المقاسة — في سياق إدارة الأداء +المؤسسي. تقدم المبرهنة 3 الآلية المحددة لجدولة المهام. + +### 4.2 أقصى وقت إنجاز لأكبر مهمة + +**المبرهنة 4 (SPT يُعظّم وقت إنجاز أكبر مهمة بشكل فريد).** +من بين جميع الجداول، SPT هو السياسة الوحيدة التي تُسند أقصى وقت إنجاز +ممكن ($\sum p_i$) لأكبر مهمة. + +**البرهان.** يرتّب SPT المهام تصاعديًا حسب $p_i$، فيضع أكبر مهمة +$p_{\max}$ في الموضع الأخير. المهمة الأخيرة في أي جدول لها وقت إنجاز +$\sum_{i=1}^{n} p_i$، وهو الحد الأقصى الذي يمكن أن تتلقاه أي مهمة فردية. +ضمن أي جدول لا يضع $p_{\max}$ في الموضع الأخير، تُنجَز في وقت أبكر +من $\sum p_i$ بشكل قاطع. $\blacksquare$ + +**النتيجة الطبيعية 4.1.** الفريق الذي يُحسّن المتوسط غير المرجّح لوقت +الإنجاز سيقدّم بصورة منهجية أسوأ تجربة للعملاء ذوي الاحتياجات الأكثر +تعقيدًا. هذا ليس أثرًا جانبيًا — إنه *الآلية* التي يتحسن بها المقياس. + +**ملاحظة حول نسب التباطؤ.** في الواقع، يُضغط SPT نسب التباطؤ +($S_i = C_i / p_i$) لأن المهام الأكبر في المواضع المتأخرة لها مقامات +كبيرة تمتص المجموع المتراكم. مثلًا، مع مهام $[1, 5, 10]$: يعطي SPT +نسب تباطؤ $[1, 1.2, 1.6]$ (تباين منخفض) بينما يعطي LPT نسب +$[1, 3, 16]$ (تباين مرتفع). ضرر SPT لعملاء المهام الكبيرة لا يظهر في +نسبة التباطؤ — بل يظهر في **وقت الإنجاز المطلق**. هذا التمييز مهم: +أدبيات عدالة الجدولة [21، 22، 23] ناقشت ظلم SPT/SRPT بشكل أساسي عبر +مقاييس قائمة على التباطؤ، وهو ما قد يُخفي عبء التأخير المطلق المُبرهَن +أدناه. + +### 4.3 تركّز التأخير + +**المبرهنة 5 (SPT يُركّز التأخير على أكبر مهمة).** ضمن SPT، +تتحمل أكبر مهمة تأخيرًا مطلقًا أكبر مما تتحمله ضمن أي جدول آخر. + +**البرهان.** نعرّف التأخير المطلق بأنه $\Delta_i = C_i - p_i$ (الوقت +المنقضي في الانتظار، بمعزل عن الحجم الذاتي). ضمن SPT، أكبر مهمة +في الموضع $n$ مع: + +$$\Delta_{\max\text{-task}}^{\text{SPT}} = C_n - p_n = \sum_{i=1}^{n-1} p_i$$ + +هذا هو مجموع أوقات معالجة جميع المهام الأخرى — أقصى تأخير ممكن لأي مهمة +فردية. ضمن أي جدول لا تكون فيه أكبر مهمة في الموضع الأخير، يكون +تأخيرها أقل بشكل قاطع. في المقابل، يمنح SPT أصغر مهمة تأخيرًا صفريًا +($\Delta_1^{\text{SPT}} = 0$). ينتقل عبء الانتظار بأكمله من المهام الصغيرة +إلى المهام الكبيرة. $\blacksquare$ + +يقلّل SPT التأخير *الإجمالي* (جيد للكفاءة الكلية) بتركيز التأخير على +المهام الأقدر على امتصاصه من حيث نسبة التباطؤ. لكن بالقيم المطلقة — +الساعات المنقضية في الانتظار — تتحمل أكبر مهمة العبء الكامل. + +### 4.4 ثبات الإنتاجية + +**المبرهنة 6 (ثبات الإنتاجية).** إجمالي العمل المنجز خلال أي أفق +زمني $T$ متطابق ضمن جميع سياسات الجدولة. + +**البرهان.** يعالج المنفّذ العمل بمعدل ثابت. خلال أي أفق +$T \ge \sum p_i$، إجمالي العمل المنجز هو تمامًا $\sum p_i$ بغض النظر عن +الترتيب. في حالة الاستقرار مع وصول مستمر للمهام، تتحدد الإنتاجية طويلة +الأمد بمعدل الخدمة $\mu$ وهي مستقلة تمامًا عن الجدولة: + +$$\lim_{T \to \infty} \frac{W(T)}{T} = \mu \quad \text{for all schedules } \sigma$$ + +$\blacksquare$ + +**النتيجة الطبيعية 6.1.** الفريق الذي ينتقل من أي سياسة جدولة إلى SPT +سيلاحظ تحسنًا في المتوسط غير المرجّح لوقت الإنجاز مع **صفر تغيير في +الإنتاجية الفعلية**. يتحسن المقياس. لا يتحسن الناتج. + +### 4.5 الأثر المركّب + +بالجمع بين المبرهنات 4 و5 و6: + +| المقياس | أثر تحسين المتوسط غير المرجّح | +|---------|--------------------------------------| +| الإنتاجية (عمل/وقت) | بلا تغيير (المبرهنة 6) | +| التأخير للمهام الصغيرة | مُقلَّص — يقترب من الصفر (SPT) | +| التأخير للمهام الكبيرة | **مُعظَّم** — يتحمل كامل عبء الانتظار (المبرهنة 5) | +| وقت إنجاز أكبر مهمة | **الحد الأقصى الممكن**: $\sum p_i$ (المبرهنة 4) | + +الأثر الصافي على الجودة المدركة سلبي لأن: + +1. **نفور الخسارة غير متماثل** [8]. العميل الذي تُؤجَّل مهمته ذات الـ 100 + ساعة يعاني من سلبية كبيرة وبارزة. العميل الذي تُعجَّل مهمته ذات + الساعة الواحدة يشعر بإيجابية صغيرة غالبًا ما تمر دون ملاحظة. + +2. **المهام عالية الجهد تترابط مع العملاء ذوي القيمة العالية.** المهام + الكبيرة يُرجَّح بشكل غير متناسب أن تأتي من عملاء رئيسيين أو عقود + معقدة أو احتياجات عمل حرجة. + +3. **التجويع يتراكم.** في نظام مستمر (المبرهنة 3)، قد تُؤجَّل المهام + الكبيرة **إلى أجل غير مسمى** مع استمرار وصول مهام صغيرة جديدة. + +**المبرهنة 7 (النتيجة الجوهرية).** بالنسبة لفريق يعالج مهامًا غير +متجانسة الحجم، فإن اعتماد المتوسط غير المرجّح لوقت الإنجاز كمقياس أداء: + +(أ) يوفر **صفر مكسب إنتاجي** (المبرهنة 6)، بينما +(ب) **يُسند أقصى وقت إنجاز ممكن** لأكبر مهمة (المبرهنة 4)، و +(ج) **يُركّز كامل تأخير الانتظار** على أكبر المهام مع إلغاء التأخير + عن أصغرها (المبرهنة 5). + +هذا ليس مفاضلة. المقياس يُنشئ نقلًا صِرفًا لجودة الخدمة من عملاء +الجهد العالي إلى عملاء الجهد المنخفض، دون أي عمل صافٍ مُكتسَب. +$\blacksquare$ + +--- + +# الجزء الثاني: أنظمة الأولويات + +## 5. الانهيار في ظل تصنيف الأولويات + +أثبتت الأقسام السابقة أن المتوسط غير المرجّح لوقت الإنجاز منحاز حين +تتفاوت المهام في الحجم. نُبيّن الآن أن إدخال **نظام أولويات** — كما +تفعل جميع الفرق تقريبًا في الواقع — يجعل المقياس ليس مجرد منحاز بل +**عدائيًا فعليًا** تجاه الأهداف المعلنة للمؤسسة. + +### 5.1 النموذج الموسّع: المهام ذات الأولوية + +لتكن لكل مهمة $i$ وقت معالجة $p_i$ وفئة أولوية +$q_i \in \{1, 2, 3, 4\}$ حيث 1 هي الأعلى أولوية (حرجة) و4 هي الأدنى +(تجميلية/تحسينية). نعيّن أوزان الأولوية: + +$$w(q) = \begin{cases} 8 & q = 1 \text{ (Critical)} \\ 4 & q = 2 \text{ (High)} \\ 2 & q = 3 \text{ (Medium)} \\ 1 & q = 4 \text{ (Low)} \end{cases}$$ + +الأوزان المحددة توضيحية؛ النتائج تنطبق لأي دالة أوزان تناقصية بشكل قاطع. +الخاصية الجوهرية هي أن الأولوية تُحدَّد بناءً على **الأثر التجاري**، +لا على حجم المهمة. + +### 5.2 المقياس يتناقض مع نظام الأولويات + +**المبرهنة 8 (انعكاس الأولوية-الحجم).** حين تكون الأولوية مستقلة عن +حجم المهمة، فإن الجدول الذي يقلّل المتوسط غير المرجّح لوقت الإنجاز +(SPT) سيُنجز، في القيمة المتوقعة، المهام منخفضة الأولوية قبل المهام +عالية الأولوية الأكبر حجمًا. + +**البرهان.** يرتّب SPT المهام تصاعديًا حسب $p_i$، بغض النظر عن $q_i$. +لنأخذ مهمتين: + +- المهمة A: $p_A = 40$ ساعة، $q_A = 1$ (حرجة — مثلًا، انقطاع الخادم) +- المهمة B: $p_B = 0.5$ ساعة، $q_B = 4$ (منخفضة — مثلًا، إصلاح تجميلي لواجهة المستخدم) + +يُجدوِل SPT المهمة B قبل A. المتوسط غير المرجّح لهذا الزوج: + +$$\bar{C}^{\text{SPT}} = \frac{0.5 + 40.5}{2} = 20.5 \qquad \bar{C}^{\text{priority}} = \frac{40 + 40.5}{2} = 40.25$$ + +يُعلن المقياس أن SPT **أفضل بما يقارب الضعف** — رغم إنجاز إصلاح تجميلي +بينما يحترق انقطاع الخادم. + +بصورة عامة، حين يكون $q_i$ مستقلًا إحصائيًا عن $p_i$، يكون ترتيب +SPT ذا **ارتباط صفري** مع الأولوية. عمليًا، المهام الحرجة (الانقطاعات، +الحوادث الأمنية، فقدان البيانات) غالبًا ما تتطلب عملًا أكثر من المهام +المنخفضة، لذا فالمقياس يبدو **مرتبطًا عكسيًا** مع نظام الأولويات. +$\blacksquare$ + +### 5.3 تدمير المعلومات + +يختزل المتوسط غير المرجّح مهمة ثلاثية الأبعاد $(p_i, q_i, C_i)$ إلى +إشارة أحادية البُعد ($C_i$)، ثم يحسب المتوسط بشكل منتظم. هذا يُلغي +الأولوية تمامًا ويعكس الحجم ضمنيًا. + +**المبرهنة 9 (تدمير المعلومات).** ليكن $I(\sigma)$ المعلومات المتبادلة +بين الترتيب الضمني للأولوية في الجدول (الموضع) والتعيين الفعلي للأولوية +$q_i$. بالنسبة لـ SPT: + +$$I(\sigma_{\text{SPT}}) = 0 \quad \text{when } p_i \perp q_i$$ + +**البرهان.** يعيّن SPT المواضع بناءً على $p_i$ فقط. حين يكون $p_i$ و +$q_i$ مستقلين، فإن معرفة موضع مهمة في جدول SPT لا توفر أي معلومات +عن أولويتها. $\blacksquare$ + +**النتيجة الطبيعية 9.1.** الفريق الذي يُحسّن المتوسط غير المرجّح لوقت +الإنجاز يُشغّل نظام جدولة لا يحمل أي معلومات عن تصنيف الأولوية الخاص +به. حقل الأولوية في نظام التذاكر الخاص بهم هو، فيما يتعلق بترتيب +التنفيذ، مجرد زخرفة. + +هذا مثال على ما يسميه Austin [18] المشكلة الأساسية للقياس الناقص: حين +يلتقط نظام القياس مجموعة فرعية فقط من الأبعاد ذات الصلة، فإن تحسين +القياس يُدهور بشكل منهجي الأبعاد غير المقاسة. + +### 5.4 تكلفة التأخير المرجّح بالأولوية + +نعرّف **تكلفة التأخير المرجّح بالأولوية** للجدول: + +$$D(\sigma) = \sum_{i=1}^{n} w(q_i) \cdot C_i$$ + +**المبرهنة 10 (SPT وتكلفة التأخير المرجّح بالأولوية).** الجدول الأمثل +لتقليل $D(\sigma)$ هو WSJF (Weighted Shortest Job First — أقصر مهمة +مرجّحة أولًا): الترتيب حسب $w(q_i)/p_i$ تنازليًا [1، 5]. ترتيب +SPT — حسب $1/p_i$ تنازليًا — يتجاهل الأولوية تمامًا وينتج $D$ أعلى +من البدائل المراعية للأولوية حين ترتبط الأولوية بحجم المهمة. + +**البرهان.** بحجة التبادل، تبديل المهمتين المتجاورتين $i, j$ يغيّر +$D$ بمقدار: + +$$\Delta D = w(q_j) \cdot p_i - w(q_i) \cdot p_j$$ + +يُحسّن التبادل $D$ حين $w(q_j)/p_j > w(q_i)/p_i$ لكن $j$ مجدوَلة بعد +$i$. لذا الترتيب الأمثل هو تناقص $w(q_i)/p_i$ — قاعدة WSJF. يتطابق +SPT مع WSJF فقط حين $w(q_i) = \text{const}$ (جميع المهام متساوية +الأولوية). + +**مثال.** حرجة ($w = 8$, $p = 3$) ومنخفضة ($w = 1$, $p = 2$): + +- SPT (المنخفضة أولًا): $D = 1 \cdot 2 + 8 \cdot 5 = 42$ +- WSJF (الحرجة أولًا): $D = 8 \cdot 3 + 1 \cdot 5 = 29$ + +يتكبّد SPT تأخيرًا مرجّحًا بالأولوية أعلى بنسبة 45%. عمليًا، تميل المهام +الحرجة لأن تكون أكبر (الانقطاعات، الحوادث الأمنية)، مما يجعل التباعد +منهجيًا. $\blacksquare$ + +--- + +## 6. الحلول المقترحة + +### 6.1 المقاييس المرجّحة بالأولوية + +استبدل المتوسط غير المرجّح لوقت الإنجاز بـ**درجة الإنجاز المرجّحة +بالأولوية (PWCS — Priority-Weighted Completion Score)**: + +$$\text{PWCS}(\sigma) = \frac{\sum_{i=1}^{n} w(q_i) \cdot \frac{C_i}{p_i}}{\sum_{i=1}^{n} w(q_i)}$$ + +هذا هو المتوسط المرجّح بالأولوية لنسبة التباطؤ. يقيس مدة انتظار كل مهمة +نسبةً إلى حجمها، مُوزَّنًا بمدى أهمية تلك المهمة. القيمة الأقل أفضل. + +**الخصائص:** + +1. **مراعاة الأولوية.** التأخير في المهام الحرجة يكلّف 8 أضعاف التأخير + في المهام المنخفضة. +2. **عدالة الحجم.** يستخدم نسبة التباطؤ $C_i / p_i$، فلا تُعاقَب المهام + الكبيرة لمجرد كونها كبيرة. +3. **غير قابل للتلاعب بواسطة SPT.** إعادة الترتيب حسب وقت المعالجة لا + تُحسّن الدرجة بشكل منهجي. +4. **يُختزَل إلى المتوسط غير المرجّح حين تكون المهام متجانسة.** تعميم + دقيق. + +### 6.2 السياسة المثلى: WSJF + +**المبرهنة 11.** الجدول الذي يقلّل وقت الإنجاز المرجّح بالأولوية +$\text{PWCT}(\sigma) = \sum w(q_i) \cdot C_i / \sum w(q_i)$ +(PWCT — Priority-Weighted Completion Time) +يُعالج المهام بترتيب تنازلي حسب $w(q_i)/p_i$ — قاعدة +**WSJF (Weighted Shortest Job First)** [1، 5]. + +**البرهان.** بحجة التبادل (كما في المبرهنة 10)، تبديل المهمتين +المتجاورتين $i, j$ يُحسّن PWCT حين $w(q_j)/p_j > w(q_i)/p_i$ لكن +$j$ مجدوَلة بعد $i$. لذا الترتيب الأمثل هو تناقص $w(q_i)/p_i$. +$\blacksquare$ + +ضمن فئة أولوية واحدة، يُختزَل هذا إلى SPT (الأقصر أولًا). عبر الفئات، +مهمة حرجة مدتها 4 ساعات ($w/p = 2.0$) تتقدم على مهمة منخفضة مدتها ساعة +واحدة ($w/p = 1.0$). + +**تحفظ عملي.** يمكن لـ WSJF الصرف أن يضع مهامًا صغيرة منخفضة الأولوية +قبل مهام حرجة كبيرة (مهمة منخفضة مدتها 15 دقيقة لها $w/p = 1/0.25 = 4.0$، +مما يتفوق على مهمة حرجة مدتها 6 ساعات بـ $w/p = 8/6 = 1.33$). عمليًا، +يُخفَّف هذا بفرض **ترتيب صارم لفئات الأولوية** وتطبيق WSJF فقط *ضمن* +كل فئة. + +### 6.3 مثال تطبيقي: مكتب خدمة تقنية المعلومات + +لنأخذ فريق تقنية معلومات لديه طابور التذاكر التالي: + +| التذكرة | الأولوية | النوع | الساعات المقدّرة | +|--------|----------|------|-----------| +| T1 | P1 (حرجة) | خادم البريد الإلكتروني معطّل | 6 | +| T2 | P2 (عالية) | فشل VPN لفريق العمل عن بُعد | 4 | +| T3 | P3 (متوسطة) | إعداد حاسوب محمول لموظف جديد | 2 | +| T4 | P4 (منخفضة) | تحديث سياسة خلفية سطح المكتب | 0.5 | +| T5 | P3 (متوسطة) | تثبيت ترخيص برنامج | 1 | +| T6 | P1 (حرجة) | فشل النسخ الاحتياطي لقاعدة البيانات | 3 | +| T7 | P2 (عالية) | أسطول الطابعات معطّل | 2 | +| T8 | P4 (منخفضة) | أرشفة مجلد قديم في محرك أقراص مشترك | 0.25 | + +**ترتيب SPT** (تحسين المتوسط غير المرجّح): T8, T4, T5, T3, T7, T6, T2, T1 + +| الموضع | التذكرة | الأولوية | الساعات | الإنجاز | التباطؤ | +|-----|--------|----------|-------|------------|----------| +| 1 | T8 (أرشفة مجلد) | P4 منخفضة | 0.25 | 0.25 | 1.0 | +| 2 | T4 (خلفية سطح المكتب) | P4 منخفضة | 0.5 | 0.75 | 1.5 | +| 3 | T5 (برنامج) | P3 متوسطة | 1 | 1.75 | 1.75 | +| 4 | T3 (حاسوب محمول) | P3 متوسطة | 2 | 3.75 | 1.875 | +| 5 | T7 (طابعات) | P2 عالية | 2 | 5.75 | 2.875 | +| 6 | T6 (نسخ احتياطي) | P1 حرجة | 3 | 8.75 | 2.917 | +| 7 | T2 (VPN) | P2 عالية | 4 | 12.75 | 3.188 | +| 8 | T1 (بريد إلكتروني) | P1 حرجة | 6 | 18.75 | 3.125 | + +**WSJF العملي** (الأولوية أولًا بين الفئات، SPT ضمن الفئة): + +| الموضع | التذكرة | الأولوية | الساعات | الإنجاز | +|-----|--------|----------|-------|------------| +| 1 | T6 (نسخ احتياطي) | P1 حرجة | 3 | 3 | +| 2 | T1 (بريد إلكتروني) | P1 حرجة | 6 | 9 | +| 3 | T7 (طابعات) | P2 عالية | 2 | 11 | +| 4 | T2 (VPN) | P2 عالية | 4 | 15 | +| 5 | T5 (برنامج) | P3 متوسطة | 1 | 16 | +| 6 | T3 (حاسوب محمول) | P3 متوسطة | 2 | 18 | +| 7 | T8 (أرشفة) | P4 منخفضة | 0.25 | 18.25 | +| 8 | T4 (خلفية سطح المكتب) | P4 منخفضة | 0.5 | 18.75 | + +**المقارنة:** + +| المقياس | SPT | WSJF العملي | الأفضل | +|--------|-----|----------------|--------| +| متوسط الإنجاز غير المرجّح | **6.56 ساعة** | 13.63 ساعة | SPT | +| متوسط وقت حل P1 | 13.75 ساعة | **6 ساعات** | WSJF | +| متوسط وقت حل P2 | 9.25 ساعة | **13 ساعة** | SPT | +| وقت إصلاح خادم البريد | 18.75 ساعة | **9 ساعات** | WSJF | +| وقت إصلاح النسخ الاحتياطي لقاعدة البيانات | 8.75 ساعة | **3 ساعات** | WSJF | +| وقت تحديث خلفية سطح المكتب | **0.75 ساعة** | 18.75 ساعة | SPT | + +أوقات الإنجاز الإجمالية المرجّحة بالأولوية متقاربة جدًا +(PWCT: 10.2 مقابل 10.17) لأن التجميع يُخفي الضرر التوزيعي. +الفرق الحقيقي يظهر في التوزيع **لكل فئة أولوية**: خادم البريد الإلكتروني +معطّل لمدة 18.75 ساعة ضمن SPT مقابل 9 ساعات ضمن WSJF. النسخ الاحتياطي +لقاعدة البيانات يفشل لمدة 8.75 ساعة مقابل 3 ساعات. + +يُبلّغ المقياس غير المرجّح بثقة أن SPT **أكثر كفاءة بأكثر من الضعف** +(6.56 مقابل 13.63)، مكافئًا الفريق الذي حدّث خلفية سطح المكتب بينما +كان خادم البريد الإلكتروني يحترق. + +### 6.4 حزمة المقاييس الموصى بها + +حتى المقاييس الإجمالية المرجّحة بالأولوية يمكن أن تفشل في التمييز بين +الجداول الجيدة والسيئة، لأن التجميع يُخفي الضرر التوزيعي. لا يكفي مقياس +واحد. نظام القياس المتكامل يجب أن يتتبع: + +| المقياس | ما يقيسه | الصيغة | +|--------|-----------------|---------| +| **متوسط الإنجاز لكل فئة أولوية** | الاستجابة لكل فئة | $\bar{C}$ مُصفَّى حسب $q$ | +| **متوسط وقت حل P1** | الاستجابة للحوادث الحرجة | $\bar{C}$ لـ $q = 1$ | +| **الإنتاجية** | القدرة الخام على العمل | ساعات العمل المنجزة / الوقت التقويمي | +| **انتهاكات التقادم** | منع التجويع | المهام التي تتجاوز SLA حسب الأولوية | +| **أقصى وقت إنجاز (P1/P2)** | أسوأ استجابة حرجة | $\max(C_i)$ لـ $q \le 2$ | + +الرؤية الجوهرية: **المقاييس لكل فئة أولوية** تكشف إخفاقات الجدولة التي +تُخفيها المقاييس الإجمالية. + +--- + +# الجزء الثالث: الديناميكيات المؤسسية + +## 7. حين يصبح المقياس هو المنتج + +تفترض الأقسام 2–6 أن رضا العميل دالة في *جودة الخدمة المُعايَشة*. لكن +هناك سيناريو يفشل فيه هذا الافتراض وتنهار الحجة بأكملها. + +### 7.1 المقياس ذاتي المرجعية + +لنفترض أن مقدّم الخدمة يُبلّغ العميل بالمتوسط غير المرجّح مباشرة — عبر +لوحة معلومات، أو تقرير SLA، أو صفحة تسويقية — وأن رضا العميل مشتق +أساسًا من *هذا الرقم*: + +$$U_{\text{client}} = f\!\left(\bar{C}(\sigma)\right), \quad f' < 0$$ + +ضمن هذا النموذج، يُعظّم SPT رضا العميل فعلًا (المبرهنة 1). +الإنتاجية لم تتغير (المبرهنة 6). النتيجة التجارية تتحسن: نفس العمل +المنجز، عميل أسعد. + +**كل مبرهنة في هذه الورقة تبقى صحيحة رياضيًا. لكن الاستنتاج ينعكس.** +المقياس لم يعد وكيلًا يمكن التلاعب به — إنه *هو* جودة الخدمة، لأن +العميل وافق على تقييم الجودة بناءً على الرقم الإجمالي. + +### 7.2 الاقتصاديات + +هذا يُنشئ توازنًا متسقًا ومستقرًا: + +| الفاعل | السلوك | النتيجة | +|-------|----------|---------| +| مقدّم الخدمة | يُحسّن المتوسط غير المرجّح (SPT) | يتحسن المقياس، بلا عمل إضافي | +| العميل | يقرأ لوحة المعلومات، يرى متوسطًا منخفضًا | يُبلّغ عن رضاه | +| الإدارة | ترى عميلًا راضيًا + مقياسًا جيدًا | تكافئ الفريق | + +يستخلص مقدّم الخدمة الرضا بتكلفة هامشية صفرية، بتحسين رقم قَبِلَه +العميل كوكيل عن الجودة. + +### 7.3 الهشاشة + +هذا التوازن مستقر فقط ما دام العميل لا يتفحص تجربته الخاصة. ينكسر حين: + +1. **يتحقق العميل من تذكرته الخاصة.** مدير تقني كان خادم بريده الإلكتروني + معطلًا لمدة 18.75 ساعة لن يطمئن بعبارة "متوسط الحل: 6.56 ساعة." + العملاء الأكثر احتمالًا للتفحص هم بالضبط الذين يتلقون أسوأ خدمة + (المبرهنة 4). + +2. **يقدّم منافس اتفاقيات SLA لكل تذكرة.** "حل P1 خلال 4 ساعات" يتفوق + على "متوسط الحل أقل من 7 ساعات" لأي عميل لديه احتياجات حرجة. + +3. **يستبطن الفريق المقياس.** إذا آمن الفريق بأن المقياس يعكس الأداء + الحقيقي، يفقدون القدرة على التعرف على إهمال العمل الحرج. يصبح المقياس + خطرًا معرفيًا. + +### 7.4 النمط العام + +هذا النمط — الوكيل يحل محل الجودة، الوكيل يُحسَّن، الجودة تتباعد، +النظام مستقر حتى تختبره الواقعية — يتكرر عبر المجالات. وثّق +Muller [19] هذا على نطاق واسع باعتباره "هوس المقاييس"؛ وصاغ +Campbell [24] الأثر المُفسد لاستخدام المؤشرات كأهداف. + +| المجال | المقياس الوكيل | الجودة الأساسية | التباعد | +|--------|-------------|-------------------|------------| +| الدعم التقني | متوسط وقت الحل | وقت تشغيل الأنظمة الحرجة | الخادم معطّل 19 ساعة، المتوسط يقول 6.5 | +| التعليم | درجات الاختبارات | التعلم الفعلي | التدريس للاختبار | +| الرعاية الصحية | إنتاجية المرضى | نتائج المرضى | تخريج أسرع، إعادة دخول أعلى | +| المالية | الأرباح الفصلية | القيمة طويلة الأمد | خفض التكاليف يرفع ربحية السهم ويآكل القدرة | +| البرمجيات | السرعة (نقاط القصة) | جودة المنتج | تضخم النقاط، ميزات غير مكتملة | + +### 7.5 عدم تماثل المعلومات + +نمذج النظام كلعبة بين مقدّم الخدمة (P) والعميل (C). يلاحظ P القيم +الفردية $\{C_i\}$ ويختار $\sigma$؛ يلاحظ C فقط $\bar{C}(\sigma)$. +هذه مشكلة **خطر أخلاقي** [10]: الاستراتيجية المثلى لـ P هي تقليل +الإشارة المرصودة بغض النظر عن التوزيع غير المرصود. + +التوازن هو **توازن تجميعي** [9]: المقياس المُبلَّغ من P يبدو متطابقًا +بغض النظر عن الأداء الأساسي المرجّح بالأولوية. وهو مستقر حتى يحصل C +على الوصول إلى قيم $C_i$ الفردية — عبر بوابة عملاء، أو شفافية منافس، +أو حادثة مؤلمة بما يكفي. + +### 7.6 الاستنتاج المُقلق + +الإجابة الصادقة على "هل تحسين المتوسط غير المرجّح يضر بالأعمال؟" هي: +**ليس بالضرورة، ما دام العميل لا ينظر خلف الرقم**. والإجابة الصادقة +على "هل هذا مستدام؟" هي: إنه مستدام بالقدر الذي يستدام به أي نظام +يعرف فيه البائع أكثر من المشتري — مستقر لفترات طويلة، ثم انهيار سريع +حين يُثقَب عدم التماثل. + +--- + +## 8. التكلفة النفسية للمعرفة + +نمذج القسم 7 مقدّم الخدمة ككيان واحد. لكن الفرق تتكون من أفراد. حين +يفهم عضو الفريق البرهان — حين *يعلم* أن المقياس اصطناعي، وأن لوحة +المعلومات مسرح، وأن خادم البريد الإلكتروني لا يزال معطلًا بينما يُغلقون +تذاكر خلفية سطح المكتب — تظهر تكلفة جديدة أغفلها نموذج التوازن. + +### 8.1 المتغير الخفي: وعي الفريق + +| الفاعل | يلاحظ $C_i$ الفردية | يلاحظ $\bar{C}$ | يفهم البرهان | +|-------|--------------------------|--------------------|-----------------------| +| الإدارة | ربما | نعم | متفاوت | +| عضو الفريق | **نعم** | نعم | **نعم** (في هذا السيناريو) | +| العميل | لا | نعم | لا | + +يمتلك عضو الفريق معلومات كاملة. يرى طابور التذاكر. يعلم أن خادم البريد +الإلكتروني معطّل منذ السابعة صباحًا. يعلم أنه يُغلق تذكرة خلفية سطح +المكتب لأنها تُحسّن الرقم. ويعلم *لماذا*. + +### 8.2 التنافر المعرفي في ظل المعلومات الكاملة + +ينشأ التنافر المعرفي [11] حين يحمل الفرد إدراكات متناقضة. دون فهم +*السبب*، يمكن تبرير التناقض: "الإدارة تعرف الأفضل." فهم البرهان يُزيل +الغموض. يحمل عضو الفريق الآن: + +- **الإدراك أ:** "أنا متخصص كفء. وظيفتي حل المشكلات المهمة." +- **الإدراك ب:** "أنا أُغلق تذكرة خلفية سطح المكتب بينما خادم البريد + الإلكتروني معطّل، لأن المقياس منحاز رياضيًا (المبرهنة 1)، وإعادة + الترتيب لا تنتج أي إنتاجية (المبرهنة 6)، والمستفيد الوحيد هو لوحة + المعلومات (القسم 7). ويمكنني إثبات ذلك." + +التنافر أصبح الآن *حاملًا للحِمل*. الحلول المتاحة — التخلي عن الهوية +المهنية، أو رفض البرهان، أو الدعوة إلى التغيير، أو المغادرة — كل منها +يفرض تكاليف لم تكن موجودة من قبل. + +### 8.3 نظرية تقرير المصير: ثلاث حاجات مُنتهَكة + +حدّد Deci وRyan في نظرية تقرير المصير (SDT — Self-Determination Theory) +[12، 13] ثلاث حاجات تتنبأ بالدافعية الذاتية: + +**الاستقلالية.** يقيّد المقياس الخيارات بطريقة يعلم عضو الفريق أنها +دون المستوى الأمثل رياضيًا. العامل الذي يفهم أن العملية مُعاكِسة للإنتاجية +بشكل مُبرهَن لا يمكنه الشعور بالاستقلالية في اتباعها. + +**الكفاءة.** يكافئ المقياس الفعالية *الظاهرية* (انخفاض $\bar{C}$) بينما +هو ثابت تجاه الفعالية *الحقيقية* (المبرهنة 6). الكفاءة الحقيقية — إصلاح +خادم البريد الإلكتروني أولًا — *يُعاقَب* عليها المقياس. + +**الانتماء.** يعلم عضو الفريق أن خادم بريد العميل معطّل. يمكنه المساعدة. +لكنه بدلًا من ذلك يُحدّث خلفية سطح المكتب — ليس لأن ذلك يُفيد أحدًا، بل +لأنه يُفيد رقمًا. الصلة بين العمل والأثر الإنساني قد قُطعت، وعضو الفريق +يرى الأطراف المقطوعة. + +### 8.4 الأذى الأخلاقي + +الأذى الأخلاقي (moral injury) [16، 17] هو الضرر الدائم الناجم عن +"ارتكاب، أو العجز عن منع، أو الشهادة على، أو التعلم عن أفعال تنتهك +معتقدات أخلاقية راسخة" [17]. ومُدّ هذا المفهوم منذ ذلك الحين إلى +بيئات الأعمال [25]. التمييز الجوهري عن الاحتراق النفسي: **الاحتراق +النفسي هو إنهاك من فعل الكثير. الأذى الأخلاقي هو ضرر من فعل الشيء +الخاطئ.** + +عضو الفريق الذي يعلم أن خادم البريد الإلكتروني معطّل، ويعلم أنه يجب +إصلاحه، ويُغلق تذكرة خلفية سطح المكتب بدلًا من ذلك، ويفعل ذلك لأن +المقياس يتطلبه، يعاني من الشروط الهيكلية للأذى الأخلاقي. + +### 8.5 العجز المكتسب وقدرية المقاييس + +يصف العجز المكتسب لسيليغمان [14، 15] كيف يؤدي التعرض لنتائج سلبية +لا يمكن السيطرة عليها إلى السلبية. التسلسل: + +1. المقياس معيب (البرهان مفهوم). +2. الدعوة إلى التغيير. +3. الرفض ("الأرقام جيدة، لا تُثِر المشاكل"). +4. التكرار بقناعة متناقصة. +5. الحالة النهائية: "المقياس هو ما هو. سأُغلق التذاكر فحسب." + +هذا ليس كسلًا. إنه الاستجابة العقلانية لنظام يُعاقب السلوك الصحيح +ويُكافئ السلوك الخاطئ، حين يفتقر الفرد إلى القدرة على تغيير النظام. + +### 8.6 لولب الانتقاء العدائي + +بالجمع بين توازن القسم 7 وديناميكية الدوران الوظيفي: + +1. تتبنى المؤسسة المتوسط غير المرجّح. يبدو المقياس جيدًا (SPT). +2. أعضاء الفريق الواعون والأكفاء يعانون من تكاليف نفسية (8.2–8.5). +3. يغادر هؤلاء الأعضاء. يُستبدَلون بأعضاء لا يفهمون عيوب المقياس أو + لا يبالون. +4. يستمر المقياس في الظهور بشكل جيد — فهو دائمًا كذلك ضمن SPT، بغض + النظر عن كفاءة الفريق (النتيجة الطبيعية 6.1). +5. تتدهور جودة الخدمة الفعلية، لكن المقياس لا يستطيع اكتشاف ذلك + (النتيجة الطبيعية 9.1). +6. العودة إلى الخطوة 1. + +يُنتقي المقياس *ضد* الأشخاص الذين سيُحسّنون النظام و*لصالح* الأشخاص +الذين لن يتحدوه. يستقر النظام عند مستوى أدنى من الكفاءة، غير مرئي +لجهاز القياس الخاص به. + +### 8.7 نموذج التكلفة الكامل + +| القسم 7 (مرئي) | القسم 8 (مخفي) | +|---------------------|---------------------| +| العميل راضٍ (رقم جيد) | الفريق غير راضٍ (واقع سيئ) | +| الإنتاجية لم تتغير | الجهد التقديري مسحوب | +| المقياس يتحسن | الأعضاء الأكفاء يغادرون | +| اقتصاد الأعمال مستقر | الكفاءة المؤسسية تتدهور | + +هذه تعمل على مقاييس زمنية مختلفة: التوازن مرئي فصليًا؛ تدهور الكفاءة +مرئي على مدى سنوات. النموذج الكامل هو: **المقياس يعمل، وهو مُدمِّر، +والتدمير غير مرئي للمقياس.** المقياس طلاء جديد على حديد تسليح متآكل. + +--- + +## 9. استبطان المدير: الحل القابل للتنفيذ + +تقول الأقسام 2–6 ارفض المقياس. يقول القسم 7 المقياس يعمل (للأعمال). +يقول القسم 8 إنه يُدمّر الفريق. عمليًا، لا يستطيع معظم المديرين تغيير +المقياس من جانب واحد. الحل الأفضل هو إصلاح المقاييس على مستوى الشركة. +الحل *القابل للتنفيذ* هو ما يمكن لمدير واحد مطّلع أن يفعله الآن. + +### 9.1 الاستراتيجية + +يمكن للمدير الذي يفهم البرهان أن **يستبطن قيود المقياس دون نقلها إلى +الفريق**: + +1. **الجدولة أساسًا حسب الأولوية.** يعمل الفريق على المهام الحرجة أولًا. +2. **إدراج المهام الصغيرة تكتيكيًا.** حين يمكن إنجاز مهمة صغيرة منخفضة + الأولوية دون تأخير جوهري للعمل عالي الأولوية، أنجزها. ليس لأن المقياس + يتطلب ذلك، بل لأنها تحتاج أيضًا إلى الإنجاز وتكلفتها شبه معدومة. +3. **عدم كشف المقياس كدافع أبدًا.** "أنجز هذه المهمة السريعة بينما ننتظر + رد البائع على الـ P1" — وليس "نحتاج إلى خفض متوسطنا." تبقى الدافعية + الذاتية للفريق سليمة (القسم 8). يتحمل المدير عبء إدارة المقياس. + +### 9.2 الصياغة الرسمية + +مشكلة المدير هي تحسين مقيّد: + +$$\min_{\sigma} \sum_{i=1}^{n} w(q_i) \cdot C_i \quad \text{subject to} \quad \bar{C}(\sigma) \le \bar{C}_{\text{target}}$$ + +**المبرهنة 12 (التكلفة المحدودة للمقياس في جدولة الأولوية).** المدير +الذي يستخدم SPT *ضمن* كل فئة أولوية وترتيب الأولوية *بين* الفئات سينتج +مقياسًا قريبًا من القيمة المثلى لـ SPT — الفجوة تنشأ فقط من الانعكاسات +بين الفئات. + +**مخطط البرهان.** ضمن كل فئة أولوية، SPT مجاني (جميع المهام لها نفس +الأولوية). الانحراف الوحيد عن SPT الشامل هو الترتيب بين الفئات. كل +انعكاس بين فئتين يكلّف على الأكثر $p_{\text{large}} - p_{\text{small}}$ +في المجموع غير المرجّح، وهذه الانعكاسات محدودة بعدد الفئات. عمليًا، +الفجوة تكون عادة ضمن 10–20% من المستوى الأمثل لـ SPT. $\blacksquare$ + +### 9.3 المدير كحاجز معلوماتي + +| الطبقة | يرى المقياس | يرى الأولويات | يرى البرهان | +|-------|-----------|----------------|------------| +| المؤسسة | نعم | اسميًا | لا | +| المدير | نعم | نعم | **نعم** | +| الفريق | لا (محميّ) | نعم | غير ذي صلة | +| العميل | نعم (لوحة المعلومات) | عبر SLA | لا | + +المدير هو الفاعل الوحيد الذي يحمل المعلومات الثلاث جميعها. هذا ليس +تلاعبًا — إنه يقوم بالعمل الصحيح بالترتيب الصحيح، ويصادف أن المقياس +مقبول لأن SPT ضمن الفئة مجاني. + +### 9.4 الانهيار التنافسي + +تفشل هذه الاستراتيجية حين يصبح المقياس **تنافسيًا بين الفرق**. + +**الحالة 1: تعاونية** — الفرق تُقاس للتكافؤ لا للترتيب. يستخدم كل مدير +استراتيجية الاستبطان بشكل مستقل. المقياس زخرفي لكنه غير ضار. هذه **لعبة +تنسيق** بتوازن تعاوني مستقر. + +**الحالة 2: تنافسية** — الفرق تُرتَّب حسب $\bar{C}$. هذه **معضلة السجين**: + +| | الفريق ب: الأولوية أولًا | الفريق ب: SPT | +|---|---|---| +| **الفريق أ: الأولوية أولًا** | (عمل جيد، عمل جيد) | (أ يبدو سيئًا، ب يبدو جيدًا) | +| **الفريق أ: SPT** | (أ يبدو جيدًا، ب يبدو سيئًا) | (كلاهما يبدو جيدًا، كلاهما يقوم بالعمل الخاطئ) | + +توازن Nash هو (SPT، SPT). استراتيجية الاستبطان توازن تعاوني **غير مستقر +في ظل المنافسة**. + +### 9.5 النطاق + +| الشرط | القابلية | +|-----------|-----------| +| المقياس يُستخدم للفحص الصحي / التكافؤ | **قابلة للتطبيق** | +| المقياس مرئي لكنه غير مُرتَّب | **قابلة للتطبيق** | +| المقياس مُرتَّب عبر الفرق | **هشة** — تتطلب تعاون جميع المديرين | +| المقياس مربوط بالتعويضات / الموارد | **غير قابلة للتطبيق** — تُهيمن معضلة السجين | +| إصلاح المقياس ممكن على مستوى المؤسسة | **غير ضرورية** — أصلح المقياس بدلًا من ذلك | + +**الحل الأفضل هو على مستوى الشركة. الحل القابل للتنفيذ هو مدير يفهم هذا +البرهان، ويحمي فريقه من المقياس، ويُجدوِل حسب الأولوية، ويستخدم SPT +فقط ضمن فئات الأولوية لإبقاء الرقم معقولًا.** + +--- + +# الجزء الرابع: التقييم + +## 10. محامي الشيطان + +تتطلب الأمانة الفكرية الاعتراف بحدود الحجة. + +### 10.1 للبساطة قيمة حقيقية + +**الحجة.** لا يتطلب المتوسط غير المرجّح أوزان أولوية أو تقديرات لحجم +المهام أو معايرة. + +**التقييم: صحيح.** لكن المقياس غير المرجّح لا يتجنب الافتراضات — بل +*يُخفيها* بتعيين ضمني لجميع الأوزان بـ 1 وجميع الأحجام بـ 1. تقدير +معروف عدم دقته لحجم المهمة لا يزال أكثر إفادة من الافتراض الضمني بأن +جميع الأحجام متساوية. + +### 10.2 تقليل عدد الأشخاص المنتظرين + +**الحجة.** يقلّل SPT إجمالي ساعات-الشخص المنقضية في الانتظار. إذا كانت +كل مهمة تمثل عميلًا واحدًا، فهذا هو الأمثل. + +**التقييم: صحيح رياضيًا.** إذا كنت تُدير مركز خدمة حكومية ووقت كل +شخص متساوي القيمة، فإن SPT هو السياسة الصحيحة. ينهار هذا حين لا تكون +المهام بنسبة 1:1 مع العملاء، أو تكلفة الانتظار غير منتظمة، أو يُستخدم +المقياس لتقييم الفرق بدلًا من خدمة طابور حرفي. + +### 10.3 SPT كأسلوب فرز + +**الحجة.** حين تتجمع أحجام المهام بشكل ضيق، يقترب SPT من FIFO ويقترب +المتوسط غير المرجّح من المتوسط المرجّح. + +**التقييم: صحيح.** معامل التباين $CV = \sigma_p / \bar{p}$ يحدد شدة التشوه: + +| $CV$ | توزيع أحجام المهام | التشوه | +|------|----------------------|------------| +| < 0.3 | ضيق (مركز اتصال) | لا يُذكر | +| 0.3 – 1.0 | معتدل (تقنية معلومات مختلطة) | معتدل | +| > 1.0 | واسع (طابور تقنية معلومات نموذجي) | شديد | + +مكتب تقنية معلومات نموذجي يمتد من 15 دقيقة إلى أكثر من 40 ساعة +($CV > 2$). التشوه ليس حالة حدّية — إنه الوضع الافتراضي. + +### 10.4 التلاعب يتطلب سوء نية + +**الحجة.** تُظهر المبرهنات أن المقياس *يمكن* التلاعب به، لا أنه *سيتم* +التلاعب به. + +**التقييم: هذه هي أقوى حجة مضادة.** إذا كان المقياس معلوماتيًا بحتًا ولا +يؤثر على السلوك أبدًا، فإن حافز التلاعب غائب. لكن أي مقياس يُبلَّغ +للإدارة، أو يُربط بالأهداف الرئيسية، أو يُناقش في المراجعات سيؤثر على +السلوك. هذا قانون Goodhart [6، 7] — وهو ينطبق على الفرق حسنة النية +بنفس موثوقية انطباقه على الفرق المتشككة. الانحراف يحدث عضويًا: إغلاق +ثلاث تذاكر سهلة "يُشعر بالإنتاجية" بينما المقياس يُصدّق على هذا الشعور. + +### 10.5 متى يكون المتوسط غير المرجّح مبررًا + +يكون المقياس مبررًا **فقط حين تتحقق الشروط الأربعة جميعها**: + +1. أحجام المهام متجانسة تقريبًا ($CV < 0.3$) +2. لا تمايز في الأولوية (جميع المهام متساوية الأهمية) +3. كل مهمة تمثل عميلًا واحدًا بالضبط +4. لا يُستخدم المقياس للتقييم أو المكافأة أو توجيه السلوك + +نادرًا ما تتحقق هذه الشروط في الأنظمة التي يُستخدم فيها المقياس بشكل +أكثر شيوعًا. + +--- + +## 11. الأعمال ذات الصلة + +تقع هذه الورقة عند تقاطع عدة أدبيات لم تُربَط ببعضها من قبل. + +### 11.1 نظرية الجدولة والعدالة + +أسّس Smith [1] نتيجة أمثلية SPT وقاعدة WSJF عام 1956. قدّم +Conway وMaxwell وMiller [2] المعالجة الشاملة في كتابهم المرجعي. نوقشت +عدالة سياسات الجدولة القائمة على الحجم في جدولة أنظمة الحاسوب: حقق +Bansal وHarchol-Balter [22] في ظلم SRPT؛ وصاغ +Wierman وHarchol-Balter [23] تصنيفات العدالة مقارنة بالمشاركة المعالِجية +(Processor-Sharing)؛ وقاس Angel وBampis وPascual [21] جودة جدول SPT +مقابل معايير الأمثلية العادلة. + +هذه الأعمال السابقة تُحلل العدالة في جدولة المعالج والخوادم. تُطبّق +الورقة الحالية النتائج الرياضية ذاتها على *إدارة المهام المؤسسية*، حيث +"المُجدوِل" فريق بشري، و"الأعمال" طلبات عملاء ذات أولويات أثر تجاري، +و"دالة الهدف" مقياس إداري. الآلية متطابقة؛ النتائج تختلف لأن الجدولة +المؤسسية تتضمن أنظمة أولويات وعلاقات عملاء وتكاليف نفسية لا تتضمنها +جدولة المعالج. + +### 11.2 الخلل القياسي + +أثبت Austin [18] أن القياس الناقص — قياس مجموعة فرعية فقط من الأبعاد ذات +الصلة — يخلق حوافز لتحسين الأبعاد المقاسة على حساب الأبعاد غير المقاسة، +وأن هذا التأثير ليس ممكنًا فحسب بل *حتمي* حين يُربط القياس بالمكافآت. +يتوازى إطاره لعدم تماثل المعلومات بشكل وثيق مع القسم 7. تقدم الورقة +الحالية الآلية الرياضية المحددة (المبرهنتان 1–2) لحالة جدولة المهام، +وتمدّ الحجة عبر علم النفس (القسم 8) لرسم السلسلة الكاملة للأذى المؤسسي. + +وثّق Muller [19] "هوس المقاييس" عبر التعليم والرعاية الصحية والشرطة +والمالية، مقدّمًا أدلة تجريبية واسعة للأنماط المنظَّرة في القسم 7.4. +صاغ Campbell [24] الأثر المُفسد لاستخدام المؤشرات كأهداف، مكمّلًا +ملاحظة Goodhart الأصلية [6] وتعميم Strathern [7]. + +وثّق Bevan وHood [26] تجريبيًا سلوكيات التلاعب في نظام الصحة العامة +الإنجليزي — بما في ذلك الأنماط ذاتها من "إصابة الهدف وتفويت المغزى" +الموصوفة في القسم 5.2. + +### 11.3 التكاليف النفسية للخلل القياسي + +تطبيق الأذى الأخلاقي (Shay [16]، Litz وآخرون [17]) على بيئات الأعمال +له سابقة حديثة: دراسة 2024 في *Journal of Business Ethics* [25] مدّدت +المفهوم صراحة إلى أماكن العمل الربحية، ووجدت شروطًا هيكلية مشابهة لتلك +الموصوفة في القسم 8.4. حلّل Moore [27] الانفصال الأخلاقي (moral +disengagement) — إعادة الهيكلة المعرفية التي تُمكّن السلوك غير الأخلاقي +تحت الضغط المؤسسي. تعالج الورقة الحالية الظاهرة المكمّلة: الأذى الذي +يلحق بالأفراد الذين *يرفضون* الانفصال. + +### 11.4 ما هو جديد + +المكوّنات الفردية — أمثلية SPT، قانون Goodhart، الخلل القياسي، الأذى +الأخلاقي — لها سوابق. إسهامات هذه الورقة هي: + +1. **قانون الحفظ (المبرهنة 2) مُستخدَمًا وصفيًا** — كحجة بنّاءة بأن + وقت الإنجاز المرجّح بالعمل *لا يمكن* التلاعب به، بدلًا من كونه + نتيجة نظرية في الجدولة. + +2. **البرهان المحدد بأن فئات الأولوية تجعل المقياس عدائيًا جبريًا** + (المبرهنتان 8–9) — ليس سيئًا تجريبيًا فحسب بل متناقض هيكليًا، + بمعلومات متبادلة صفرية بين الجدول ونظام الأولويات. + +3. **السلسلة المتكاملة** من البرهان الرياضي عبر عدم تماثل المعلومات عبر + الأذى النفسي عبر لولب الانتقاء العدائي — تتبّع مقياسًا واحدًا من + Smith (1956) إلى التفريغ المؤسسي. + +4. **استراتيجية استبطان المدير** (القسم 9) مع تحليل نظري ألعابي رسمي + لاستقرارها وشروط انهيارها في ظل المنافسة بين الفرق. + +5. **تطبيق نظرية الجدولة على نقد الإدارة المؤسسية** — إثبات أن مقياسًا + شائع الاستخدام للفرق له أمراض محددة وقابلة للقياس بدلًا من المحاجّة + من الحكاية أو المبدأ العام. + +--- + +## 12. الخاتمة + +المتوسط غير المرجّح لوقت الإنجاز **إحصائية منحازة** إذ إنه: + +1. **قابل للتلاعب** بسياسة الجدولة (المبرهنة 1)، على عكس وقت الإنجاز + المرجّح بالعمل الثابت بغض النظر عن الجدولة (المبرهنة 2). +2. **يُحفّز تجويع** المهام الكبيرة (المبرهنة 3). +3. **يُدهور رضا العملاء** دون أي مكسب إنتاجي تعويضي (المبرهنة 7). +4. **يتناقض فعليًا مع أنظمة الأولويات** بعدم حمله أي معلومات عن تصنيف + الأثر التجاري (المبرهنة 9). +5. **يتجاهل الأولوية تمامًا** في توصية الجدولة الخاصة به، منتجًا تأخيرًا + دون المستوى الأمثل مرجّحًا بالأولوية كلما لم تكن الأولوية والحجم + مرتبطين عكسيًا بشكل تام (المبرهنة 10). + +المقياس الذي يمكن تحسينه بإعادة ترتيب العمل — دون أداء أي عمل إضافي — +يقيس سياسة الجدولة لا قدرة النظام. وحين يُدمج مع نظام أولويات، يوصي +بالجدول الذي يُلحق أكبر ضرر بالعمل الأعلى أولوية. + +حين يُبلَّغ العميل بالمقياس، يُنشئ عدم تماثل معلوماتي (القسم 7) توازنه +التجاري مربح لكنه هش. وحين يفهم أعضاء الفريق عيوبه، ينتهك دافعيتهم +الذاتية وينتقي لمغادرة أكفأ الأشخاص (القسم 8). يمكن لمدير واحد مطّلع +أن يخفف هذه الآثار جزئيًا عبر التحسين المقيّد (القسم 9)، لكن هذه +الاستراتيجية التعاونية غير مستقرة في ظل المنافسة بين الفرق. + +المتوسط غير المرجّح مبرر فقط في ظل شروط ضيقة (القسم 10.5): أحجام مهام +متجانسة، بلا أولويات، ربط مهمة-عميل بنسبة 1:1، وبلا تأثير سلوكي. +نادرًا ما تتحقق هذه الشروط. + +**المتوسط غير المرجّح لوقت الإنجاز ليس مقياسًا عادلًا أو دقيقًا لأداء +تنفيذ المهام. سيُنتج اعتماده كمقياس للفريق بصورة عقلانية تجويعًا للعمل +المعقد، وانتهاكًا للأولويات المعلنة، ونتائج غير منصفة للعملاء، ووهم +الإنتاجية حيث لا وجود لها.** + +الحل الأفضل هو إصلاح المقاييس على مستوى المؤسسة. الحل القابل للتنفيذ +هو مدير يفهم هذا البرهان. + +--- + +## المراجع + +### نظرية الجدولة + +[1] Smith, W. E. (1956). Various optimizers for single-stage production. +*Naval Research Logistics Quarterly*, 3(1–2), 59–66. +doi:[10.1002/nav.3800030106](https://doi.org/10.1002/nav.3800030106) + +> أصل نتيجة أمثلية SPT (المبرهنة 1)، وقاعدة وقت الإنجاز المرجّح +> $w_i/p_i$ تنازليًا (WSJF، المبرهنة 11)، وتقنية برهان التبادل الثنائي +> للمهام المتجاورة (حجة التبادل) المستخدمة في جميع أنحاء الورقة. + +[2] Conway, R. W., Maxwell, W. L., & Miller, L. W. (1967). *Theory of +Scheduling*. Addison-Wesley. + +> المعالجة المرجعية القياسية لنظرية جدولة الآلة الواحدة، توسّع نتائج +> Smith. + +[3] Little, J. D. C. (1961). A proof for the queuing formula: L = λW. +*Operations Research*, 9(3), 383–387. +doi:[10.1287/opre.9.3.383](https://doi.org/10.1287/opre.9.3.383) + +> أول برهان صارم لقانون Little. مُشار إليه في القسم 3.2 للسياق في +> نظرية الطوابير. + +[4] Little, J. D. C. (2011). Little's Law as viewed on its 50th +anniversary. *Operations Research*, 59(3), 536–549. +doi:[10.1287/opre.1110.0941](https://doi.org/10.1287/opre.1110.0941) + +> استعراض بأثر رجعي يناقش النطاق والقيود والتطبيقات الخاطئة الشائعة. + +[5] Reinertsen, D. G. (2009). *The Principles of Product Development +Flow: Second Generation Lean Product Development*. Celeritas Publishing. +ISBN: 978-0-9844512-0-8. + +> نشر WSJF و"تكلفة التأخير / المدة" في سياقات أجايل/لين. +> الأساس الرياضي هو Smith (1956) [1]. + +### القياس والحوافز + +[6] Goodhart, C. A. E. (1984). Problems of monetary management: The U.K. +experience. In *Monetary Theory and Practice* (pp. 91–121). Macmillan. + +> مصدر قانون Goodhart: "أي انتظام إحصائي مُلاحَظ سيميل إلى الانهيار +> حالما يُمارَس ضغط عليه لأغراض الرقابة." + +[7] Strathern, M. (1997). 'Improving ratings': Audit in the British +university system. *European Review*, 5(3), 305–321. +doi:[10.1002/(SICI)1234-981X(199707)5:3<305::AID-EURO184>3.0.CO;2-4](https://doi.org/10.1002/(SICI)1234-981X(199707)5:3%3C305::AID-EURO184%3E3.0.CO;2-4) + +> تعميم قانون Goodhart: "حين يصبح المقياس هدفًا، يتوقف عن كونه مقياسًا +> جيدًا." + +### الاقتصاد السلوكي + +[8] Kahneman, D., & Tversky, A. (1979). Prospect theory: An analysis of +decision under risk. *Econometrica*, 47(2), 263–292. +doi:[10.2307/1914185](https://doi.org/10.2307/1914185) + +> أسّس نظرية نفور الخسارة. مُشار إليه في القسم 4.5. + +### نظرية الألعاب ونظرية العقود + +[9] Akerlof, G. A. (1970). The market for "lemons": Quality uncertainty +and the market mechanism. *The Quarterly Journal of Economics*, 84(3), +488–500. doi:[10.2307/1879431](https://doi.org/10.2307/1879431) + +> عدم تماثل المعلومات والانتقاء العكسي. التوازن التجميعي في القسم 7.5 +> مشابه هيكليًا. + +[10] Hölmstrom, B. (1979). Moral hazard and observability. *The Bell +Journal of Economics*, 10(1), 74–91. +doi:[10.2307/3003320](https://doi.org/10.2307/3003320) + +> المعالجة الرسمية للخطر الأخلاقي. سيناريو الإبلاغ بالمقياس في القسم +> 7.5 هو مشكلة خطر أخلاقي. + +### علم النفس + +[11] Festinger, L. (1957). *A Theory of Cognitive Dissonance*. Stanford +University Press. ISBN: 978-0-8047-0131-0. + +> النظرية التأسيسية. مُشار إليها في القسم 8.2. + +[12] Deci, E. L., & Ryan, R. M. (1985). *Intrinsic Motivation and +Self-Determination in Human Behavior*. Plenum Press. +ISBN: 978-0-306-42022-1. + +> المعالجة الأصلية لنظرية تقرير المصير. مُشار إليها في القسم 8.3. + +[13] Ryan, R. M., & Deci, E. L. (2000). Self-determination theory and +the facilitation of intrinsic motivation, social development, and +well-being. *American Psychologist*, 55(1), 68–78. +doi:[10.1037/0003-066X.55.1.68](https://doi.org/10.1037/0003-066X.55.1.68) + +> نظرة عامة على SDT تربط إشباع الحاجات بالدافعية الذاتية والرفاهية. + +[14] Seligman, M. E. P., & Maier, S. F. (1967). Failure to escape +traumatic shock. *Journal of Experimental Psychology*, 74(1), 1–9. +doi:[10.1037/h0024514](https://doi.org/10.1037/h0024514) + +> العرض الأصلي للعجز المكتسب. مُشار إليه في القسم 8.5. + +[15] Seligman, M. E. P. (1975). *Helplessness: On Depression, +Development, and Death*. W. H. Freeman. ISBN: 978-0-7167-0752-3. + +> معالجة موسّعة تربط العجز المكتسب بالاكتئاب البشري والسلوك المؤسسي. + +[16] Shay, J. (1994). *Achilles in Vietnam: Combat Trauma and the Undoing +of Character*. Atheneum / Simon & Schuster. ISBN: 978-0-689-12182-3. + +> قدّم مفهوم الأذى الأخلاقي. مُشار إليه في القسم 8.4. + +[17] Litz, B. T., Stein, N., Delaney, E., Lebowitz, L., Nash, W. P., +Silva, C., & Maguen, S. (2009). Moral injury and moral repair in war +veterans: A preliminary model and intervention strategy. *Clinical +Psychology Review*, 29(8), 695–706. +doi:[10.1016/j.cpr.2009.07.003](https://doi.org/10.1016/j.cpr.2009.07.003) + +> صاغ الأذى الأخلاقي كبنية سريرية. التعريف المقتبس في القسم 8.4. + +### القياس المؤسسي + +[18] Austin, R. D. (1996). *Measuring and Managing Performance in +Organizations*. Dorset House. ISBN: 978-0-932633-36-1. + +> أثبت أن القياس الناقص يخلق حوافز حتمية لتحسين الأبعاد المقاسة على +> حساب الأبعاد غير المقاسة. إطار عدم تماثل المعلومات يتوازى بشكل وثيق +> مع القسم 7. السلف الأهم لحجة هذه الورقة. + +[19] Muller, J. Z. (2018). *The Tyranny of Metrics*. Princeton University +Press. ISBN: 978-0-691-17495-2. + +> معالجة شاملة لـ"هوس المقاييس" عبر التعليم والرعاية الصحية والشرطة +> والمالية. أدلة تجريبية واسعة للأنماط المنظَّرة في القسم 7.4. + +### عدالة الجدولة + +[20] Coffman, E. G., Shanthikumar, J. G., & Yao, D. D. (1992). +Multiclass queueing systems: Polymatroid structure and optimal scheduling +control. *Operations Research*, 40(S2), S293–S299. + +> قوانين الحفظ في الجدولة. ثبات وقت الإنجاز المرجّح بالعمل بغض النظر +> عن الجدول (المبرهنة 2) هو مثال على قوانين الحفظ هذه. + +[21] Angel, E., Bampis, E., & Pascual, F. (2008). How good are SPT +schedules for fair optimality criteria? *Annals of Operations Research*, +159(1), 53–64. doi:[10.1007/s10479-007-0267-0](https://doi.org/10.1007/s10479-007-0267-0) + +> يقيس مباشرة جودة جدول SPT مقابل معايير العدالة. أقرب سلف في نظرية +> الجدولة لتحليل العدالة في القسم 4. + +[22] Bansal, N., & Harchol-Balter, M. (2001). Analysis of SRPT +scheduling: Investigating unfairness. *ACM SIGMETRICS Performance +Evaluation Review*, 29(1), 279–290. +doi:[10.1145/384268.378792](https://doi.org/10.1145/384268.378792) + +> يحقق في الاعتقاد بأن SRPT يعاقب المهام الكبيرة بشكل غير عادل في +> جدولة الحاسوب. يُحاجج بأن الظلم أقل مما يُعتقد لكنه يُقرّ بالتوتر +> الجوهري. + +[23] Wierman, A., & Harchol-Balter, M. (2003). Classifying scheduling +policies with respect to unfairness in an M/GI/1. *ACM SIGMETRICS +Performance Evaluation Review*, 31(1), 238–249. + +> يصوغ تعريفات العدالة لسياسات الجدولة بالمقارنة مع المشاركة المعالِجية +> (Processor-Sharing). + +### مراجع إضافية + +[24] Campbell, D. T. (1979). Assessing the impact of planned social +change. *Evaluation and Program Planning*, 2(1), 67–90. +doi:[10.1016/0149-7189(79)90048-X](https://doi.org/10.1016/0149-7189(79)90048-X) + +> قانون Campbell: "كلما زاد استخدام أي مؤشر اجتماعي كمي في اتخاذ +> القرارات الاجتماعية، زادت تعرضه لضغوط الفساد وزاد احتماله في تشويه +> وإفساد العمليات الاجتماعية التي يُقصد مراقبتها." يكمّل قانون +> Goodhart [6]. + +[25] Ferreira, C. M., et al. (2024). It's business: A qualitative study +of moral injury in business settings. *Journal of Business Ethics*. +doi:[10.1007/s10551-024-05615-0](https://doi.org/10.1007/s10551-024-05615-0) + +> يمدّ الأذى الأخلاقي إلى أماكن العمل الربحية. يُصدّق على تطبيق القسم +> 8.4 لـ Shay/Litz خارج الأوساط العسكرية والصحية. + +[26] Bevan, G., & Hood, C. (2006). What's measured is what matters: +Targets and gaming in the English public health care system. *Public +Administration*, 84(3), 517–538. +doi:[10.1111/j.1467-9299.2006.00600.x](https://doi.org/10.1111/j.1467-9299.2006.00600.x) + +> يوثّق تجريبيًا سلوكيات التلاعب بما في ذلك "إصابة الهدف وتفويت المغزى." +> يقدم أدلة واقعية لتناقض الأولوية-المقياس في القسم 5.2. + +[27] Moore, C. (2012). Why employees do bad things: Moral disengagement +and unethical organizational behavior. *Personnel Psychology*, 65(1), +1–48. doi:[10.1111/j.1744-6570.2011.01237.x](https://doi.org/10.1111/j.1744-6570.2011.01237.x) + +> يحلّل الانفصال الأخلاقي — إعادة الهيكلة المعرفية التي تُمكّن السلوك +> غير الأخلاقي. يعالج القسم 8 الظاهرة المكمّلة: الأذى الذي يلحق +> بالأفراد الذين *يرفضون* الانفصال. + +--- + +*طُوِّر هذا البرهان حواريًا وصيغ رسميًا بتاريخ 2026-03-28.* diff --git a/README.de.md b/README.de.md new file mode 100644 index 0000000..9f933da --- /dev/null +++ b/README.de.md @@ -0,0 +1,1364 @@ +# Die ungewichtete durchschnittliche Abschlusszeit ist keine faire Metrik fuer die Aufgabenplanung + +Ein mathematischer Beweis, dass die ungewichtete durchschnittliche +Aufgabenabschlusszeit eine verzerrte Statistik ist, die das gezielte +Herauspicken einfacher Aufgaben belohnt, und dass jeder Planungsvorteil, +den sie scheinbar aufdeckt, ein Artefakt der Metrik ist — keine +Widerspiegelung tatsaechlichen Durchsatzes oder tatsaechlicher +Servicequalitaet. + +--- + +## 1. Einfuehrung + +Viele Organisationen messen die Aufgabenausfuehrungsleistung anhand der +**ungewichteten mittleren Abschlusszeit**: der durchschnittlichen Anzahl +von Stunden (oder Tagen) zwischen Aufgabeneinreichung und +Aufgabenabschluss, wobei jede Aufgabe unabhaengig von Groesse oder +Prioritaet gleich gezaehlt wird. + +Diese Arbeit beweist, dass diese Metrik nicht lediglich ungenau, sondern +strukturell verzerrt ist. Sie kann durch Umordnung der Arbeit verbessert +werden, ohne zusaetzliche Arbeit zu leisten (Satz 1), waehrend eine +ordnungsgemaess gewichtete Alternative vollstaendig immun gegen +Manipulationen durch die Reihenfolgeplanung ist (Satz 2). In Kombination +mit einem Prioritaetssystem widerspricht die Metrik aktiv den eigenen +Prioritaetsklassifikationen der Organisation (Satz 9). + +Die Argumentation gliedert sich in vier Teile: + +- **Teil I** (Abschnitte 2–4) legt das mathematische Fundament: + Der ungewichtete Mittelwert ist durch Shortest Processing Time (SPT)- + Planung manipulierbar, der arbeitsgewichtete Mittelwert ist + planungsinvariant, und die daraus resultierenden Konsequenzen fuer die + Servicequalitaet sind nachweislich negativ. + +- **Teil II** (Abschnitte 5–6) erweitert das Modell auf + prioritaetsklassifizierte Aufgaben, beweist, dass die Metrik + gegenueber dem Prioritaetssystem adversarial wird, und schlaegt + gewichtete Alternativen vor, mit einem durchgerechneten Beispiel + eines IT-Service-Desks. + +- **Teil III** (Abschnitte 7–9) untersucht die organisatorische Dynamik: + Was geschieht, wenn die Metrik an Kunden berichtet wird + (Informationsasymmetrie), was mit Teammitgliedern geschieht, die ihre + Maengel verstehen (psychischer Schaden), und was ein einzelner + informierter Manager dagegen tun kann (eingeschraenkte Optimierung mit + spieltheoretischer Stabilitaetsanalyse). + +- **Teil IV** (Abschnitte 10–12) praesentiert ehrliche Gegenargumente, + ordnet die Arbeit in die bestehende Literatur ein und schliesst ab. + +Die Kernergebnisse bauen auf Smiths (1956) grundlegender +Ablaufplanungstheorie [1] auf, erweitert durch Spieltheorie [9, 10], +organisatorische Messtheorie [18, 19] und Psychologie [11–17], um eine +vollstaendige Kette von einem mathematischen Beweis ueber eine bestimmte +Metrik bis hin zu organisatorischen Auswirkungen nachzuzeichnen. + +--- + +# Teil I: Mathematisches Fundament + +## 2. Definitionen + +Es seien **n** Aufgaben mit Bearbeitungszeiten $p_1, p_2, \ldots, p_n$ gegeben. + +Ein **Ablaufplan** $\sigma$ ist eine Permutation von $\{1, 2, \ldots, n\}$, +die Aufgaben einer Ausfuehrungsreihenfolge auf einem einzelnen Ausfuehrer +zuweist. + +Die **Abschlusszeit** der Aufgabe $\sigma(k)$ unter Ablaufplan $\sigma$ ist: + +$$C_{\sigma(k)} = \sum_{j=1}^{k} p_{\sigma(j)}$$ + +Die **ungewichtete mittlere Abschlusszeit** ist: + +$$\bar{C}(\sigma) = \frac{1}{n} \sum_{k=1}^{n} C_{\sigma(k)}$$ + +Die **arbeitsgewichtete mittlere Abschlusszeit** ist: + +$$\bar{C}_w(\sigma) = \frac{\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)}}{\sum_{k=1}^{n} p_{\sigma(k)}}$$ + +--- + +## 3. Kernergebnisse + +### 3.1 Der ungewichtete Mittelwert ist manipulierbar + +**Satz 1** (Smith, 1956 [1])**.** Der Ablaufplan, der +$\bar{C}(\sigma)$ minimiert, ist Shortest Processing Time first (SPT): +Sortiere die Aufgaben so, dass +$p_{\sigma(1)} \le p_{\sigma(2)} \le \cdots \le p_{\sigma(n)}$. + +**Beweis (Austauschmethode [1, 2]).** + +Betrachte einen beliebigen Ablaufplan $\sigma$, in dem zwei benachbarte +Aufgaben $i, j$ die Bedingung $p_i > p_j$ erfuellen, wobei Aufgabe $i$ +unmittelbar vor Aufgabe $j$ eingeplant ist. Sei $t$ die Startzeit von +Aufgabe $i$. + +| | Aufgabe $i$ endet | Aufgabe $j$ endet | Summe | +|---|---|---|---| +| **Vor dem Tausch** ($i$ dann $j$) | $t + p_i$ | $t + p_i + p_j$ | $2t + 2p_i + p_j$ | +| **Nach dem Tausch** ($j$ dann $i$) | $t + p_j$ | $t + p_j + p_i$ | $2t + p_i + 2p_j$ | + +Die Aenderung der Summe der Abschlusszeiten betraegt: + +$$(2p_i + p_j) - (p_i + 2p_j) = p_i - p_j > 0$$ + +Jeder Tausch eines laenger-vor-kuerzer-Paares benachbarter Aufgaben +reduziert die Gesamtsumme strikt. Jeder Nicht-SPT-Ablaufplan enthaelt ein +solches Paar. Wiederholte Tauschoperationen konvergieren zu SPT. Daher +minimiert SPT $\bar{C}(\sigma)$ eindeutig. $\blacksquare$ + +### 3.2 Der arbeitsgewichtete Mittelwert ist planungsinvariant + +**Satz 2.** Die arbeitsgewichtete mittlere Abschlusszeit $\bar{C}_w(\sigma)$ +ist fuer jeden Ablaufplan $\sigma$ identisch. + +**Beweis.** + +Expandiere den Zaehler: + +$$\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)} = \sum_{k=1}^{n} p_{\sigma(k)} \sum_{j=1}^{k} p_{\sigma(j)}$$ + +Reindiziere, indem $a = \sigma(k)$ und $b = \sigma(j)$ gesetzt wird. Die +Doppelsumme zaehlt jedes geordnete Paar $(a, b)$, bei dem $b$ nicht +spaeter als $a$ eingeplant ist: + +$$= \sum_{\substack{a, b \\ b \preceq_\sigma a}} p_a \, p_b$$ + +Fuer jedes Paar $(a, b)$ mit $a \ne b$ gilt genau eine der Beziehungen +$\{b \preceq_\sigma a\}$ oder $\{a \prec_\sigma b\}$. Die Diagonalterme +($a = b$) tragen $p_a^2$ bei, unabhaengig von der Reihenfolge. Daher: + +$$\sum_{\substack{a, b \\ b \preceq_\sigma a}} p_a \, p_b = \sum_{a} p_a^2 + \sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b$$ + +Zusammen mit der komplementaeren Summe decken die beiden +Nebendiagonalsummen alle ungeordneten Paare ab: + +$$\sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b + \sum_{\substack{a \ne b \\ a \prec_\sigma b}} p_a \, p_b = \sum_{a \ne b} p_a \, p_b$$ + +Die rechte Seite ist planungsunabhaengig. Aufgrund der Symmetrie von +$p_a p_b$ sind beide Nebendiagonalsummen gleich: + +$$\sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b = \frac{1}{2} \sum_{a \ne b} p_a \, p_b$$ + +Daher: + +$$\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)} = \sum_a p_a^2 + \frac{1}{2} \sum_{a \ne b} p_a \, p_b = \frac{1}{2}\left(\sum_a p_a\right)^2 + \frac{1}{2}\sum_a p_a^2$$ + +Dieser Ausdruck enthaelt keinen Bezug auf $\sigma$. Da der Nenner +$\sum p_a$ ebenfalls planungsunabhaengig ist: + +$$\bar{C}_w(\sigma) = \frac{\frac{1}{2}\left(\sum p_a\right)^2 + \frac{1}{2}\sum p_a^2}{\sum p_a}$$ + +ist **ueber alle Ablaufplaene konstant**. $\blacksquare$ + +Dies ist ein Beispiel der Erhaltungssaetze in der Ablaufplanung, die von +Coffman, Shanthikumar und Yao [20] identifiziert wurden. Die Invarianz +entspricht der Messung, wie lange eine Einheit *Arbeit* wartet, anstatt +wie lange eine *Aufgabe* wartet — die ungewichtete Statistik zaehlt +Abschluesse statt Arbeit, weshalb sie manipulierbar ist. (Siehe auch +Little [3, 4] fuer den warteschlangentheoretischen Kontext, mit dem +Vorbehalt, dass Littles Gesetz direkt nur auf stationaere Systeme +anwendbar ist, nicht auf den hier analysierten Batch-Fall.) + +### 3.3 Anschauliches Beispiel + +Zwei Aufgaben: $A$ mit $p_A = 1$ Stunde, $B$ mit $p_B = 10$ Stunden. + +| Ablaufplan | $C_A$ | $C_B$ | Ungewichteter Mittelwert | Arbeitsgewichteter Mittelwert | +|----------|-------|-------|-----------------|-------------------| +| SPT (A zuerst) | 1 | 11 | 6,0 | 111/11 ≈ 10,09 | +| Umgekehrt (B zuerst) | 11 | 10 | 10,5 | 111/11 ≈ 10,09 | + +SPT erscheint **4,5 Stunden besser** bei der ungewichteten Metrik, bietet +aber **keinerlei Verbesserung** bei der arbeitsgewichteten Metrik. Der +scheinbare Vorteil existiert nur, weil die ungewichtete Statistik einer +1-Stunden-Aufgabe das gleiche „Stimmrecht" einraeumt wie einer +10-Stunden-Aufgabe. + +--- + +## 4. Konsequenzen fuer die Servicequalitaet + +### 4.1 Aushungerung grosser Aufgaben + +**Satz 3 (Metrik-Verzerrung).** Jede Planungsstrategie, die die +ungewichtete mittlere Abschlusszeit minimiert, maximiert zwangslaeufig +die Abschlusszeit der groessten Aufgabe. + +**Beweis.** SPT platziert die groesste Aufgabe an letzter Stelle. Ihre +Abschlusszeit entspricht der gesamten Bearbeitungszeit $\sum p_i$, was +die maximal moegliche Abschlusszeit fuer jede einzelne Aufgabe darstellt. +Unter jedem Ablaufplan, der die groesste Aufgabe nicht an die letzte +Stelle setzt, wird diese Aufgabe strikt frueher abgeschlossen. +$\blacksquare$ + +Dies schafft einen **Anreiz zur Aushungerung**: Rationale Akteure, die +die ungewichtete Statistik optimieren, werden grosse Aufgaben zugunsten +kleiner auf unbestimmte Zeit zurueckstellen. Austin [18] identifizierte +dieses allgemeine Muster — dass unvollstaendige Messung Anreize schafft, +die gemessene Dimension auf Kosten der ungemessenen zu optimieren — im +Kontext des organisatorischen Leistungsmanagements. Satz 3 liefert den +spezifischen Mechanismus fuer die Aufgabenplanung. + +### 4.2 Maximale Abschlusszeit fuer die groesste Aufgabe + +**Satz 4 (SPT maximiert eindeutig die Abschlusszeit der groessten Aufgabe).** +Unter allen Ablaufplaenen ist SPT die einzige Strategie, die der groessten +Aufgabe die maximal moegliche Abschlusszeit ($\sum p_i$) zuweist. + +**Beweis.** SPT sortiert Aufgaben in aufsteigender Reihenfolge von $p_i$ +und platziert die groesste Aufgabe $p_{\max}$ an die letzte Position. Die +letzte Aufgabe in jedem Ablaufplan hat die Abschlusszeit +$\sum_{i=1}^{n} p_i$, was das Maximum ist, das eine einzelne Aufgabe +erhalten kann. Unter jedem Ablaufplan, der $p_{\max}$ nicht an die letzte +Stelle setzt, wird sie strikt vor $\sum p_i$ abgeschlossen. +$\blacksquare$ + +**Korollar 4.1.** Ein Team, das die ungewichtete mittlere Abschlusszeit +optimiert, wird systematisch die schlechteste Erfahrung fuer Kunden mit +den komplexesten Beduerfnissen liefern. Dies ist kein Nebeneffekt — es ist +der *Mechanismus*, durch den sich die Metrik verbessert. + +**Anmerkung zu Verlangsamungsverhaeltnissen.** SPT *komprimiert* +tatsaechlich die Verlangsamungsverhaeltnisse ($S_i = C_i / p_i$), da +groessere Aufgaben in spaeteren Positionen grosse Nenner haben, die die +akkumulierte Summe absorbieren. Zum Beispiel bei den Aufgaben $[1, 5, 10]$: +SPT ergibt Verlangsamungen $[1, 1.2, 1.6]$ (niedrige Varianz), waehrend +LPT $[1, 3, 16]$ ergibt (hohe Varianz). Der Schaden von SPT fuer Kunden +mit grossen Aufgaben ist nicht im Verlangsamungsverhaeltnis sichtbar — er +ist in der **absoluten Abschlusszeit** sichtbar. Diese Unterscheidung ist +wichtig: Die Literatur zur Fairness in der Ablaufplanung [21, 22, 23] hat +die Unfairness von SPT/SRPT primaer anhand verlangsamungsbasierter Masse +diskutiert, die die absolute Verzoegerungslast, die unten bewiesen wird, +verschleiern koennen. + +### 4.3 Verzoegerungskonzentration + +**Satz 5 (SPT konzentriert Verzoegerung auf die groesste Aufgabe).** Unter +SPT traegt die groesste Aufgabe mehr absolute Verzoegerung als unter jedem +anderen Ablaufplan. + +**Beweis.** Definiere die absolute Verzoegerung als $\Delta_i = C_i - p_i$ +(Wartezeit, unabhaengig von der eigenen Groesse). Unter SPT befindet sich +die groesste Aufgabe an Position $n$ mit: + +$$\Delta_{\max\text{-task}}^{\text{SPT}} = C_n - p_n = \sum_{i=1}^{n-1} p_i$$ + +Dies ist die Summe der Bearbeitungszeiten aller anderen Aufgaben — die +maximal moegliche Verzoegerung fuer eine einzelne Aufgabe. Unter jedem +Ablaufplan, in dem die groesste Aufgabe nicht an letzter Stelle steht, ist +ihre Verzoegerung strikt geringer. Gleichzeitig gibt SPT der kleinsten +Aufgabe eine Verzoegerung von null ($\Delta_1^{\text{SPT}} = 0$). Die +gesamte Warteschlangenlast wird von kleinen auf grosse Aufgaben +verlagert. $\blacksquare$ + +SPT minimiert die *gesamte* Verzoegerung (gut fuer die aggregierte +Effizienz), indem es die Verzoegerung auf die Aufgaben konzentriert, die +sie in Bezug auf das Verlangsamungsverhaeltnis am besten absorbieren +koennen. Aber in absoluten Zahlen — Stunden des Wartens — traegt die +groesste Aufgabe die volle Last. + +### 4.4 Durchsatzinvarianz + +**Satz 6 (Durchsatzinvarianz).** Die ueber einen beliebigen Zeithorizont +$T$ geleistete Gesamtarbeit ist unter allen Planungsstrategien identisch. + +**Beweis.** Der Ausfuehrer verarbeitet Arbeit mit einer festen Rate. Ueber +einen beliebigen Horizont $T \ge \sum p_i$ ist die geleistete +Gesamtarbeit genau $\sum p_i$, unabhaengig von der Reihenfolge. Fuer den +stationaeren Fall mit laufenden Ankuenften wird der langfristige Durchsatz +durch die Bedienrate $\mu$ bestimmt und ist vollstaendig unabhaengig von +der Ablaufplanung: + +$$\lim_{T \to \infty} \frac{W(T)}{T} = \mu \quad \text{fuer alle Ablaufplaene } \sigma$$ + +$\blacksquare$ + +**Korollar 6.1.** Ein Team, das von einer beliebigen Planungsstrategie +auf SPT umstellt, wird eine Verbesserung der ungewichteten mittleren +Abschlusszeit beobachten — bei **keinerlei Aenderung des tatsaechlichen +Durchsatzes**. Die Metrik verbessert sich. Die Leistung nicht. + +### 4.5 Der kombinierte Effekt + +Zusammenfassung der Saetze 4, 5 und 6: + +| Kenngroesse | Auswirkung der Optimierung des ungewichteten Mittelwerts | +|---------|--------------------------------------| +| Durchsatz (Arbeit/Zeit) | Keine Aenderung (Satz 6) | +| Verzoegerung fuer kleine Aufgaben | Minimiert — naehert sich null (SPT) | +| Verzoegerung fuer grosse Aufgaben | **Maximiert** — traegt die gesamte Warteschlangenlast (Satz 5) | +| Abschlusszeit der groessten Aufgabe | **Maximal moeglich**: $\sum p_i$ (Satz 4) | + +Der Nettoeffekt auf die wahrgenommene Qualitaet ist negativ, weil: + +1. **Verlustaversion ist asymmetrisch** [8]. Ein Kunde, dessen + 100-Stunden-Aufgabe deprioritisiert wird, erlebt ein grosses, auffaelliges + Negativ. Ein Kunde, dessen 1-Stunden-Aufgabe beschleunigt wird, erlebt + ein kleines, oft unbemerktes Positiv. + +2. **Aufwaendige Aufgaben korrelieren mit wertvollen Kunden.** Grosse + Aufgaben stammen ueberproportional haeufig von Grosskunden, komplexen + Vertraegen oder kritischen Geschaeftsanforderungen. + +3. **Aushungerung kumuliert sich.** In einem kontinuierlichen System + (Satz 3) koennen grosse Aufgaben **unbegrenzt aufgeschoben** werden, + da staendig neue kleine Aufgaben eintreffen. + +**Satz 7 (Das Kernergebnis).** Fuer ein Team, das Aufgaben +unterschiedlicher Groesse bearbeitet, bewirkt die Einfuehrung der +ungewichteten mittleren Abschlusszeit als Leistungsmetrik: + +(a) **Keinerlei Produktivitaetsgewinn** (Satz 6), waehrend +(b) der groessten Aufgabe die **maximal moegliche Abschlusszeit zugewiesen + wird** (Satz 4), und +(c) **die gesamte Warteverzoegerung auf die groessten Aufgaben konzentriert + wird**, waehrend die Verzoegerung fuer die kleinsten eliminiert wird + (Satz 5). + +Dies ist kein Kompromiss. Die Metrik erzeugt einen reinen Transfer von +Servicequalitaet von aufwandsintensiven Kunden zu aufwandsarmen Kunden, +ohne jeglichen Nettoarbeitsgewinn. $\blacksquare$ + +--- + +# Teil II: Prioritaetssysteme + +## 5. Versagen unter Prioritaetsklassifikation + +Die vorangegangenen Abschnitte haben bewiesen, dass die ungewichtete +mittlere Abschlusszeit verzerrt ist, wenn Aufgaben in ihrer Groesse +variieren. Wir zeigen nun, dass die Einfuehrung eines +**Prioritaetssystems** — wie es praktisch alle realen Teams verwenden — +dazu fuehrt, dass die Metrik nicht nur verzerrt, sondern **aktiv +adversarial** gegenueber den erklaerten Zielen der Organisation wird. + +### 5.1 Erweitertes Modell: Aufgaben mit Prioritaet + +Jede Aufgabe $i$ habe eine Bearbeitungszeit $p_i$ und eine +Prioritaetsklasse $q_i \in \{1, 2, 3, 4\}$, wobei 1 die hoechste +Prioritaet (kritisch) und 4 die niedrigste (kosmetisch/Erweiterung) +darstellt. Prioritaetsgewichte werden wie folgt zugewiesen: + +$$w(q) = \begin{cases} 8 & q = 1 \text{ (Kritisch)} \\ 4 & q = 2 \text{ (Hoch)} \\ 2 & q = 3 \text{ (Mittel)} \\ 1 & q = 4 \text{ (Niedrig)} \end{cases}$$ + +Die spezifischen Gewichte sind illustrativ; die Ergebnisse gelten fuer +jede streng monoton fallende Gewichtsfunktion. Die entscheidende +Eigenschaft ist, dass die Prioritaet nach **Geschaeftsauswirkung** +vergeben wird, nicht nach Aufgabengroesse. + +### 5.2 Die Metrik widerspricht dem Prioritaetssystem + +**Satz 8 (Prioritaets-Groessen-Inversion).** Wenn die Prioritaet +unabhaengig von der Aufgabengroesse ist, wird der Ablaufplan, der die +ungewichtete mittlere Abschlusszeit minimiert (SPT), im Erwartungswert +Aufgaben niedriger Prioritaet vor Aufgaben hoher Prioritaet mit groesserer +Bearbeitungszeit abschliessen. + +**Beweis.** SPT ordnet Aufgaben nach $p_i$ aufsteigend, unabhaengig von +$q_i$. Betrachte zwei Aufgaben: + +- Aufgabe A: $p_A = 40$ Stunden, $q_A = 1$ (Kritisch — z.B. Serverausfall) +- Aufgabe B: $p_B = 0.5$ Stunden, $q_B = 4$ (Niedrig — z.B. kosmetische UI-Korrektur) + +SPT plant B vor A ein. Der ungewichtete Mittelwert fuer dieses Paar: + +$$\bar{C}^{\text{SPT}} = \frac{0.5 + 40.5}{2} = 20.5 \qquad \bar{C}^{\text{priority}} = \frac{40 + 40.5}{2} = 40.25$$ + +Die Metrik erklaert SPT fuer fast **doppelt so gut** — obwohl eine +kosmetische Korrektur bearbeitet wird, waehrend ein Serverausfall +andauert. + +Im Allgemeinen hat die SPT-Reihenfolge, wenn $q_i$ statistisch +unabhaengig von $p_i$ ist, eine **Korrelation von null** mit der +Prioritaet. In der Praxis erfordern kritische Aufgaben (Ausfaelle, +Sicherheitsvorfaelle, Datenverlust) oft mehr Arbeit als Aufgaben +niedriger Prioritaet, sodass die Metrik plausiblerweise +**anti-korreliert** mit dem Prioritaetssystem ist. $\blacksquare$ + +### 5.3 Informationsvernichtung + +Der ungewichtete Mittelwert reduziert eine dreidimensionale Aufgabe +$(p_i, q_i, C_i)$ auf ein eindimensionales Signal ($C_i$) und mittelt +dann gleichfoermig. Dabei wird die Prioritaet vollstaendig verworfen und +die Groesse implizit invertiert. + +**Satz 9 (Informationsvernichtung).** Sei $I(\sigma)$ die +Transinformation zwischen der impliziten Prioritaetsrangfolge des +Ablaufplans (Position) und der tatsaechlichen Prioritaetszuweisung $q_i$. +Fuer SPT gilt: + +$$I(\sigma_{\text{SPT}}) = 0 \quad \text{wenn } p_i \perp q_i$$ + +**Beweis.** SPT weist Positionen ausschliesslich basierend auf $p_i$ zu. +Wenn $p_i$ und $q_i$ unabhaengig sind, liefert die Kenntnis der Position +einer Aufgabe im SPT-Ablaufplan keinerlei Information ueber ihre +Prioritaet. $\blacksquare$ + +**Korollar 9.1.** Ein Team, das die ungewichtete mittlere Abschlusszeit +optimiert, betreibt ein Planungssystem, das keinerlei Information ueber +seine eigene Prioritaetsklassifikation traegt. Das Prioritaetsfeld in +ihrem Ticketsystem ist hinsichtlich der Ausfuehrungsreihenfolge +dekorativ. + +Dies ist ein Beispiel dessen, was Austin [18] als das grundlegende Problem +unvollstaendiger Messung bezeichnet: Wenn das Messsystem nur eine +Teilmenge der relevanten Dimensionen erfasst, verschlechtert die +Optimierung der Messung systematisch die nicht gemessenen Dimensionen. + +### 5.4 Prioritaetsgewichtete Verzoegerungskosten + +Definiere die **prioritaetsgewichteten Verzoegerungskosten** eines +Ablaufplans: + +$$D(\sigma) = \sum_{i=1}^{n} w(q_i) \cdot C_i$$ + +**Satz 10 (SPT und prioritaetsgewichtete Verzoegerungskosten).** Der +optimale Ablaufplan zur Minimierung von $D(\sigma)$ ist WSJF: Ordnung +nach $w(q_i)/p_i$ absteigend [1, 5]. Die SPT-Ordnung — nach $1/p_i$ +absteigend — ignoriert die Prioritaet vollstaendig und erzeugt hoehere +$D$-Werte als prioritaetsrespektierende Alternativen, wenn Prioritaet mit +der Aufgabengroesse korreliert. + +**Beweis.** Durch die Austauschmethode veraendert das Vertauschen +benachbarter Aufgaben $i, j$ den Wert von $D$ um: + +$$\Delta D = w(q_j) \cdot p_i - w(q_i) \cdot p_j$$ + +Der Tausch verbessert $D$, wenn $w(q_j)/p_j > w(q_i)/p_i$, aber $j$ +nach $i$ eingeplant ist. Daher ist die optimale Reihenfolge absteigendes +$w(q_i)/p_i$ — die WSJF-Regel. SPT entspricht WSJF nur dann, wenn +$w(q_i) = \text{const}$ (alle Aufgaben haben gleiche Prioritaet). + +**Beispiel.** Kritisch ($w = 8$, $p = 3$) und Niedrig ($w = 1$, $p = 2$): + +- SPT (Niedrig zuerst): $D = 1 \cdot 2 + 8 \cdot 5 = 42$ +- WSJF (Kritisch zuerst): $D = 8 \cdot 3 + 1 \cdot 5 = 29$ + +SPT verursacht 45% mehr prioritaetsgewichtete Verzoegerung. In der Praxis +sind kritische Aufgaben tendenziell groesser (Ausfaelle, +Sicherheitsvorfaelle), was die Divergenz systematisch macht. +$\blacksquare$ + +--- + +## 6. Loesungsvorschlaege + +### 6.1 Prioritaetsgewichtete Metriken + +Ersetze die ungewichtete mittlere Abschlusszeit durch den +**Priority-Weighted Completion Score (PWCS)**: + +$$\text{PWCS}(\sigma) = \frac{\sum_{i=1}^{n} w(q_i) \cdot \frac{C_i}{p_i}}{\sum_{i=1}^{n} w(q_i)}$$ + +Dies ist das prioritaetsgewichtete mittlere Verlangsamungsverhaeltnis. Es +misst, wie lange jede Aufgabe relativ zu ihrer Groesse gewartet hat, +gewichtet danach, wie wichtig diese Aufgabe war. Niedrigere Werte sind +besser. + +**Eigenschaften:** + +1. **Prioritaetsrespektierend.** Verzoegerungen bei kritischen Aufgaben + kosten 8-mal mehr als Verzoegerungen bei Aufgaben niedriger Prioritaet. +2. **Groessenfair.** Verwendet das Verlangsamungsverhaeltnis $C_i / p_i$, + sodass grosse Aufgaben nicht dafuer bestraft werden, dass sie gross + sind. +3. **Nicht durch SPT manipulierbar.** Eine Umordnung nach + Bearbeitungszeit verbessert den Wert nicht systematisch. +4. **Reduziert sich auf den ungewichteten Mittelwert bei uniformen + Aufgaben.** Eine strikte Verallgemeinerung. + +### 6.2 Optimale Strategie: WSJF + +**Satz 11.** Der Ablaufplan, der die prioritaetsgewichtete Abschlusszeit +$\text{PWCT}(\sigma) = \sum w(q_i) \cdot C_i / \sum w(q_i)$ minimiert, +bearbeitet Aufgaben in der Reihenfolge absteigender $w(q_i)/p_i$ — die +**Weighted Shortest Job First (WSJF)**-Regel [1, 5]. + +**Beweis.** Durch die Austauschmethode (wie in Satz 10) verbessert der +Tausch benachbarter Aufgaben $i, j$ den PWCT-Wert, wenn +$w(q_j)/p_j > w(q_i)/p_i$, aber $j$ nach $i$ eingeplant ist. Die +optimale Reihenfolge ist daher absteigendes $w(q_i)/p_i$. +$\blacksquare$ + +Innerhalb einer Prioritaetsklasse reduziert sich dies auf SPT (kuerzeste +zuerst). Ueber Klassen hinweg schlaegt eine kritische 4-Stunden-Aufgabe +($w/p = 2.0$) eine niedrigprioritaere 1-Stunden-Aufgabe ($w/p = 1.0$). + +**Praktischer Vorbehalt.** Reines WSJF kann winzige Aufgaben niedriger +Prioritaet vor grosse kritische Aufgaben setzen (eine 15-Minuten-Aufgabe +niedriger Prioritaet hat $w/p = 1/0.25 = 4.0$ und schlaegt eine +6-stuendige kritische Aufgabe mit $w/p = 8/6 = 1.33$). In der Praxis wird +dies durch die Durchsetzung einer **strikten Prioritaetsklassenordnung** +und die Anwendung von WSJF nur *innerhalb* jeder Klasse abgemildert. + +### 6.3 Anwendungsbeispiel: IT-Service-Desk + +Betrachte ein IT-Team mit der folgenden Ticket-Warteschlange: + +| Ticket | Prioritaet | Typ | Gesch. Stunden | +|--------|----------|------|-----------| +| T1 | P1 (Kritisch) | E-Mail-Server ausgefallen | 6 | +| T2 | P2 (Hoch) | VPN fuer Remote-Team fehlerhaft | 4 | +| T3 | P3 (Mittel) | Laptop-Einrichtung fuer neuen Mitarbeiter | 2 | +| T4 | P4 (Niedrig) | Desktop-Hintergrundrichtlinie aktualisieren | 0,5 | +| T5 | P3 (Mittel) | Softwarelizenz installieren | 1 | +| T6 | P1 (Kritisch) | Datenbank-Backup fehlerhaft | 3 | +| T7 | P2 (Hoch) | Druckerflotte offline | 2 | +| T8 | P4 (Niedrig) | Alten gemeinsamen Laufwerksordner archivieren | 0,25 | + +**SPT-Reihenfolge** (Optimierung des ungewichteten Mittelwerts): T8, T4, T5, T3, T7, T6, T2, T1 + +| Pos | Ticket | Prioritaet | Stunden | Abschluss | Verlangsamung | +|-----|--------|----------|-------|------------|----------| +| 1 | T8 (Ordner archivieren) | P4 Niedrig | 0,25 | 0,25 | 1,0 | +| 2 | T4 (Hintergrund) | P4 Niedrig | 0,5 | 0,75 | 1,5 | +| 3 | T5 (Software) | P3 Mittel | 1 | 1,75 | 1,75 | +| 4 | T3 (Laptop) | P3 Mittel | 2 | 3,75 | 1,875 | +| 5 | T7 (Drucker) | P2 Hoch | 2 | 5,75 | 2,875 | +| 6 | T6 (Backups) | P1 Krit. | 3 | 8,75 | 2,917 | +| 7 | T2 (VPN) | P2 Hoch | 4 | 12,75 | 3,188 | +| 8 | T1 (E-Mail) | P1 Krit. | 6 | 18,75 | 3,125 | + +**Praktisches WSJF** (Prioritaetsklasse zuerst, SPT innerhalb der Klasse): + +| Pos | Ticket | Prioritaet | Stunden | Abschluss | +|-----|--------|----------|-------|------------| +| 1 | T6 (Backups) | P1 Krit. | 3 | 3 | +| 2 | T1 (E-Mail) | P1 Krit. | 6 | 9 | +| 3 | T7 (Drucker) | P2 Hoch | 2 | 11 | +| 4 | T2 (VPN) | P2 Hoch | 4 | 15 | +| 5 | T5 (Software) | P3 Mittel | 1 | 16 | +| 6 | T3 (Laptop) | P3 Mittel | 2 | 18 | +| 7 | T8 (Archiv) | P4 Niedrig | 0,25 | 18,25 | +| 8 | T4 (Hintergrund) | P4 Niedrig | 0,5 | 18,75 | + +**Vergleich:** + +| Metrik | SPT | Praktisches WSJF | Gewinner | +|--------|-----|----------------|--------| +| Ungewichteter mittlerer Abschluss | **6,56 Std.** | 13,63 Std. | SPT | +| P1 mittlere Loesungszeit | 13,75 Std. | **6 Std.** | WSJF | +| P2 mittlere Loesungszeit | 9,25 Std. | **13 Std.** | SPT | +| Zeit zur Reparatur des E-Mail-Servers | 18,75 Std. | **9 Std.** | WSJF | +| Zeit zur Reparatur der Datenbank-Backups | 8,75 Std. | **3 Std.** | WSJF | +| Zeit zur Aktualisierung des Hintergrunds | **0,75 Std.** | 18,75 Std. | SPT | + +Die aggregierten prioritaetsgewichteten Abschlusszeiten sind nahezu +identisch (PWCT: 10,2 vs. 10,17), da die Aggregation den +Verteilungsschaden verbirgt. Der eigentliche Unterschied liegt in der +**Aufschluesselung nach Prioritaetsklasse**: Der E-Mail-Server ist unter +SPT 18,75 Stunden ausgefallen, gegenueber 9 Stunden unter WSJF. Die +Datenbank-Backups versagen 8,75 Stunden gegenueber 3. + +Die ungewichtete Metrik berichtet zuversichtlich, dass SPT **mehr als +doppelt so effizient** ist (6,56 vs. 13,63), und belohnt das Team, das +Desktop-Hintergruende aktualisiert hat, waehrend der E-Mail-Server +brannte. + +### 6.4 Empfohlenes Metrik-Set + +Selbst prioritaetsgewichtete aggregierte Metriken koennen gute von +schlechten Ablaufplaenen nicht unterscheiden, da die Aggregation +Verteilungsschaeden verbirgt. Keine einzelne Metrik genuegt. Ein +vollstaendiges Messsystem sollte erfassen: + +| Metrik | Was sie misst | Formel | +|--------|-----------------|---------| +| **Mittlerer Abschluss nach Prioritaetsklasse** | Reaktionsfaehigkeit pro Klasse | $\bar{C}$ gefiltert nach $q$ | +| **P1 mittlere Loesungszeit** | Reaktion auf kritische Vorfaelle | $\bar{C}$ fuer $q = 1$ | +| **Durchsatz** | Rohe Arbeitskapazitaet | Geleistete Arbeitsstunden / Kalenderzeit | +| **Alterungsverletzungen** | Verhinderung von Aushungerung | Aufgaben, die SLA nach Prioritaet ueberschreiten | +| **Maximale Abschlusszeit (P1/P2)** | Schlechtester kritischer Reaktionsfall | $\max(C_i)$ fuer $q \le 2$ | + +Die zentrale Erkenntnis: **Metriken pro Prioritaetsklasse** decken +Planungsfehler auf, die aggregierte Metriken verbergen. + +--- + +# Teil III: Organisatorische Dynamik + +## 7. Wenn die Metrik das Produkt ist + +Die Abschnitte 2–6 setzen voraus, dass die Kundenzufriedenheit eine +Funktion der *erlebten Servicequalitaet* ist. Es gibt jedoch ein +Szenario, in dem diese Annahme versagt und das gesamte Argument in sich +zusammenfaellt. + +### 7.1 Die selbstreferenzielle Metrik + +Angenommen, der Anbieter berichtet den ungewichteten Mittelwert direkt +an den Kunden — auf einem Dashboard, in einem SLA-Bericht, auf einer +Marketingseite — und die Zufriedenheit des Kunden leitet sich primaer +aus *dieser Zahl* ab: + +$$U_{\text{client}} = f\!\left(\bar{C}(\sigma)\right), \quad f' < 0$$ + +Unter diesem Modell maximiert SPT tatsaechlich die Kundenzufriedenheit +(Satz 1). Der Durchsatz bleibt unveraendert (Satz 6). Das +Geschaeftsergebnis verbessert sich: gleiche Arbeit erledigt, zufriedenerer +Kunde. + +**Jeder Satz in dieser Arbeit bleibt mathematisch korrekt. Aber die +Schlussfolgerung invertiert sich.** Die Metrik ist nicht laenger ein Proxy, +der manipuliert werden kann — sie *ist* die Servicequalitaet, weil der +Kunde zugestimmt hat, die Qualitaet anhand der aggregierten Zahl zu +bewerten. + +### 7.2 Die Oekonomie + +Dies erzeugt ein kohaerentes, stabiles Gleichgewicht: + +| Akteur | Verhalten | Ergebnis | +|-------|----------|---------| +| Anbieter | Optimiert ungewichteten Mittelwert (SPT) | Metrik verbessert sich, keine Mehrarbeit | +| Kunde | Liest Dashboard, sieht niedrigen Durchschnitt | Meldet Zufriedenheit | +| Management | Sieht zufriedenen Kunden + gute Metrik | Belohnt das Team | + +Der Anbieter erzeugt Zufriedenheit zu null Grenzkosten, indem er eine +Zahl optimiert, die der Kunde als Proxy fuer Qualitaet akzeptiert hat. + +### 7.3 Die Fragilitaet + +Dieses Gleichgewicht ist nur stabil, solange der Kunde seine eigene +Erfahrung nie ueberprueft. Es bricht zusammen, wenn: + +1. **Der Kunde sein eigenes Ticket ueberprueft.** Ein CTO, dessen + E-Mail-Server 18,75 Stunden ausgefallen war, wird sich nicht durch + „Durchschnittliche Loesungszeit: 6,56 Stunden" beruhigen lassen. Die + Kunden, die am ehesten ueberprueft, sind genau diejenigen, die den + schlechtesten Service erhalten (Satz 4). + +2. **Ein Wettbewerber SLAs pro Ticket anbietet.** „P1 innerhalb von + 4 Stunden geloest" schlaegt „durchschnittliche Loesungszeit unter + 7 Stunden" fuer jeden Kunden mit kritischen Beduerfnissen. + +3. **Das Team die Metrik verinnerlicht.** Wenn das Team glaubt, die + Metrik spiegle die tatsaechliche Leistung wider, verliert es die + Faehigkeit zu erkennen, wenn kritische Arbeit vernachlaessigt wird. + Die Metrik wird zu einer epistemischen Gefahr. + +### 7.4 Das allgemeine Muster + +Dieses Muster — Proxy ersetzt Qualitaet, Proxy wird optimiert, Qualitaet +divergiert, System ist stabil bis es von der Realitaet getestet wird — +wiederholt sich in verschiedenen Domaenen. Muller [19] dokumentiert es +ausfuehrlich als „Metrik-Fixierung"; Campbell [24] formalisierte den +korrumpierenden Effekt der Verwendung von Indikatoren als Ziele. + +| Domaene | Proxy-Metrik | Zugrunde liegende Qualitaet | Divergenz | +|--------|-------------|-------------------|------------| +| IT-Support | Durchschn. Loesungszeit | Verfuegbarkeit kritischer Systeme | Server 19 Std. ausgefallen, Durchschnitt sagt 6,5 | +| Bildung | Testergebnisse | Tatsaechliches Lernen | Lehren fuer den Test | +| Gesundheitswesen | Patientendurchsatz | Patientenergebnisse | Schnellere Entlassungen, hoehere Wiederaufnahme | +| Finanzen | Quartalsergebnisse | Langfristiger Wert | Kostensenkung blaest EPS auf, erodiert Faehigkeiten | +| Software | Velocity (Story Points) | Produktqualitaet | Punkteinflation, halbfertige Features | + +### 7.5 Informationsasymmetrie + +Modelliere das System als Spiel zwischen Anbieter (A) und Kunde (K). A +beobachtet die einzelnen $\{C_i\}$ und waehlt $\sigma$; K beobachtet nur +$\bar{C}(\sigma)$. Dies ist ein **Moral-Hazard**-Problem [10]: Die +optimale Strategie von A ist, das beobachtbare Signal zu minimieren, +unabhaengig von der nicht beobachtbaren Verteilung. + +Das Gleichgewicht ist ein **Pooling-Gleichgewicht** [9]: Die berichtete +Metrik von A sieht unabhaengig von der zugrunde liegenden +prioritaetsgewichteten Leistung identisch aus. Es ist stabil, bis K +Zugang zu den einzelnen $C_i$-Werten erhaelt — ueber ein Kundenportal, +die Transparenz eines Wettbewerbers oder einen hinreichend schmerzhaften +Vorfall. + +### 7.6 Die unbequeme Schlussfolgerung + +Die ehrliche Antwort auf „Schadet die Optimierung des ungewichteten +Mittelwerts dem Geschaeft?" lautet: **Nicht unbedingt, solange der Kunde +nie hinter die Zahl schaut.** Die ehrliche Antwort auf „Ist das +nachhaltig?" lautet: Es ist genau so nachhaltig wie jedes System, in dem +der Verkaeufer mehr weiss als der Kaeufer — stabil ueber laengere +Zeitraeume, dann rapider Zusammenbruch, wenn die Asymmetrie durchbrochen +wird. + +--- + +## 8. Die psychologischen Kosten des Wissens + +Abschnitt 7 modellierte den Anbieter als einheitlichen Akteur. Aber Teams +bestehen aus Individuen. Wenn ein Teammitglied den Beweis versteht — wenn +es *weiss*, dass die Metrik synthetisch ist, dass das Dashboard Theater +ist, dass der E-Mail-Server immer noch ausgefallen ist, waehrend es +Hintergrund-Tickets schliesst — entsteht ein neuer Kostenfaktor, den das +Gleichgewichtsmodell ausgelassen hat. + +### 8.1 Die verborgene Variable: Teamwissen + +| Akteur | Beobachtet einzelne $C_i$ | Beobachtet $\bar{C}$ | Versteht den Beweis | +|-------|--------------------------|--------------------|-----------------------| +| Management | Moeglicherweise | Ja | Variiert | +| Teammitglied | **Ja** | Ja | **Ja** (in diesem Szenario) | +| Kunde | Nein | Ja | Nein | + +Das Teammitglied hat vollstaendige Information. Es sieht die +Ticket-Warteschlange. Es weiss, dass der E-Mail-Server seit 7 Uhr +ausgefallen ist. Es weiss, dass es ein Hintergrund-Ticket schliesst, weil +es die Zahl verbessert. Und es weiss *warum*. + +### 8.2 Kognitive Dissonanz unter vollstaendiger Information + +Kognitive Dissonanz [11] entsteht, wenn ein Individuum widerspruechliche +Kognitionen hat. Ohne zu verstehen *warum*, kann der Widerspruch +rationalisiert werden: „Das Management weiss es besser." Das Verstaendnis +des Beweises beseitigt die Ambiguitaet. Das Teammitglied haelt nun: + +- **Kognition A:** „Ich bin ein kompetenter Fachmann. Meine Aufgabe ist + es, wichtige Probleme zu loesen." +- **Kognition B:** „Ich schliesse ein Hintergrund-Ticket, waehrend der + E-Mail-Server ausgefallen ist, weil die Metrik mathematisch verzerrt + ist (Satz 1), die Umordnung keinen Durchsatz erzeugt (Satz 6), und + der einzige Nutzniesser das Dashboard ist (Abschnitt 7). Ich kann + dies beweisen." + +Die Dissonanz ist nun *tragend*. Die verfuegbaren Loesungen — berufliche +Identitaet aufgeben, den Beweis ablehnen, fuer Veraenderung eintreten +oder kuendigen — verursachen jeweils Kosten, die vorher nicht existierten. + +### 8.3 Selbstbestimmungstheorie: Drei verletzte Beduerfnisse + +Decis und Ryans Selbstbestimmungstheorie [12, 13] identifiziert drei +Beduerfnisse, die intrinsische Motivation vorhersagen: + +**Autonomie.** Die Metrik schraenkt Entscheidungen in einer Weise ein, die +das Teammitglied als mathematisch suboptimal erkennt. Ein Mitarbeiter, der +versteht, dass der Prozess nachweislich kontraproduktiv ist, kann sich bei +dessen Befolgung nicht autonom fuehlen. + +**Kompetenz.** Die Metrik belohnt *scheinbare* Effektivitaet (niedriges +$\bar{C}$), waehrend sie gegenueber *tatsaechlicher* Effektivitaet +invariant ist (Satz 6). Echte Kompetenz — den E-Mail-Server zuerst zu +reparieren — wird von der Metrik *bestraft*. + +**Soziale Eingebundenheit.** Das Teammitglied weiss, dass der +E-Mail-Server des Kunden ausgefallen ist. Es koennte helfen. Stattdessen +aktualisiert es Hintergruende — nicht weil es jemandem hilft, sondern weil +es einer Zahl hilft. Die Verbindung zwischen Arbeit und menschlicher +Wirkung ist gekappt, und das Teammitglied kann die getrennten Enden sehen. + +### 8.4 Moralische Verletzung + +Moralische Verletzung [16, 17] ist der dauerhafte Schaden, der durch +„Begehen, Nicht-Verhindern, Bezeugen oder Erfahren von Handlungen, die +tief verwurzelte moralische Ueberzeugungen verletzen" [17] verursacht +wird. Das Konzept wurde seitdem auf geschaeftliche Kontexte erweitert +[25]. Die entscheidende Unterscheidung zu Burnout: **Burnout ist +Erschoepfung durch zu viel Arbeit. Moralische Verletzung ist Schaden +durch das Tun des Falschen.** + +Ein Teammitglied, das weiss, dass der E-Mail-Server ausgefallen ist, das +weiss, dass es ihn reparieren sollte, stattdessen ein Hintergrund-Ticket +schliesst und dies tut, weil die Metrik es verlangt, erlebt die +strukturellen Bedingungen fuer moralische Verletzung. + +### 8.5 Erlernte Hilflosigkeit und Metrik-Fatalismus + +Seligmans erlernte Hilflosigkeit [14, 15] beschreibt, wie die +Konfrontation mit unkontrollierbaren negativen Ergebnissen zu Passivitaet +fuehrt. Die Abfolge: + +1. Die Metrik ist fehlerhaft (Beweis verstanden). +2. Fuer Veraenderung eintreten. +3. Abgelehnt („die Zahlen sind gut, mach keine Wellen"). +4. Wiederholung mit abnehmender Ueberzeugung. +5. Endzustand: „Die Metrik ist wie sie ist. Ich schliesse einfach Tickets." + +Dies ist keine Faulheit. Es ist die rationale Reaktion auf ein System, das +korrektes Verhalten bestraft und inkorrektes Verhalten belohnt, wenn das +Individuum keine Macht hat, das System zu aendern. + +### 8.6 Die adversariale Selektionsspirale + +Kombination des Gleichgewichts aus Abschnitt 7 mit der +Fluktuationsdynamik: + +1. Organisation fuehrt ungewichteten Mittelwert ein. Metrik sieht gut aus + (SPT). +2. Bewusste, kompetente Teammitglieder erleiden psychologische Kosten + (8.2–8.5). +3. Diese Mitglieder gehen. Sie werden durch Mitglieder ersetzt, die die + Maengel der Metrik nicht verstehen oder denen sie gleichgueltig sind. +4. Die Metrik sieht weiterhin gut aus — sie tut dies unter SPT immer, + unabhaengig von der Teamkompetenz (Korollar 6.1). +5. Die tatsaechliche Servicequalitaet verschlechtert sich, aber die Metrik + kann dies nicht erkennen (Korollar 9.1). +6. Zurueck zu Schritt 1. + +Die Metrik selektiert *gegen* die Personen, die das System verbessern +wuerden, und *fuer* die Personen, die es nicht in Frage stellen werden. +Das System stabilisiert sich auf einem niedrigeren Kompetenzniveau, +unsichtbar fuer seinen eigenen Messapparat. + +### 8.7 Das vollstaendige Kostenmodell + +| Abschnitt 7 (sichtbar) | Abschnitt 8 (verborgen) | +|---------------------|---------------------| +| Kunde zufrieden (gute Zahl) | Team unzufrieden (schlechte Realitaet) | +| Durchsatz unveraendert | Freiwilliges Engagement zurueckgezogen | +| Metrik verbessert sich | Kompetente Mitglieder gehen | +| Geschaeftsoekonomie stabil | Institutionelle Kompetenz degeneriert | + +Diese wirken auf unterschiedlichen Zeitskalen: Das Gleichgewicht ist +quartalsweise sichtbar; die Kompetenzdegradation wird ueber Jahre +sichtbar. Das vollstaendige Modell lautet: **Die Metrik funktioniert, und +sie ist destruktiv, und die Destruktion ist fuer die Metrik unsichtbar.** +Die Metrik ist frischer Anstrich auf korrodiertem Bewehrungsstahl. + +--- + +## 9. Manager-Internalisierung: Die umsetzbare Loesung + +Die Abschnitte 2–6 sagen: Lehne die Metrik ab. Abschnitt 7 sagt: Die +Metrik funktioniert (fuer das Geschaeft). Abschnitt 8 sagt: Sie +zerstoert das Team. In der Praxis koennen die meisten Manager die Metrik +nicht einseitig aendern. Die beste Loesung ist eine unternehmensweite +Metrikreform. Die *umsetzbare* Loesung ist, was ein einzelner informierter +Manager jetzt tun kann. + +### 9.1 Die Strategie + +Ein Manager, der den Beweis versteht, kann **die Limitierungen der +Metrik internalisieren, ohne sie an das Team weiterzugeben**: + +1. **Primaer nach Prioritaet planen.** Das Team bearbeitet kritische + Aufgaben zuerst. +2. **Taktisch kleine Aufgaben einstreuen.** Wenn eine kleine Aufgabe + niedriger Prioritaet abgeschlossen werden kann, ohne die + hochprioritaere Arbeit wesentlich zu verzoegern, erledige sie. Nicht + weil die Metrik es verlangt, sondern weil sie ebenfalls erledigt werden + muss und fast nichts kostet. +3. **Niemals die Metrik als Motivation offenlegen.** „Erledige diese + schnelle Aufgabe, waehrend wir auf den Rueckruf des Lieferanten zum + P1 warten" — nicht „Wir muessen unseren Durchschnitt senken." Die + intrinsische Motivation des Teams bleibt intakt (Abschnitt 8). Der + Manager absorbiert die Last des Metrik-Managements. + +### 9.2 Formalisierung + +Das Optimierungsproblem des Managers ist eine eingeschraenkte Optimierung: + +$$\min_{\sigma} \sum_{i=1}^{n} w(q_i) \cdot C_i \quad \text{unter der Nebenbedingung} \quad \bar{C}(\sigma) \le \bar{C}_{\text{target}}$$ + +**Satz 12 (Begrenzte Metrikkosten der Prioritaetsplanung).** Ein Manager, +der SPT *innerhalb* jeder Prioritaetsklasse und Prioritaetsordnung +*zwischen* den Klassen anwendet, wird eine Metrik nahe dem +SPT-optimalen Wert erzielen — die Luecke entsteht nur durch +zwischenklassige Inversionen. + +**Beweisskizze.** Innerhalb jeder Prioritaetsklasse ist SPT kostenlos +(alle Aufgaben haben gleiche Prioritaet). Die einzige Abweichung vom +globalen SPT ist die Ordnung zwischen den Klassen. Jede +klassenuebergreifende Inversion kostet hoechstens +$p_{\text{large}} - p_{\text{small}}$ in der ungewichteten Summe, und +diese Inversionen sind durch die Anzahl der Klassen begrenzt. In der +Praxis liegt die Luecke typischerweise innerhalb von 10–20% des +SPT-Optimums. $\blacksquare$ + +### 9.3 Der Manager als Informationsbarriere + +| Ebene | Sieht Metrik | Sieht Prioritaeten | Sieht Beweis | +|-------|-----------|----------------|------------| +| Organisation | Ja | Nominell | Nein | +| Manager | Ja | Ja | **Ja** | +| Team | Nein (abgeschirmt) | Ja | Irrelevant | +| Kunde | Ja (Dashboard) | Ueber SLA | Nein | + +Der Manager ist der einzige Akteur, der alle drei Informationsstuecke +besitzt. Dies ist keine Manipulation — er erledigt die richtige Arbeit in +der richtigen Reihenfolge, und die Metrik ist akzeptabel, weil SPT +innerhalb der Klassen kostenlos ist. + +### 9.4 Der Zusammenbruch im Wettbewerb + +Diese Strategie versagt, wenn die Metrik **wettbewerblich zwischen Teams** +eingesetzt wird. + +**Fall 1: Kooperativ** — Teams werden auf Paritaet gemessen, nicht auf +Rangfolge. Jeder Manager wendet unabhaengig die Internalisierungsstrategie +an. Die Metrik ist dekorativ, aber harmlos. Dies ist ein +**Koordinationsspiel** mit einem stabilen kooperativen Gleichgewicht. + +**Fall 2: Wettbewerblich** — Teams werden nach $\bar{C}$ rangiert. Dies +ist ein **Gefangenendilemma**: + +| | Team B: Prioritaet zuerst | Team B: SPT | +|---|---|---| +| **Team A: Prioritaet zuerst** | (Gute Arbeit, Gute Arbeit) | (A sieht schlecht aus, B sieht gut aus) | +| **Team A: SPT** | (A sieht gut aus, B sieht schlecht aus) | (Beide sehen gut aus, beide machen falsche Arbeit) | + +Das Nash-Gleichgewicht ist (SPT, SPT). Die Internalisierungsstrategie ist +ein kooperatives Gleichgewicht, das **unter Wettbewerb nicht stabil** ist. + +### 9.5 Geltungsbereich + +| Bedingung | Tragfaehigkeit | +|-----------|-----------| +| Metrik zur Gesundheitspruefung / Paritaet verwendet | **Tragfaehig** | +| Metrik sichtbar, aber nicht rangiert | **Tragfaehig** | +| Metrik teamuebergreifend rangiert | **Fragil** — erfordert Kooperation aller Manager | +| Metrik an Verguetung / Ressourcen gekoppelt | **Nicht tragfaehig** — Gefangenendilemma dominiert | +| Metrikreform auf Organisationsebene moeglich | **Unnoetig** — behebe stattdessen die Metrik | + +**Die beste Loesung ist unternehmensweit. Die umsetzbare Loesung ist ein +Manager, der diesen Beweis versteht, sein Team vor der Metrik abschirmt, +nach Prioritaet plant und SPT nur innerhalb von Prioritaetsklassen +einsetzt, um die Zahl in einem akzeptablen Rahmen zu halten.** + +--- + +# Teil IV: Bewertung + +## 10. Advocatus Diaboli + +Intellektuelle Ehrlichkeit erfordert die Anerkennung der Grenzen der +Argumentation. + +### 10.1 Einfachheit hat einen realen Wert + +**Argument.** Der ungewichtete Mittelwert erfordert keine +Prioritaetsgewichte, keine Aufgabengroessenschaetzungen, keine +Kalibrierung. + +**Bewertung: Korrekt.** Aber die ungewichtete Metrik vermeidet keine +Annahmen — sie *verbirgt* sie, indem sie implizit alle Gewichte auf 1 und +alle Groessen auf 1 setzt. Eine bekannt ungenaue Schaetzung der +Aufgabengroesse ist immer noch informativer als die implizite Annahme, +dass alle Groessen gleich sind. + +### 10.2 Minimierung der Anzahl wartender Personen + +**Argument.** SPT minimiert die gesamten Personen-Stunden des Wartens. +Wenn jede Aufgabe einen Kunden repraesentiert, ist dies optimal. + +**Bewertung: Mathematisch korrekt.** Wenn Sie eine Zulassungsstelle +betreiben und die Zeit jeder Person gleich wertvoll ist, ist SPT die +richtige Strategie. Sie versagt, wenn Aufgaben nicht im Verhaeltnis 1:1 +zu Kunden stehen, die Wartekosten nicht einheitlich sind oder die Metrik +zur Bewertung von Teams statt zur Bedienung einer buchstaeblichen +Warteschlange verwendet wird. + +### 10.3 SPT als Triage-Heuristik + +**Argument.** Wenn sich Aufgabengroessen eng buendeln, approximiert SPT +FIFO und der ungewichtete Mittelwert approximiert den gewichteten +Mittelwert. + +**Bewertung: Korrekt.** Der Variationskoeffizient $CV = \sigma_p / \bar{p}$ bestimmt das Ausmass der Verzerrung: + +| $CV$ | Aufgabengroessenverteilung | Verzerrung | +|------|----------------------|------------| +| < 0,3 | Eng (Callcenter) | Vernachlaessigbar | +| 0,3 – 1,0 | Moderat (gemischte IT) | Moderat | +| > 1,0 | Breit (typische IT-Warteschlange) | Schwerwiegend | + +Ein typischer IT-Desk umfasst 15 Minuten bis 40+ Stunden ($CV > 2$). Die +Verzerrung ist kein Grenzfall — sie ist der Normalfall. + +### 10.4 Manipulation erfordert boeswillige Absicht + +**Argument.** Die Saetze zeigen, dass die Metrik manipuliert werden +*kann*, nicht dass sie manipuliert *wird*. + +**Bewertung: Dies ist das staerkste Gegenargument.** Wenn die Metrik +rein informativ ist und niemals Verhalten beeinflusst, fehlt der +Manipulationsanreiz. Allerdings wird jede Metrik, die dem Management +berichtet, an OKRs gekoppelt oder in Retrospektiven diskutiert wird, +Verhalten beeinflussen. Dies ist Goodharts Gesetz [6, 7] — und es gilt +fuer gut gemeinte Teams ebenso zuverlaessig wie fuer zynische. Die +Verschiebung geschieht organisch: Drei einfache Tickets abzuschliessen +„fuehlt sich produktiv an", waehrend die Metrik das Gefuehl bestaetigt. + +### 10.5 Wann der ungewichtete Mittelwert vertretbar ist + +Die Metrik ist **nur dann vertretbar, wenn alle vier Bedingungen +gleichzeitig gelten**: + +1. Aufgabengroessen sind annaehernd einheitlich ($CV < 0,3$) +2. Keine Prioritaetsdifferenzierung (alle Aufgaben gleich wichtig) +3. Jede Aufgabe repraesentiert genau einen Kunden +4. Die Metrik wird nicht zur Bewertung, Belohnung oder Verhaltenssteuerung + eingesetzt + +Diese Bedingungen sind in den Systemen, in denen die Metrik am haeufigsten +eingesetzt wird, selten erfuellt. + +--- + +## 11. Verwandte Arbeiten + +Diese Arbeit steht an der Schnittstelle mehrerer Literaturbereiche, die +zuvor nicht miteinander verbunden wurden. + +### 11.1 Ablaufplanungstheorie und Fairness + +Smith [1] etablierte das SPT-Optimalitaetsergebnis und die WSJF-Regel im +Jahr 1956. Conway, Maxwell und Miller [2] lieferten die umfassende +Lehrbuchdarstellung. Die Fairness groessenbasierter Planungsstrategien +wurde in der Ablaufplanung fuer Computersysteme diskutiert: Bansal und +Harchol-Balter [22] untersuchten die SRPT-Unfairness; Wierman und +Harchol-Balter [23] formalisierten Fairness-Klassifikationen gegenueber +Processor-Sharing; Angel, Bampis und Pascual [21] massen die +SPT-Ablaufplanqualitaet anhand fairer Optimalitaetskriterien. + +Diese frueheren Arbeiten analysieren Fairness in der CPU- und +Server-Ablaufplanung. Die vorliegende Arbeit wendet dieselben +mathematischen Ergebnisse auf *organisatorisches Aufgabenmanagement* an, +bei dem der „Scheduler" ein menschliches Team ist, die „Jobs" +Kundenanfragen mit geschaeftsrelevanten Prioritaeten sind und die +„Zielfunktion" eine Management-Metrik ist. Der Mechanismus ist identisch; +die Konsequenzen unterscheiden sich, weil organisatorische Ablaufplanung +Prioritaetssysteme, Kundenbeziehungen und psychologische Kosten hat, die +CPU-Ablaufplanung nicht hat. + +### 11.2 Messdysfunktion + +Austin [18] bewies, dass unvollstaendige Messung — die Messung nur einer +Teilmenge der relevanten Dimensionen — Anreize schafft, die gemessenen +Dimensionen auf Kosten der ungemessenen zu optimieren, und dass dieser +Effekt nicht nur moeglich, sondern *unvermeidlich* ist, wenn die Messung +an Belohnungen gekoppelt wird. Sein Rahmen der Informationsasymmetrie +entspricht eng Abschnitt 7. Die vorliegende Arbeit liefert den +spezifischen mathematischen Mechanismus (Saetze 1–2) fuer den Fall der +Aufgabenplanung und erweitert die Argumentation durch Psychologie +(Abschnitt 8), um die vollstaendige Kette organisatorischen Schadens +nachzuzeichnen. + +Muller [19] dokumentierte „Metrik-Fixierung" in Bildung, +Gesundheitswesen, Polizei und Finanzen und lieferte umfangreiche +empirische Belege fuer die in Abschnitt 7.4 theoretisierten Muster. +Campbell [24] formalisierte den korrumpierenden Effekt der Verwendung +von Indikatoren als Ziele und ergaenzte damit Goodharts urspruengliche +Beobachtung [6] und Stratherns Verallgemeinerung [7]. + +Bevan und Hood [26] dokumentierten empirisch Manipulationsverhalten im +englischen oeffentlichen Gesundheitssystem — einschliesslich genau der +Muster des „Ziel getroffen und den Sinn verfehlt", die in unserem +Abschnitt 5.2 beschrieben werden. + +### 11.3 Psychologische Kosten von Metrikdysfunktion + +Die Anwendung moralischer Verletzung (Shay [16], Litz et al. [17]) auf +geschaeftliche Kontexte hat juengere Vorlaeufer: Eine Studie im *Journal +of Business Ethics* von 2024 [25] erweiterte das Konstrukt explizit auf +gewinnorientierte Arbeitsplaetze und fand strukturelle Bedingungen, die +den in Abschnitt 8.4 beschriebenen aehneln. Moore [27] analysierte +moralisches *Disengagement* — die kognitive Umstrukturierung, die +unethisches Verhalten unter organisatorischem Druck ermoeglicht. Die +vorliegende Arbeit behandelt das komplementaere Phaenomen: den Schaden +fuer Individuen, die sich *weigern*, sich zu distanzieren. + +### 11.4 Was ist neu + +Die einzelnen Komponenten — SPT-Optimalitaet, Goodharts Gesetz, +Messdysfunktion, moralische Verletzung — haben alle Vorlaeufer. Die +Beitraege dieser Arbeit sind: + +1. **Der Erhaltungssatz (Satz 2) praeskriptiv verwendet** — als + konstruktives Argument, dass arbeitsgewichtete Abschlusszeit *nicht* + manipuliert werden kann, anstatt als theoretisches + Ablaufplanungsergebnis. + +2. **Der spezifische Beweis, dass Prioritaetsklassen die Metrik + algebraisch adversarial machen** (Saetze 8–9) — nicht lediglich + empirisch schlecht, sondern strukturell widerspruechlich, mit null + Transinformation zwischen Ablaufplan und Prioritaetssystem. + +3. **Die integrierte Kette** vom mathematischen Beweis ueber + Informationsasymmetrie ueber psychologischen Schaden zur adversarialen + Selektionsspirale — die Verfolgung einer einzelnen Metrik von Smith + (1956) bis zur organisatorischen Aushoelung. + +4. **Die Manager-Internalisierungsstrategie** (Abschnitt 9) mit formaler + spieltheoretischer Analyse ihrer Stabilitaet und + Zusammenbruchbedingungen unter teamuebergreifendem Wettbewerb. + +5. **Die Anwendung der Ablaufplanungstheorie auf organisatorische + Managementkritik** — der Beweis, dass eine gaengig verwendete + Team-Metrik spezifische, quantifizierbare Pathologien aufweist, + anstatt anekdotisch oder aus allgemeinen Prinzipien zu argumentieren. + +--- + +## 12. Schlussfolgerung + +Die ungewichtete durchschnittliche Abschlusszeit ist eine **verzerrte +Statistik**, die: + +1. Durch Planungsstrategie **manipuliert werden kann** (Satz 1), im + Gegensatz zur arbeitsgewichteten Abschlusszeit, die planungsinvariant + ist (Satz 2). +2. Die **Aushungerung** grosser Aufgaben **incentiviert** (Satz 3). +3. Die **Kundenzufriedenheit verschlechtert**, ohne kompensierenden + Produktivitaetsgewinn (Satz 7). +4. **Prioritaetssystemen aktiv widerspricht**, indem sie keinerlei + Information ueber die Geschaeftsauswirkungsklassifikation traegt + (Satz 9). +5. **Prioritaet vollstaendig ignoriert** in ihrer Planungsempfehlung und + suboptimale prioritaetsgewichtete Verzoegerung erzeugt, wann immer + Prioritaet und Groesse nicht perfekt invers korreliert sind (Satz 10). + +Eine Metrik, die durch Umordnung der Arbeit verbessert werden kann — ohne +zusaetzliche Arbeit zu leisten — misst die Planungsstrategie, nicht die +Kapazitaet des Systems. In Kombination mit einem Prioritaetssystem +empfiehlt sie den Ablaufplan, der den groessten Schaden an der +hoechstprioritaeren Arbeit anrichtet. + +Wenn die Metrik an Kunden berichtet wird, erzeugt sie eine +Informationsasymmetrie (Abschnitt 7), deren Geschaeftsgleichgewicht +profitabel, aber fragil ist. Wenn Teammitglieder ihre Maengel verstehen, +verletzt sie deren intrinsische Motivation und selektiert fuer den +Weggang der kompetentesten Personen (Abschnitt 8). Ein einzelner +informierter Manager kann diese Effekte durch eingeschraenkte Optimierung +teilweise abmildern (Abschnitt 9), aber diese kooperative Strategie ist +unter teamuebergreifendem Wettbewerb nicht stabil. + +Der ungewichtete Mittelwert ist nur unter engen Bedingungen vertretbar +(Abschnitt 10.5): einheitliche Aufgabengroessen, keine Prioritaeten, +Eins-zu-eins-Zuordnung von Kunden zu Aufgaben und kein +Verhaltenseinfluss. Diese Bedingungen sind selten erfuellt. + +**Die ungewichtete durchschnittliche Abschlusszeit ist kein faires oder +genaues Mass fuer die Aufgabenausfuehrungsleistung. Ihre Einfuehrung als +Team-Metrik wird rational zur Aushungerung komplexer Arbeit, zur +Verletzung erklaerter Prioritaeten, zu ungerechten Kundenergebnissen und +zur Illusion von Produktivitaet fuehren, wo keine existiert.** + +Die beste Loesung ist eine organisatorische Metrikreform. Die umsetzbare +Loesung ist ein Manager, der diesen Beweis versteht. + +--- + +## Literaturverzeichnis + +### Ablaufplanungstheorie + +[1] Smith, W. E. (1956). Various optimizers for single-stage production. +*Naval Research Logistics Quarterly*, 3(1–2), 59–66. +doi:[10.1002/nav.3800030106](https://doi.org/10.1002/nav.3800030106) + +> Ursprung des SPT-Optimalitaetsergebnisses (Satz 1), der Regel fuer die +> gewichtete Abschlusszeit $w_i/p_i$ absteigend (WSJF, Satz 11) und der +> Beweistechnik des paarweisen Austauschs benachbarter Aufgaben +> (Austauschmethode), die durchgehend verwendet wird. + +[2] Conway, R. W., Maxwell, W. L., & Miller, L. W. (1967). *Theory of +Scheduling*. Addison-Wesley. + +> Standardlehrbuch zur Einmaschinenablaufplanungstheorie, das Smiths +> Ergebnisse erweitert. + +[3] Little, J. D. C. (1961). A proof for the queuing formula: L = λW. +*Operations Research*, 9(3), 383–387. +doi:[10.1287/opre.9.3.383](https://doi.org/10.1287/opre.9.3.383) + +> Erster rigoroser Beweis von Littles Gesetz. Referenziert in Abschnitt 3.2 +> fuer den warteschlangentheoretischen Kontext. + +[4] Little, J. D. C. (2011). Little's Law as viewed on its 50th +anniversary. *Operations Research*, 59(3), 536–549. +doi:[10.1287/opre.1110.0941](https://doi.org/10.1287/opre.1110.0941) + +> Rueckblick mit Diskussion von Umfang, Einschraenkungen und haeufigen +> Fehlanwendungen. + +[5] Reinertsen, D. G. (2009). *The Principles of Product Development +Flow: Second Generation Lean Product Development*. Celeritas Publishing. +ISBN: 978-0-9844512-0-8. + +> Popularisierte WSJF und „Cost of Delay / Duration" in agilen/schlanken +> Kontexten. Die mathematische Grundlage ist Smith (1956) [1]. + +### Messung und Anreize + +[6] Goodhart, C. A. E. (1984). Problems of monetary management: The U.K. +experience. In *Monetary Theory and Practice* (pp. 91–121). Macmillan. + +> Quelle von Goodharts Gesetz: „Jede beobachtete statistische +> Regelmaessigkeit wird dazu neigen zusammenzubrechen, sobald Druck auf +> sie zu Kontrollzwecken ausgeuebt wird." + +[7] Strathern, M. (1997). 'Improving ratings': Audit in the British +university system. *European Review*, 5(3), 305–321. +doi:[10.1002/(SICI)1234-981X(199707)5:3<305::AID-EURO184>3.0.CO;2-4](https://doi.org/10.1002/(SICI)1234-981X(199707)5:3%3C305::AID-EURO184%3E3.0.CO;2-4) + +> Verallgemeinerung von Goodharts Gesetz: „Wenn ein Mass zum Ziel wird, +> hoert es auf, ein gutes Mass zu sein." + +### Verhaltensoekonomie + +[8] Kahneman, D., & Tversky, A. (1979). Prospect theory: An analysis of +decision under risk. *Econometrica*, 47(2), 263–292. +doi:[10.2307/1914185](https://doi.org/10.2307/1914185) + +> Etablierte die Verlustaversion. Referenziert in Abschnitt 4.5. + +### Spieltheorie und Vertragstheorie + +[9] Akerlof, G. A. (1970). The market for "lemons": Quality uncertainty +and the market mechanism. *The Quarterly Journal of Economics*, 84(3), +488–500. doi:[10.2307/1879431](https://doi.org/10.2307/1879431) + +> Informationsasymmetrie und adverse Selektion. Das Pooling-Gleichgewicht +> in Abschnitt 7.5 ist strukturell analog. + +[10] Hölmstrom, B. (1979). Moral hazard and observability. *The Bell +Journal of Economics*, 10(1), 74–91. +doi:[10.2307/3003320](https://doi.org/10.2307/3003320) + +> Formale Behandlung von Moral Hazard. Das Metrik-Berichtsszenario in +> Abschnitt 7.5 ist ein Moral-Hazard-Problem. + +### Psychologie + +[11] Festinger, L. (1957). *A Theory of Cognitive Dissonance*. Stanford +University Press. ISBN: 978-0-8047-0131-0. + +> Grundlegende Theorie. Referenziert in Abschnitt 8.2. + +[12] Deci, E. L., & Ryan, R. M. (1985). *Intrinsic Motivation and +Self-Determination in Human Behavior*. Plenum Press. +ISBN: 978-0-306-42022-1. + +> Originaldarstellung der Selbstbestimmungstheorie. Referenziert in +> Abschnitt 8.3. + +[13] Ryan, R. M., & Deci, E. L. (2000). Self-determination theory and +the facilitation of intrinsic motivation, social development, and +well-being. *American Psychologist*, 55(1), 68–78. +doi:[10.1037/0003-066X.55.1.68](https://doi.org/10.1037/0003-066X.55.1.68) + +> SDT-Ueberblick, der Beduerfnisbefriedigung mit intrinsischer Motivation +> und Wohlbefinden verknuepft. + +[14] Seligman, M. E. P., & Maier, S. F. (1967). Failure to escape +traumatic shock. *Journal of Experimental Psychology*, 74(1), 1–9. +doi:[10.1037/h0024514](https://doi.org/10.1037/h0024514) + +> Urspruengliche Demonstration der erlernten Hilflosigkeit. Referenziert +> in Abschnitt 8.5. + +[15] Seligman, M. E. P. (1975). *Helplessness: On Depression, +Development, and Death*. W. H. Freeman. ISBN: 978-0-7167-0752-3. + +> Erweiterte Darstellung, die erlernte Hilflosigkeit mit menschlicher +> Depression und institutionellem Verhalten verbindet. + +[16] Shay, J. (1994). *Achilles in Vietnam: Combat Trauma and the Undoing +of Character*. Atheneum / Simon & Schuster. ISBN: 978-0-689-12182-3. + +> Einfuehrung des Konzepts der moralischen Verletzung. Referenziert in +> Abschnitt 8.4. + +[17] Litz, B. T., Stein, N., Delaney, E., Lebowitz, L., Nash, W. P., +Silva, C., & Maguen, S. (2009). Moral injury and moral repair in war +veterans: A preliminary model and intervention strategy. *Clinical +Psychology Review*, 29(8), 695–706. +doi:[10.1016/j.cpr.2009.07.003](https://doi.org/10.1016/j.cpr.2009.07.003) + +> Formalisierte moralische Verletzung als klinisches Konstrukt. Definition +> zitiert in Abschnitt 8.4. + +### Organisatorische Messung + +[18] Austin, R. D. (1996). *Measuring and Managing Performance in +Organizations*. Dorset House. ISBN: 978-0-932633-36-1. + +> Bewies, dass unvollstaendige Messung unvermeidlich Anreize schafft, die +> gemessenen Dimensionen auf Kosten der ungemessenen zu optimieren. Der +> Rahmen der Informationsasymmetrie entspricht eng Abschnitt 7. Der +> wichtigste einzelne Vorlaeufer der Argumentation dieser Arbeit. + +[19] Muller, J. Z. (2018). *The Tyranny of Metrics*. Princeton University +Press. ISBN: 978-0-691-17495-2. + +> Umfassende Behandlung der „Metrik-Fixierung" in Bildung, +> Gesundheitswesen, Polizei und Finanzen. Umfangreiche empirische Belege +> fuer die in Abschnitt 7.4 theoretisierten Muster. + +### Fairness in der Ablaufplanung + +[20] Coffman, E. G., Shanthikumar, J. G., & Yao, D. D. (1992). +Multiclass queueing systems: Polymatroid structure and optimal scheduling +control. *Operations Research*, 40(S2), S293–S299. + +> Erhaltungssaetze in der Ablaufplanung. Die Planungsinvarianz der +> arbeitsgewichteten Abschlusszeit (Satz 2) ist ein Beispiel dieser +> Erhaltungssaetze. + +[21] Angel, E., Bampis, E., & Pascual, F. (2008). How good are SPT +schedules for fair optimality criteria? *Annals of Operations Research*, +159(1), 53–64. doi:[10.1007/s10479-007-0267-0](https://doi.org/10.1007/s10479-007-0267-0) + +> Misst direkt die Qualitaet von SPT-Ablaufplaenen anhand von +> Fairness-Kriterien. Naechster Vorlaeufer in der Ablaufplanungstheorie +> zur Fairness-Analyse in Abschnitt 4. + +[22] Bansal, N., & Harchol-Balter, M. (2001). Analysis of SRPT +scheduling: Investigating unfairness. *ACM SIGMETRICS Performance +Evaluation Review*, 29(1), 279–290. +doi:[10.1145/384268.378792](https://doi.org/10.1145/384268.378792) + +> Untersucht die Ueberzeugung, dass SRPT grosse Auftraege in der +> Computerablaufplanung unfair benachteiligt. Argumentiert, dass die +> Unfairness geringer ist als angenommen, erkennt aber die +> Grundspannung an. + +[23] Wierman, A., & Harchol-Balter, M. (2003). Classifying scheduling +policies with respect to unfairness in an M/GI/1. *ACM SIGMETRICS +Performance Evaluation Review*, 31(1), 238–249. + +> Formalisiert Fairness-Definitionen fuer Planungsstrategien durch +> Vergleich mit Processor-Sharing. + +### Weitere Referenzen + +[24] Campbell, D. T. (1979). Assessing the impact of planned social +change. *Evaluation and Program Planning*, 2(1), 67–90. +doi:[10.1016/0149-7189(79)90048-X](https://doi.org/10.1016/0149-7189(79)90048-X) + +> Campbells Gesetz: „Je mehr ein quantitativer sozialer Indikator fuer +> soziale Entscheidungsfindung verwendet wird, desto mehr wird er +> Korruptionsdruck ausgesetzt sein und desto eher wird er die sozialen +> Prozesse, die er ueberwachen soll, verzerren und korrumpieren." +> Ergaenzt Goodharts Gesetz [6]. + +[25] Ferreira, C. M., et al. (2024). It's business: A qualitative study +of moral injury in business settings. *Journal of Business Ethics*. +doi:[10.1007/s10551-024-05615-0](https://doi.org/10.1007/s10551-024-05615-0) + +> Erweitert moralische Verletzung auf gewinnorientierte Arbeitsplaetze. +> Validiert die Anwendung von Shay/Litz in Abschnitt 8.4 ueber +> militaerische und Gesundheitskontexte hinaus. + +[26] Bevan, G., & Hood, C. (2006). What's measured is what matters: +Targets and gaming in the English public health care system. *Public +Administration*, 84(3), 517–538. +doi:[10.1111/j.1467-9299.2006.00600.x](https://doi.org/10.1111/j.1467-9299.2006.00600.x) + +> Dokumentiert empirisch Manipulationsverhalten einschliesslich „Ziel +> getroffen und den Sinn verfehlt". Liefert reale Belege fuer den +> Prioritaets-Metrik-Widerspruch in Abschnitt 5.2. + +[27] Moore, C. (2012). Why employees do bad things: Moral disengagement +and unethical organizational behavior. *Personnel Psychology*, 65(1), +1–48. doi:[10.1111/j.1744-6570.2011.01237.x](https://doi.org/10.1111/j.1744-6570.2011.01237.x) + +> Analysiert moralisches *Disengagement* — die kognitive Umstrukturierung, +> die unethisches Verhalten ermoeglicht. Abschnitt 8 behandelt das +> komplementaere Phaenomen: den Schaden fuer Individuen, die sich +> *weigern*, sich zu distanzieren. + +--- + +*Dieser Beweis wurde im Gespraech entwickelt und am 28.03.2026 formalisiert.* diff --git a/README.eo.md b/README.eo.md new file mode 100644 index 0000000..e61d975 --- /dev/null +++ b/README.eo.md @@ -0,0 +1,1258 @@ +# Nepondita Meznombra Kompletiga Tempo Ne Estas Justa Metriko por Taskplanado + +Matematika pruvo, ke nepondita meznombra taskokompletiga tempo estas biasita +statistiko, kiu instigas elektadon de facilaj taskoj, kaj ke ia planada +avantago kiun gi semble malkovras estas artefakto de la metriko --- ne +reflekto de vera trafluo au servokvalito. + +--- + +## 1. Enkonduko + +Multaj organizoj mezuras task-plenuman efikecon per **nepondita meznombra +kompletiga tempo**: la meznombro de horoj (au tagoj) inter taskosendo kaj +taskosolvo, kalkulante ciun taskon egale sendepende de grandeco au +prioritato. + +Ci tiu artikolo pruvas, ke ci tiu metriko ne estas nur malpreciza sed +strukture biasita. Gi povas esti plibonigita per reordigo de laboro sen +fari iun ajn plian laboron (Teoremo 1), dum guste pondita alternativo +estas tute imuna al planada manipulado (Teoremo 2). Kombinite kun +prioritata sistemo, la metriko aktive kontraudiras la proprajn +prioritatoklasifikojn de la organizo (Teoremo 9). + +La argumento procezas en kvar partoj: + +- **Parto I** (Sekcioj 2--4) establas la matematikan fundamenton: + la nepondita meznombro estas manipulebla per la planado Plej Mallonga + Proceza Tempo unue (SPT), la labor-pondita meznombro estas + planed-invarianta, kaj la rezultantaj servokvalitokonsekvencoj estas + pruveble negativaj. + +- **Parto II** (Sekcioj 5--6) etendas la modelon al prioritate klasifikitaj + taskoj, pruvas ke la metriko farighas kontraua al la prioritata sistemo, + kaj proponas ponditajn alternativojn kun detala ekzemplo de IT-servostablo. + +- **Parto III** (Sekcioj 7--9) ekzamenas organizajn dinamikojn: kio okazas + kiam la metriko estas raportita al klientoj (informasimetrio), kio okazas + al teamanoj kiuj komprenas giajn mankojn (psikologia damagho), kaj kion + unu sola informita administranto povas fari pri tio (limigita optimumigo + kun lud-teoria stabileco-analizo). + +- **Parto IV** (Sekcioj 10--12) prezentas honestajn kontrauargumentojn, + situigas la verkon en ekzistanta literaturo, kaj konkludas. + +La kernaj rezultoj konstruighas sur la fundamenta planada teorio de Smith +(1956) [1], etenditaj per ludteorio [9, 10], organiza mezurteorio +[18, 19], kaj psikologio [11--17] por spuri kompletan cenon de matematika +pruvo pri specifa metriko ghis organizaj rezultoj. + +--- + +# Parto I: Matematika Fundamento + +## 2. Difinoj + +Estu **n** taskoj kun procezaj tempoj $p_1, p_2, \ldots, p_n$. + +**Planado** $\sigma$ estas permutacio de $\{1, 2, \ldots, n\}$ asignanta +taskojn al plenuma ordo sur unu sola plenumanto. + +La **kompletiga tempo** de tasko $\sigma(k)$ sub planado $\sigma$ estas: + +$$C_{\sigma(k)} = \sum_{j=1}^{k} p_{\sigma(j)}$$ + +La **nepondita meznombra kompletiga tempo** estas: + +$$\bar{C}(\sigma) = \frac{1}{n} \sum_{k=1}^{n} C_{\sigma(k)}$$ + +La **labor-pondita meznombra kompletiga tempo** estas: + +$$\bar{C}_w(\sigma) = \frac{\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)}}{\sum_{k=1}^{n} p_{\sigma(k)}}$$ + +--- + +## 3. Kernaj Rezultoj + +### 3.1 La Nepondita Meznombro Estas Manipulebla + +**Teoremo 1** (Smith, 1956 [1])**.** La planado kiu minimumigas +$\bar{C}(\sigma)$ estas Plej Mallonga Proceza Tempo unue (SPT): ordigu +taskojn tiel ke $p_{\sigma(1)} \le p_{\sigma(2)} \le \cdots \le p_{\sigma(n)}$. + +**Pruvo (interchangha argumento [1, 2]).** + +Konsideru iun ajn planadon $\sigma$ en kiu du apudaj taskoj $i, j$ kontentigas +$p_i > p_j$ kun tasko $i$ planadita tuj antau tasko $j$. Estu $t$ +la komenca tempo de tasko $i$. + +| | Tasko $i$ finas | Tasko $j$ finas | Sumo | +|---|---|---|---| +| **Antau interchangho** ($i$ poste $j$) | $t + p_i$ | $t + p_i + p_j$ | $2t + 2p_i + p_j$ | +| **Post interchangho** ($j$ poste $i$) | $t + p_j$ | $t + p_j + p_i$ | $2t + p_i + 2p_j$ | + +La shangho en la sumo de kompletigaj tempoj estas: + +$$(2p_i + p_j) - (p_i + 2p_j) = p_i - p_j > 0$$ + +Ciu interchangho de pli-longa-antau-pli-mallonga apuda paro strikte reduktas +la totalon. Iu ajn ne-SPT planado enhavas tian paron. Ripetitaj interchanghoj +konverghas al SPT. Tial SPT unike minimumigas $\bar{C}(\sigma)$. $\blacksquare$ + +### 3.2 La Labor-Pondita Meznombro Estas Planed-Invarianta + +**Teoremo 2.** La labor-pondita meznombra kompletiga tempo $\bar{C}_w(\sigma)$ +estas la sama por ciu planado $\sigma$. + +**Pruvo.** + +Ekspansigu la numeratoron: + +$$\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)} = \sum_{k=1}^{n} p_{\sigma(k)} \sum_{j=1}^{k} p_{\sigma(j)}$$ + +Reindeksu per $a = \sigma(k)$ kaj $b = \sigma(j)$. La duobla sumo +kalkulas ciun ordigitan paron $(a, b)$ kie $b$ estas planadita ne pli +malfrue ol $a$: + +$$= \sum_{\substack{a, b \\ b \preceq_\sigma a}} p_a \, p_b$$ + +Por iu ajn paro $(a, b)$ kun $a \ne b$, ekzakte unu el +$\{b \preceq_\sigma a\}$ au $\{a \prec_\sigma b\}$ validas. La diagonalaj +termoj ($a = b$) kontribuas $p_a^2$ sendepende de ordo. Tial: + +$$\sum_{\substack{a, b \\ b \preceq_\sigma a}} p_a \, p_b = \sum_{a} p_a^2 + \sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b$$ + +Kune kun la komplementa sumo, la du ekster-diagonalaj sumoj kovras ciujn +neordigitajn parojn: + +$$\sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b + \sum_{\substack{a \ne b \\ a \prec_\sigma b}} p_a \, p_b = \sum_{a \ne b} p_a \, p_b$$ + +La dekstra flanko estas planed-sendependa. Per simetrio de $p_a p_b$, +ambau ekster-diagonalaj sumoj estas egalaj: + +$$\sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b = \frac{1}{2} \sum_{a \ne b} p_a \, p_b$$ + +Tial: + +$$\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)} = \sum_a p_a^2 + \frac{1}{2} \sum_{a \ne b} p_a \, p_b = \frac{1}{2}\left(\sum_a p_a\right)^2 + \frac{1}{2}\sum_a p_a^2$$ + +Ci tiu esprimo enhavas neniun referencon al $\sigma$. Car la denominatoro +$\sum p_a$ ankau estas planed-sendependa: + +$$\bar{C}_w(\sigma) = \frac{\frac{1}{2}\left(\sum p_a\right)^2 + \frac{1}{2}\sum p_a^2}{\sum p_a}$$ + +estas **konstanta trans ciuj planadoj**. $\blacksquare$ + +Ci tio estas okazo de la konservoleghoj en planado identigitaj de +Coffman, Shanthikumar, kaj Yao [20]. La invarianteco korespondas al +mezurado de kiom longe unuo de *laboro* atendas prefere ol kiom longe +*tasko* atendas --- la nepondita statistiko kalkulas kompletigojn anstatau +laboron, tial ghi estas manipulebla. (Vidu ankau Little [3, 4] por la +victeoria kunteksto, kun la averto ke la Legho de Little validas rekte +nur por stabilstataj sistemoj, ne por la araj kazoj analizitaj ci tie.) + +### 3.3 Ilustra Ekzemplo + +Du taskoj: $A$ kun $p_A = 1$ horo, $B$ kun $p_B = 10$ horoj. + +| Planado | $C_A$ | $C_B$ | Nepondita meznombro | Labor-pondita meznombro | +|----------|-------|-------|-----------------|-------------------| +| SPT (A unue) | 1 | 11 | 6.0 | 111/11 ≈ 10.09 | +| Inversa (B unue) | 11 | 10 | 10.5 | 111/11 ≈ 10.09 | + +SPT shajnas **4,5 horojn pli bona** lau la nepondita metriko sed provizas +**nul plibonigon** lau la labor-pondita metriko. La shjaina avantago +ekzistas nur car la nepondita statistiko lasas 1-horan taskon "vochi" +egale kun 10-hora tasko. + +--- + +## 4. Konsekvencoj por Servokvalito + +### 4.1 Malsatigo de Grandaj Taskoj + +**Teoremo 3 (Metrika Biaso).** Iu ajn planada politiko kiu minimumigas +neponditan meznombran kompletigan tempon nepre maksimumigas la kompletigan +tempon de la plej granda tasko. + +**Pruvo.** SPT metas la plej grandan taskon laste. Ghia kompletiga tempo +egalas la totalan procezan tempon $\sum p_i$, kiu estas la maksimuma +ebla kompletiga tempo por iu ajn individua tasko. Sub iu ajn planado kiu +ne metas la plej grandan taskon laste, tiu tasko kompletighas strikte pli +frue. $\blacksquare$ + +Ci tio kreas **malsatigan instigon**: raciaj agantoj optimumigantaj la +neponditan statistikon nedifinite prokrastos grandajn taskojn favore al +malgrandaj. Austin [18] identigis ci tiun gheneralan skemon --- ke nekompleta +mezurado kreas instigojn optimumigi la mezuritan dimension je la kosto +de nemezuritaj --- en la kunteksto de organiza rendimento-administrado. +Teoremo 3 provizas la specifan mekanismon por taskplanado. + +### 4.2 Maksimuma Kompletiga Tempo por la Plej Granda Tasko + +**Teoremo 4 (SPT Unike Maksimumigas la Kompletigan Tempon de la Plej Granda Tasko).** +Inter ciuj planadoj, SPT estas la unika politiko kiu asignas la maksimuman +eblan kompletigan tempon ($\sum p_i$) al la plej granda tasko. + +**Pruvo.** SPT ordigas taskojn en kreskanta ordo de $p_i$, metante la +plej grandan taskon $p_{\max}$ en la lastan pozicion. La lasta tasko en +iu ajn planado havas kompletigan tempon $\sum_{i=1}^{n} p_i$, kiu estas +la maksimumo kiun iu ajn individua tasko povas ricevi. Sub iu ajn planado +kiu ne metas $p_{\max}$ laste, ghi kompletighas strikte antau $\sum p_i$. +$\blacksquare$ + +**Korolario 4.1.** Teamo optimumiganta neponditan meznombran kompletigan +tempon sisteme liveros la plej malbonan sperton al klientoj kun la plej +kompleksaj bezonoj. Ci tio ne estas flanka efiko --- ghi estas la +*mekanismo* per kiu la metriko plibonighas. + +**Noto pri malrapidigo-proporcioj.** SPT fakte *kunpremas* malrapidigo- +proporciojn ($S_i = C_i / p_i$) car pli grandaj taskoj en postaj pozicioj +havas grandajn denominatorojn kiuj absorbas la akumulitan sumon. Ekzemple, +kun taskoj $[1, 5, 10]$: SPT donas malrapidigojn $[1, 1.2, 1.6]$ (malgranda +varianco) dum LPT donas $[1, 3, 16]$ (granda varianco). La damagho de SPT +al klientoj de grandaj taskoj ne estas videbla en la malrapidigo-proporcio +--- ghi estas videbla en **absoluta kompletiga tempo**. Ci tiu distingo +gravas: la planada justeco-literaturo [21, 22, 23] debatis pri SPT/SRPT- +maljusteco precipe tra malrapidigo-bazitaj mezuroj, kiuj povas obskuri la +absolut-prokrastan sharghon pruvitan sube. + +### 4.3 Prokrasta Koncentrigo + +**Teoremo 5 (SPT Koncentrigas Prokraston sur la Plej Granda Tasko).** Sub SPT, +la plej granda tasko portas pli da absoluta prokrasto ol sub iu ajn alia planado. + +**Pruvo.** Difinu absolutan prokraston kiel $\Delta_i = C_i - p_i$ (tempo +pasigita atendante, sendependa de propra grandeco). Sub SPT, la plej granda +tasko estas en pozicio $n$ kun: + +$$\Delta_{\max\text{-task}}^{\text{SPT}} = C_n - p_n = \sum_{i=1}^{n-1} p_i$$ + +Ci tio estas la sumo de ciuj aliaj taskaj procezaj tempoj --- la maksimuma +ebla prokrasto por iu ajn individua tasko. Sub iu ajn planado kie la plej +granda tasko ne estas lasta, ghia prokrasto estas strikte malpli. Dume, +SPT donas al la plej malgranda tasko nul prokraston ($\Delta_1^{\text{SPT}} = 0$). +La tuta vicada shargho estas transigita de malgrandaj taskoj al grandaj +taskoj. $\blacksquare$ + +SPT minimumigas *totalan* prokraston (bona por agregata eficienco) per +koncentrigo de prokrasto sur la taskojn plej kapablajn absorbi ghin en +malrapidigo-proporciaj terminoj. Sed en absolutaj terminoj --- horoj pasigitaj +atendante --- la plej granda tasko portas la plenan pezon. + +### 4.4 Traflua Invarianteco + +**Teoremo 6 (Traflua Invarianteco).** Totala laboro kompletita dum iu ajn +tempa horizonto $T$ estas identa sub ciuj planadaj politikoj. + +**Pruvo.** La plenumanto procezas laboron je fiksa rapideco. Dum iu ajn +horizonto $T \ge \sum p_i$, la totala farita laboro estas ekzakte $\sum p_i$ +sendepende de ordo. Por la stabilstata kazo kun daura alfluo, la +longdaura trafluo estas determinita de la servrapideco $\mu$ kaj estas +tute sendependa de planado: + +$$\lim_{T \to \infty} \frac{W(T)}{T} = \mu \quad \text{por ciuj planadoj } \sigma$$ + +$\blacksquare$ + +**Korolario 6.1.** Teamo kiu shanghighas de iu ajn planada politiko al SPT +observos plibonigon en nepondita meznombra kompletiga tempo kun **nul +shangho en efektiva trafluo**. La metriko plibonighas. La produktado ne. + +### 4.5 La Kombinita Efiko + +Kombinante Teoremojn 4, 5, kaj 6: + +| Mezuro | Efiko de optimumigo de nepondita meznombro | +|---------|--------------------------------------| +| Trafluo (laboro/tempo) | Neniu shangho (Teoremo 6) | +| Prokrasto por malgrandaj taskoj | Minimumigita --- proksimighas al nul (SPT) | +| Prokrasto por grandaj taskoj | **Maksimumigita** --- portas la tutan vicadan sharghon (Teoremo 5) | +| Kompletiga tempo de la plej granda tasko | **Maksimuma ebla**: $\sum p_i$ (Teoremo 4) | + +La neta efiko sur perceptatan kvaliton estas negativa car: + +1. **Perd-averzio estas asimetria** [8]. Kliento kies 100-hora tasko + estas deprioritatigita spertas grandan, okulfravan negativon. Kliento + kies 1-hora tasko estas akcelita spertas malgrandan, ofte nerimarkitan + pozitivon. + +2. **Alt-penaj taskoj korelaciigas kun alt-valoraj klientoj.** Grandaj + taskoj estas disproporcie versajne venontaj de gravaj klientoj, + kompleksaj kontraktoj, au kritikaj komercaj bezonoj. + +3. **Malsatigo akumulighas.** En kontinua sistemo (Teoremo 3), grandaj + taskoj povas esti **nedifinite prokrastitaj** dum novaj malgrandaj + taskoj daure alvenas. + +**Teoremo 7 (La Kerna Rezulto).** Por teamo procezanta taskojn de +neunuforma grandeco, adopto de nepondita meznombra kompletiga tempo kiel +rendimenta metriko: + +(a) Provizas **nul produktecan gajnon** (Teoremo 6), dum +(b) **Asignas la maksimuman eblan kompletigan tempon** al la plej granda + tasko (Teoremo 4), kaj +(c) **Koncentrigas la tutan vicadan prokraston** sur la plej grandajn taskojn + eliminante prokraston por la plej malgrandaj (Teoremo 5). + +Ci tio ne estas kompromiso. La metriko kreas puran transdonon de +servokvalito de alt-penaj klientoj al malmult-penaj klientoj, sen neta +laborakiro. $\blacksquare$ + +--- + +# Parto II: Prioritataj Sistemoj + +## 5. Romigho Sub Prioritata Klasifiko + +La antauaj sekcioj pruvis ke nepondita meznombra kompletiga tempo estas +biasita kiam taskoj varias en grandeco. Ni nun montras ke enkonduko de +**prioritata sistemo** --- kiel praktike ciuj realaj teamoj uzas --- +kauzas ke la metriko farighas ne nur biasita sed **aktive kontraua** al +la deklaritaj celoj de la organizo. + +### 5.1 Etendita Modelo: Taskoj Kun Prioritato + +Estu ciu tasko $i$ havi procezan tempon $p_i$ kaj prioritatan klason +$q_i \in \{1, 2, 3, 4\}$ kie 1 estas la plej alta prioritato (kritika) kaj +4 estas la plej malalta (kosmeta/plibonigo). Asignu prioritatajn pezojn: + +$$w(q) = \begin{cases} 8 & q = 1 \text{ (Kritika)} \\ 4 & q = 2 \text{ (Alta)} \\ 2 & q = 3 \text{ (Meza)} \\ 1 & q = 4 \text{ (Malalta)} \end{cases}$$ + +La specifaj pezoj estas ilustraj; la rezultoj validas por iu ajn strikte +malkreskanta pezfunkcio. La kerna eco estas ke prioritato estas asignita +lau **komerca efiko**, ne lau taskograndeco. + +### 5.2 La Metriko Kontraudiras la Prioritatan Sistemon + +**Teoremo 8 (Prioritato-Grandeca Inversio).** Kiam prioritato estas sendependa +de taskograndeco, la planado kiu minimumigas neponditan meznombran kompletigan +tempon (SPT) atende kompletighos malalt-prioritatajn taskojn antau +alt-prioritataj taskoj de pli granda grandeco. + +**Pruvo.** SPT ordigas taskojn lau $p_i$ kreskante, sendepende de $q_i$. +Konsideru du taskojn: + +- Tasko A: $p_A = 40$ horoj, $q_A = 1$ (Kritika --- ekz., servila panea) +- Tasko B: $p_B = 0.5$ horoj, $q_B = 4$ (Malalta --- ekz., kosmeta UI-korekto) + +SPT planadas B antau A. La nepondita meznombro por ci tiu paro: + +$$\bar{C}^{\text{SPT}} = \frac{0.5 + 40.5}{2} = 20.5 \qquad \bar{C}^{\text{priority}} = \frac{40 + 40.5}{2} = 40.25$$ + +La metriko deklaras SPT preskaue **duoble pli bona** --- malgrau kompletigo +de kosmeta korekto dum servila paneo brulas. + +Ghenerale, kiam $q_i$ estas statistike sendependa de $p_i$, la ordigo de +SPT havas **nul korelacion** kun prioritato. Praktike, Kritikaj taskoj +(paneoj, sekurecaj incidentoj, datumperdo) ofte postulas pli da laboro ol +Malaltaj taskoj, do la metriko estas plausible **kontrau-korelacia** kun +la prioritata sistemo. $\blacksquare$ + +### 5.3 Informdetruo + +La nepondita meznombro reduktas tridimensian taskon $(p_i, q_i, C_i)$ al +unudimensia signalo ($C_i$), poste averaghas uniforme. Ci tio forigas +prioritaton tute kaj implicite inversigas grandecon. + +**Teoremo 9 (Informdetruo).** Estu $I(\sigma)$ la reciproka informo inter +la implicita prioritata rangordigo de la planado (pozicio) kaj la efektiva +prioritato-asigno $q_i$. Por SPT: + +$$I(\sigma_{\text{SPT}}) = 0 \quad \text{kiam } p_i \perp q_i$$ + +**Pruvo.** SPT asignas poziciojn bazite sole sur $p_i$. Kiam $p_i$ kaj +$q_i$ estas sendependaj, scio pri la pozicio de tasko en la SPT-planado +provizas nul informon pri ghia prioritato. $\blacksquare$ + +**Korolario 9.1.** Teamo kiu optimumigas neponditan meznombran kompletigan +tempon administras planadan sistemon kiu enhavas nul informon pri ghia +propra prioritata klasifiko. La prioritata kampo en ilia bileta sistemo +estas, rilate al plenuma ordo, dekoracia. + +Ci tio estas okazo de tio, kion Austin [18] nomas la fundamenta problemo de +nekompleta mezurado: kiam la mezura sistemo kaptas nur subaron de la +koncernaj dimensioj, optimumigo de la mezurado sisteme degradas la +nemezuritajn dimensiojn. + +### 5.4 Prioritat-Pondita Prokrasta Kosto + +Difinu la **prioritat-ponditan prokrastan koston** de planado: + +$$D(\sigma) = \sum_{i=1}^{n} w(q_i) \cdot C_i$$ + +**Teoremo 10 (SPT kaj Prioritat-Pondita Prokrasta Kosto).** La optimuma +planado por minimumigi $D(\sigma)$ estas WSJF: ordigu lau $w(q_i)/p_i$ +malkreskante [1, 5]. La ordigo de SPT --- lau $1/p_i$ malkreskante --- +ignoras prioritaton tute kaj produktas pli altan $D$ ol prioritato- +respektantaj alternativoj kiam prioritato estas korelacia kun +taskograndeco. + +**Pruvo.** Per la interchangha argumento, interchangho de apudaj taskoj $i, j$ +shanghighas $D$ je: + +$$\Delta D = w(q_j) \cdot p_i - w(q_i) \cdot p_j$$ + +La interchangho plibonigas $D$ kiam $w(q_j)/p_j > w(q_i)/p_i$ sed $j$ estas +planadita post $i$. Tial la optimuma ordo estas malkreskanta +$w(q_i)/p_i$ --- la WSJF-regulo. SPT korespondas al WSJF nur kiam +$w(q_i) = \text{const}$ (ciuj taskoj havas egalan prioritaton). + +**Ekzemplo.** Kritika ($w = 8$, $p = 3$) kaj Malalta ($w = 1$, $p = 2$): + +- SPT (Malalta unue): $D = 1 \cdot 2 + 8 \cdot 5 = 42$ +- WSJF (Kritika unue): $D = 8 \cdot 3 + 1 \cdot 5 = 29$ + +SPT subigas 45% pli da prioritat-pondita prokrasto. Praktike, Kritikaj +taskoj tendencas esti pli grandaj (paneoj, sekurecaj incidentoj), farante +la diverghon sistema. $\blacksquare$ + +--- + +## 6. Proponitaj Solvoj + +### 6.1 Prioritat-Ponditaj Metrikoj + +Anstatauigu neponditan meznombran kompletigan tempon per la **Prioritat-Pondita +Kompletiga Poentaro (PWCS)**: + +$$\text{PWCS}(\sigma) = \frac{\sum_{i=1}^{n} w(q_i) \cdot \frac{C_i}{p_i}}{\sum_{i=1}^{n} w(q_i)}$$ + +Ci tio estas la prioritat-pondita meznombra malrapidigo-proporcio. Ghi +mezuras kiom longe ciu tasko atendis relative al ghia grandeco, pondita +lau kiom tiu tasko gravis. Pli malgranda estas pli bona. + +**Ecoj:** + +1. **Prioritato-respektanta.** Prokrastoj al Kritikaj taskoj kostas 8x + pli ol prokrastoj al Malaltaj taskoj. +2. **Grandeco-justa.** Uzas malrapidigo-proporcion $C_i / p_i$, do + grandaj taskoj ne estas punitaj pro sia grandeco. +3. **Ne manipulebla per SPT.** Reordigo lau proceza tempo ne sisteme + plibonigas la poentaron. +4. **Reduktighas al nepondita meznombro kiam taskoj estas uniformaj.** + Strikta gheneraligo. + +### 6.2 Optimuma Politiko: WSJF + +**Teoremo 11.** La planado minimumiganta la prioritat-ponditan kompletigan +tempon $\text{PWCT}(\sigma) = \sum w(q_i) \cdot C_i / \sum w(q_i)$ procezas +taskojn en ordo de malkreskanta $w(q_i)/p_i$ --- la **Pondita Plej Mallonga +Tasko Unue (WSJF)** regulo [1, 5]. + +**Pruvo.** Per la interchangha argumento (kiel en Teoremo 10), la +interchangho de apudaj taskoj $i, j$ plibonigas PWCT kiam $w(q_j)/p_j > w(q_i)/p_i$ +sed $j$ estas planadita post $i$. La optimuma ordo estas tial malkreskanta +$w(q_i)/p_i$. $\blacksquare$ + +Ene de prioritata klaso, ci tio reduktighas al SPT (plej mallonga unue). +Trans klasoj, Kritika 4-hora tasko ($w/p = 2.0$) venkas Malalta 1-hora +tasko ($w/p = 1.0$). + +**Praktika averto.** Pura WSJF povas meti malgrandajn Malalt-prioritatajn +taskojn antau grandajn Kritikajn taskojn (15-minuta Malalta tasko havas +$w/p = 1/0.25 = 4.0$, venkante 6-horan Kritikan je $w/p = 8/6 = 1.33$). +Praktike, ci tio estas mildigata per devigo de **strikta prioritat-klasa +ordigo** kaj apliko de WSJF nur *ene de* ciu klaso. + +### 6.3 Aplikita Ekzemplo: IT-Servostablo + +Konsideru IT-teamon kun la jena bilet-vico: + +| Bileto | Prioritato | Tipo | Taks. Horoj | +|--------|----------|------|-----------| +| T1 | P1 (Kritika) | Retposhta servilo paneis | 6 | +| T2 | P2 (Alta) | VPN malsukcesas por fora teamo | 4 | +| T3 | P3 (Meza) | Aranghado de nova dungita tekkomputilo | 2 | +| T4 | P4 (Malalta) | Azhurnigi regulon pri labortabla fonbildo | 0.5 | +| T5 | P3 (Meza) | Instali programaran licencon | 1 | +| T6 | P1 (Kritika) | Datumbaza sekurkopio malsukcesas | 3 | +| T7 | P2 (Alta) | Presila parko ekster-linia | 2 | +| T8 | P4 (Malalta) | Arkivi malnovan komunan dosierujon | 0.25 | + +**SPT-ordo** (optimumigante neponditan meznombron): T8, T4, T5, T3, T7, T6, T2, T1 + +| Poz | Bileto | Prioritato | Horoj | Kompletigo | Malrapidigo | +|-----|--------|----------|-------|------------|----------| +| 1 | T8 (arkivi dosierujon) | P4 Malalta | 0.25 | 0.25 | 1.0 | +| 2 | T4 (fonbildo) | P4 Malalta | 0.5 | 0.75 | 1.5 | +| 3 | T5 (programaro) | P3 Meza | 1 | 1.75 | 1.75 | +| 4 | T3 (tekkomputilo) | P3 Meza | 2 | 3.75 | 1.875 | +| 5 | T7 (presiloj) | P2 Alta | 2 | 5.75 | 2.875 | +| 6 | T6 (sekurkopioj) | P1 Krit | 3 | 8.75 | 2.917 | +| 7 | T2 (VPN) | P2 Alta | 4 | 12.75 | 3.188 | +| 8 | T1 (retposhto) | P1 Krit | 6 | 18.75 | 3.125 | + +**Praktika WSJF** (prioritat-klaso-unue, SPT ene de klaso): + +| Poz | Bileto | Prioritato | Horoj | Kompletigo | +|-----|--------|----------|-------|------------| +| 1 | T6 (sekurkopioj) | P1 Krit | 3 | 3 | +| 2 | T1 (retposhto) | P1 Krit | 6 | 9 | +| 3 | T7 (presiloj) | P2 Alta | 2 | 11 | +| 4 | T2 (VPN) | P2 Alta | 4 | 15 | +| 5 | T5 (programaro) | P3 Meza | 1 | 16 | +| 6 | T3 (tekkomputilo) | P3 Meza | 2 | 18 | +| 7 | T8 (arkivo) | P4 Malalta | 0.25 | 18.25 | +| 8 | T4 (fonbildo) | P4 Malalta | 0.5 | 18.75 | + +**Komparo:** + +| Metriko | SPT | Praktika WSJF | Venkanto | +|--------|-----|----------------|--------| +| Nepondita meznombra kompletigo | **6.56 h** | 13.63 h | SPT | +| P1 meznombra tempo ghis solvo | 13.75 h | **6 h** | WSJF | +| P2 meznombra tempo ghis solvo | 9.25 h | **13 h** | SPT | +| Tempo por ripari retposhtan servilon | 18.75 h | **9 h** | WSJF | +| Tempo por ripari datumbazajn sekurkopiojn | 8.75 h | **3 h** | WSJF | +| Tempo por azhurnigi fonbildon | **0.75 h** | 18.75 h | SPT | + +La agregitaj prioritat-ponditaj kompletigaj tempoj estas preskaue identaj +(PWCT: 10.2 kontrau 10.17) car agregado kashas distribuanan damaghon. +La vera diferenco estas en la **po-prioritat-klasa** detalo: la retposhta +servilo estas panea dum 18.75 horoj sub SPT kontrau 9 horoj sub WSJF. La +datumbazaj sekurkopioj malsukcesas dum 8.75 horoj kontrau 3. + +La nepondita metriko fide raportas SPT kiel **pli ol duoble pli efikan** +(6.56 kontrau 13.63), rekompencante la teamon kiu azhurnis labortablan +fonbildon dum la retposhta servilo brulis. + +### 6.4 Rekomendita Metrika Aro + +Ech prioritat-ponditaj agregitaj metrikoj povas malsukcesi distingi bonajn +de malbonaj planadoj, car agregado kashas distribuanan damaghon. Neniu sola +metriko sufichas. Kompleta mezura sistemo devus spuri: + +| Metriko | Kion ghi mezuras | Formulo | +|--------|-----------------|---------| +| **Meznombra kompletigo lau prioritata klaso** | Po-klasa respondemo | $\bar{C}$ filtrita lau $q$ | +| **P1 meznombra tempo ghis solvo** | Kritika incidenta respondo | $\bar{C}$ por $q = 1$ | +| **Trafluo** | Kruda laborkapacito | Labor-horoj kompletigitaj / kalendara tempo | +| **Maljunighaj malobservoj** | Malsatiga preventado | Taskoj superantaj SLA lau prioritato | +| **Maksa kompletiga tempo (P1/P2)** | Plej-malbonkaza kritika respondo | $\max(C_i)$ por $q \le 2$ | + +La kerna kompreno: **po-prioritat-klasaj metrikoj** malkovras planadajn +malsukcesojn kiujn agregitaj metrikoj kashas. + +--- + +# Parto III: Organizaj Dinamikoj + +## 7. Kiam la Metriko Estas la Produkto + +Sekcioj 2--6 supozas ke klienta kontentigo estas funkcio de *spertita +servokvalito*. Sed ekzistas scenaro en kiu ci tiu supozo malsukcesas +kaj la tuta argumento kolapsas. + +### 7.1 La Mem-Referenca Metriko + +Supozu ke la provizanto raportas la neponditan meznombron rekte al la +kliento --- sur panelo, en SLA-raporto, sur merkatada pagho --- kaj la +kontentigo de la kliento derivighas precipe de *tiu nombro*: + +$$U_{\text{client}} = f\!\left(\bar{C}(\sigma)\right), \quad f' < 0$$ + +Sub ci tiu modelo, SPT vere maksimumigas klientan kontentighon (Teoremo 1). +Trafluo ne shanghighas (Teoremo 6). La komerca rezulto plibonighas: sama +laboro farita, pli kontenta kliento. + +**Ciu teoremo en ci tiu artikolo restas matematike korekta. Sed la +konkludo inversighas.** La metriko ne plu estas proksimilo kiu povas esti +manipulita --- ghi *estas* la servokvalito, car la kliento konsentis +taksi kvaliton lau la agregita nombro. + +### 7.2 La Ekonomiko + +Ci tio kreas koheran, stabilan ekvilibron: + +| Aktoro | Konduto | Rezulto | +|-------|----------|---------| +| Provizanto | Optimumigas neponditan meznombron (SPT) | Metriko plibonighas, neniu plia laboro | +| Kliento | Legas panelon, vidas malaltan meznombron | Raportas kontentighon | +| Administrado | Vidas kontentighitan klienton + bonan metrikon | Rekompencas teamon | + +La provizanto eltiras kontentighon je nul marghena kosto, per optimumigo +de nombro kiun la kliento akceptis kiel proksimilon de kvalito. + +### 7.3 La Fragileco + +Ci tiu ekvilibro estas stabila nur tiom longe kiom la kliento neniam +ekzamenas sian propran sperton. Ghi romighas kiam: + +1. **La kliento kontrolas sian propran bileton.** Chefdirektoro kies + retposhta servilo estis panea dum 18.75 horoj ne estos trankviligita + de "Meznombra solvo: 6.56 horoj." La klientoj plej versajnaj ekzameni + estas ekzakte tiuj ricevantaj la plej malbonan servon (Teoremo 4). + +2. **Konkuranto ofertas po-biletajn SLA-ojn.** "P1 solvita ene de 4 horoj" + venkas "meznombra solvo sub 7 horoj" por iu ajn kliento kun kritikaj + bezonoj. + +3. **La teamo internaligas la metrikon.** Se la teamo kredas ke la metriko + reflektas realan rendimenton, ili perdas la kapablon rekoni kiam kritika + laboro estas neglektita. La metriko farighas epistema dangero. + +### 7.4 La Ghenerala Skemo + +Ci tiu skemo --- proksimilo anstatauas kvaliton, proksimilo estas +optimumigita, kvalito diverghas, sistemo estas stabila ghis testita de +realeco --- reaperras trans fakoj. Muller [19] dokumentas ghin detale kiel +"metrika fiksigo"; Campbell [24] formalizis la koruptigan efikon de +uzado de indikiloj kiel celojn. + +| Fako | Proksimila metriko | Subkusha kvalito | Divergho | +|--------|-------------|-------------------|------------| +| IT-subteno | Mezn. solva tempo | Kritika sistema disponibleco | Servilo panea 19 h, mezn. diras 6.5 | +| Edukado | Testaj poentoj | Efektiva lernado | Instruado por la testo | +| Sanservo | Pacienta trafluo | Pacientaj rezultoj | Pli rapidaj elhospitalighoj, pli alta rehospitaligho | +| Financoj | Kvaronjaraj enspezoj | Longdaura valoro | Kostotrancho inflacias EPS, erodas kapablon | +| Programaro | Rapideco (rakontaj poentoj) | Produkta kvalito | Poenta inflacio, funkcioj duone finitaj | + +### 7.5 Informasimetrio + +Modelu la sistemon kiel ludon inter provizanto (P) kaj kliento (C). P +observas individuajn $\{C_i\}$ kaj elektas $\sigma$; C observas nur +$\bar{C}(\sigma)$. Ci tio estas **morala dangero**-problemo [10]: la +optimuma strategio de P estas minimumigi la observeblan signalon sendepende +de la neobservebla distribuo. + +La ekvilibro estas **kunigebla ekvilibro** [9]: la raportita metriko de P +aspektas identa sendepende de la subkusha prioritat-pondita rendimento. +Ghi estas stabila ghis C akiras aliron al individuaj $C_i$-valoroj --- per +kliento-portalo, transparenteco de konkuranto, au sufiche dolora incidento. + +### 7.6 La Malkomforta Konkludo + +La honesta respondo al "chu optimumigo de la nepondita meznombro damaghas +la komercon?" estas: **ne nepre, tiom longe kiom la kliento neniam rigardas +malantau la nombron**. La honesta respondo al "chu ci tio estas dauregebla?" +estas: ghi estas ekzakte tiom dauregebla kiom iu ajn sistemo en kiu la +vendanto scias pli ol la achetanto --- stabila dum etenditaj periodoj, poste +rapida kolapso kiam la asimetrio estas trapikita. + +--- + +## 8. La Psikologia Kosto de Scio + +Sekcio 7 modelis la provizanton kiel unuecan aktoron. Sed teamoj konsistas +el individuoj. Kiam teamano komprenas la pruvon --- kiam ili *scias* ke la +metriko estas sinteza, ke la panelo estas teatro, ke la retposhta servilo +ankorau estas panea dum ili fermas fonbildajn biletojn --- nova kosto aperas +kiun la ekvilibra modelo pretermisis. + +### 8.1 La Kashita Variablo: Teamkonscio + +| Aktoro | Observas individuajn $C_i$ | Observas $\bar{C}$ | Komprenas la pruvon | +|-------|--------------------------|--------------------|-----------------------| +| Administrado | Eble | Jes | Varias | +| Teamano | **Jes** | Jes | **Jes** (en ci tiu scenaro) | +| Kliento | Ne | Jes | Ne | + +La teamano havas plenan informon. Ili vidas la bilet-vicon. Ili scias ke +la retposhta servilo estas panea ekde la 7a matene. Ili scias ke ili +fermas fonbildan bileton car tio plibonigas la nombron. Kaj ili scias +*kial*. + +### 8.2 Kogna Disonanco Sub Plena Informo + +Kogna disonanco [11] aperas kiam individuo tenas kontraudirajn +perceptojn. Sen kompreno de *kial*, la kontraudiro povas esti raciigebla: +"administrado scias plej bone." Kompreno de la pruvo forigas la +ambiguecon. La teamano nun tenas: + +- **Percepto A:** "Mi estas kompetenta profesiulo. Mia tasko estas solvi + gravajn problemojn." +- **Percepto B:** "Mi fermas fonbildan bileton dum la retposhta servilo + estas panea, car la metriko estas matematike biasita (Teoremo 1), la + reordigo produktas nul trafluan gajnon (Teoremo 6), kaj la sola + profitanto estas la panelo (Sekcio 7). Mi povas pruvi tion." + +La disonanco nun estas *shtrukturo-portanta*. La haveblaj solvoj --- +forlasi profesian identecon, malakcepti la pruvon, advokati por shangho, +au foriri --- ciu imposas kostojn kiuj ne ekzistis antaue. + +### 8.3 Mem-Determina Teorio: Tri Bezonoj Malobservitaj + +La Mem-Determina Teorio de Deci kaj Ryan [12, 13] identigas tri bezonojn +antaudiranta intrinsekan motivon: + +**Autonomio.** La metriko limigas elektojn en maniero kiun la teamano +scias esti matematike suboptimuma. Laboranto kiu komprenas ke la procezo +estas proveble kontrauproduktiva ne povas senti sin autonoma sekvante ghin. + +**Kompetenteco.** La metriko rekompencas *shajnan* efikecon (malaltan $\bar{C}$) +estante invarianta al *efektiva* eficienco (Teoremo 6). Vera kompetenteco +--- ripari la retposhtan servilon unue --- estas *punita* de la metriko. + +**Rilateco.** La teamano scias ke la retposhta servilo de la kliento estas +panea. Ili povus helpi. Ili anstatue azhurnas fonbildon --- ne car tio +helpas iun, sed car tio helpas nombron. La ligo inter laboro kaj homa +efiko estas rompita, kaj la teamano povas vidi la rompitajn finajhojn. + +### 8.4 Morala Vundo + +Morala vundo [16, 17] estas la daura damagho kauzita de "plenumi, malsukcesi +preventi, atesti, au lerni pri agoj kiuj malobservas profunde tenatajn +moralajn kredojn" [17]. Ghi ekde tiam estas etendita al komercaj medioj [25]. +La kerna distingo de elcherpigho: **elcherpigho estas konsumigho pro fari +tro multe. Morala vundo estas damagho pro fari la malghustajn aferojn.** + +Teamano kiu scias ke la retposhta servilo estas panea, scias ke ili devus +ripari ghin, fermas fonbildan bileton anstatue, kaj faras tion car la +metriko postulas tion, spertas la strukturajn kondicojn por morala vundo. + +### 8.5 Lernita Senpotenco kaj Metrika Fatalismo + +La lernita senpotenco de Seligman [14, 15] priskribas kiel ekspono al +nekontrolebla negativaj rezultoj kondukas al pasiveco. La sekvenco: + +1. La metriko estas difekta (pruvo komprenita). +2. Advokati por shangho. +3. Malakceptita ("la nombroj estas bonaj, ne skuu la boaton"). +4. Ripeti kun malkreskanta konvinkeco. +5. Fina stato: "La metriko estas kia ghi estas. Mi simple fermos biletojn." + +Ci tio ne estas pigro. Ghi estas la racia respondo al sistemo kiu punas +ghustajn kondutojn kaj rekompencas malghustajn kondutojn, kiam la individuo +mankas potencon shanghi la sistemon. + +### 8.6 La Kontrauselekta Spiralo + +Kombinante la ekvilibron de Sekcio 7 kun la rotacia dinamiko: + +1. Organizo adoptas neponditan meznombron. Metriko aspektas bone (SPT). +2. Konsciaj, kompetentaj teamanoj spertas psikologiajn kostojn (8.2--8.5). +3. Tiuj membroj foriras. Anstatauigitaj per membroj kiuj ne komprenas la + mankojn de la metriko au ne zorgas. +4. La metriko daure aspektas bone --- ghi chiam aspektas tiel sub SPT, + sendepende de teamkompetenteco (Korolario 6.1). +5. Efektiva servokvalito degradas, sed la metriko ne povas detekti tion + (Korolario 9.1). +6. Revenu al pasho 1. + +La metriko selektas *kontrau* la homojn kiuj plibonigus la sistemon kaj +*por* la homojn kiuj ne kontestos ghin. La sistemo stabilighas je pli +malalta nivelo de kompetenteco, nevidebla por sia propra mezura aparato. + +### 8.7 La Kompleta Kosta Modelo + +| Sekcio 7 (videbla) | Sekcio 8 (kashita) | +|---------------------|---------------------| +| Kliento kontenta (bona nombro) | Teamo malkontenta (malbona realeco) | +| Trafluo ne shanghighas | Diskreta penad-investo retirigita | +| Metriko plibonighas | Kompetentaj membroj foriras | +| Komerca ekonomiko stabila | Institucia kompetenteco degradas | + +Ci tiuj funkciigas sur malsamaj temposkalo: la ekvilibro estas videbla +kvaronjare; la kompetenteca degradado estas videbla tra jaroj. La kompleta +modelo estas: **la metriko funkcias, kaj ghi estas destruktiva, kaj la +destruktado estas nevidebla por la metriko.** La metriko estas fresha farbo +sur korodita armaturo. + +--- + +## 9. Administranta Internaligo: La Aga Solvo + +Sekcioj 2--6 diras malakcepti la metrikon. Sekcio 7 diras ke la metriko +funkcias (por la komerco). Sekcio 8 diras ke ghi detruas la teamon. +Praktike, plej multaj administrantoj ne povas unuflange shanghi la metrikon. +La plej bona solvo estas tut-kompania metrika reformo. La *aga* solvo estas +tio, kion unu sola informita administranto povas fari guste nun. + +### 9.1 La Strategio + +Administranto kiu komprenas la pruvon povas **internaligi la limigojn de +la metriko sen propagandi ilin al la teamo**: + +1. **Planadu precipe lau prioritato.** La teamo laboras pri kritikaj taskoj + unue. +2. **Taktike interplektu malgrandajn taskojn.** Kiam malgranda + malalt-prioritata tasko povas esti kompletita sen materiale prokrasti + alt-prioritatan laboron, faru ghin. Ne car la metriko postulas tion, + sed car ghi ankau bezonas esti farita kaj kostas preskaue nenion. +3. **Neniam malkovru la metrikon kiel la motivon.** "Rapide faru ci tiun + malgrandan dum ni atendas la livervok-reveniron pri la P1" --- ne "ni + bezonas malaltigas nian meznombron." La intrinseka motivo de la teamo + restas intakta (Sekcio 8). La administranto absorbas la + metrik-administran sharghon. + +### 9.2 Formaligo + +La problemo de la administranto estas limigita optimumigo: + +$$\min_{\sigma} \sum_{i=1}^{n} w(q_i) \cdot C_i \quad \text{kondicihite de} \quad \bar{C}(\sigma) \le \bar{C}_{\text{target}}$$ + +**Teoremo 12 (Limigita Metrika Kosto de Prioritata Planado).** Administranto +kiu uzas SPT *ene de* ciu prioritata klaso kaj prioritatan ordigon *inter* +klasoj produktos metrikon proksiman al la SPT-optimuma valoro --- la +interspaco aperas nur de inter-klasaj inversioj. + +**Pruva skizo.** Ene de ciu prioritata klaso, SPT estas senkosta (ciuj +taskoj havas egalan prioritaton). La sola devio de la tutmonda SPT estas +la inter-klasa ordigo. Ciu trans-klasa inversio kostas maksimume +$p_{\text{large}} - p_{\text{small}}$ en la nepondita sumo, kaj ci tiuj +inversioj estas limigitaj de la nombro da klasoj. Praktike, la interspaco +estas tipe ene de 10--20% de la SPT-optimumo. $\blacksquare$ + +### 9.3 La Administranto Kiel Informa Bariero + +| Tavolo | Vidas metrikon | Vidas prioritatojn | Vidas pruvon | +|-------|-----------|----------------|------------| +| Organizo | Jes | Formale | Ne | +| Administranto | Jes | Jes | **Jes** | +| Teamo | Ne (shirmita) | Jes | Senrilata | +| Kliento | Jes (panelo) | Per SLA | Ne | + +La administranto estas la sola aktoro tenanta ciujn tri informpecojn. +Ci tio ne estas manipulado --- ili faras la ghustajn taskojn en la ghusta +ordo, kaj la metriko hazarde estas akceptebla car SPT ene de klaso estas +senkosta. + +### 9.4 La Konkurenca Romigho + +Ci tiu strategio malsukcesas kiam la metriko farighas **konkurenca inter +teamoj**. + +**Kazo 1: Kunlabora** --- Teamoj mezuritaj por egaleco, ne rangordigo. Ciu +administranto sendepende uzas la internalizan strategion. La metriko estas +dekoracia sed sendangera. Ci tio estas **kunordiga ludo** kun stabila +kunlabora ekvilibro. + +**Kazo 2: Konkurenca** --- Teamoj rangigitaj lau $\bar{C}$. Ci tio estas +**mallibereja dilemo**: + +| | Teamo B: Prioritato-unue | Teamo B: SPT | +|---|---|---| +| **Teamo A: Prioritato-unue** | (Bona laboro, Bona laboro) | (A aspektas malbone, B aspektas bone) | +| **Teamo A: SPT** | (A aspektas bone, B aspektas malbone) | (Ambau aspektas bone, ambau faras malghustajn taskojn) | + +La Nash-ekvilibro estas (SPT, SPT). La internaliza strategio estas +kunlabora ekvilibro kiu **ne estas stabila sub konkurenco**. + +### 9.5 Amplekso + +| Kondicho | Realigeblo | +|-----------|-----------| +| Metriko uzita por san-kontrolo / egaleco | **Realigebla** | +| Metriko videbla sed ne rangigita | **Realigebla** | +| Metriko rangigita trans teamoj | **Fragila** --- postulas ke ciuj administrantoj kunlaboru | +| Metriko ligita al kompensajho / rimedoj | **Ne realigebla** --- mallibereja dilemo dominas | +| Metrika reformo ebla je org-nivelo | **Nenecesa** --- korektu la metrikon anstatue | + +**La plej bona solvo estas tut-kompania. La aga solvo estas administranto +kiu komprenas ci tiun pruvon, shirmas sian teamon de la metriko, planadas +lau prioritato, kaj uzas SPT nur ene de prioritataj klasoj por teni la +nombron akceptebla.** + +--- + +# Parto IV: Taksado + +## 10. Avokato de la Diablo + +Intelekta honesteco postulas agnoski kie la argumento havas limojn. + +### 10.1 Simpleco Havas Realan Valoron + +**Argumento.** La nepondita meznombro ne postulas prioritatajn pezojn, +taskograndecajn taksojn, nek kalibron. + +**Takso: Vera.** Sed la nepondita metriko ne evitas supozojn --- ghi +*kashas* ilin per implice statigi ciujn pezojn je 1 kaj ciujn grandecojn +je 1. Konata-malpreciza takso de taskograndeco estas tamen pli informa ol +la implicita supozo ke ciuj grandecoj estas egalaj. + +### 10.2 Minimumigi la Nombron de Atendantaj Homoj + +**Argumento.** SPT minimumigas totalajn person-horojn pasigitajn atendante. +Se ciu tasko reprezentas unu klienton, ci tio estas optimuma. + +**Takso: Matematike korekta.** Se vi administras DMV-oficejon kaj la +tempo de ciu persono estas egale valora, SPT estas la ghusta politiko. +Ghi romighas kiam taskoj ne estas 1:1 kun klientoj, atendokosto ne estas +uniforma, au la metriko estas uzita por taksi teamojn prefere ol servi +lauvican vicon. + +### 10.3 SPT Kiel Triagha Heuristiko + +**Argumento.** Kiam taskograndecoj dense grupighas, SPT proksimumas FIFO +kaj la nepondita meznombro proksimumas la ponditan meznombron. + +**Takso: Korekta.** La varianca koeficiento $CV = \sigma_p / \bar{p}$ determinas la severecon de distordo: + +| $CV$ | Taskograndeca distribuo | Distordo | +|------|----------------------|------------| +| < 0.3 | Densa (voka centro) | Neglektinda | +| 0.3 -- 1.0 | Modera (miksita IT) | Modera | +| > 1.0 | Largha (tipa IT-vico) | Severa | + +Tipa IT-stablo kovras de 15 minutoj ghis 40+ horoj ($CV > 2$). La +distordo ne estas randa kazo --- ghi estas la defaulo. + +### 10.4 Manipulado Postulas Malicon + +**Argumento.** La teoremoj montras ke la metriko *povas* esti manipulita, +ne ke ghi *estos* manipulita. + +**Takso: Ci tio estas la plej forta kontrauargumento.** Se la metriko +estas pure informa kaj neniam influas konduton, la manipulada instigo +forestas. Tamen, iu ajn metriko raportita al administrado, ligita al +OKR-oj, au diskutita en retrospektivoj influos konduton. Ci tio estas la +Legho de Goodhart [6, 7] --- kaj ghi aplikighas al bonintencaj teamoj tiom +fidinde kiom al cinikaj. La drivo okazas organike: kompletigi tri facilajn +biletojn "sentas produktive" dum la metriko validigas la senton. + +### 10.5 Kiam la Nepondita Meznombro Estas Defendebla + +La metriko estas defendebla **nur kiam ciuj kvar kondicoj validas**: + +1. Taskograndecoj estas proksimume uniformaj ($CV < 0.3$) +2. Neniu prioritata diferenco (ciuj taskoj egale gravaj) +3. Ciu tasko reprezentas ekzakte unu klienton +4. La metriko ne estas uzita por taksi, rekompenci, au direkti konduton + +Ci tiuj kondicoj malofte plenumigas en la sistemoj kie la metriko estas +plej ofte uzita. + +--- + +## 11. Rilata Literaturo + +Ci tiu artikolo situas je la intersekco de pluraj literaturoj kiuj antaue +ne estis konektitaj. + +### 11.1 Planada Teorio kaj Justeco + +Smith [1] establis la SPT-optimumecan rezulton kaj la WSJF-regulon en 1956. +Conway, Maxwell, kaj Miller [2] provizis la ampleksan lernolibran traktadon. +La justeco de grandec-bazitaj planadaj politikoj estis debatita en komputila +sistemplanado: Bansal kaj Harchol-Balter [22] esploris SRPT-maljustecon; +Wierman kaj Harchol-Balter [23] formaligis justecajn klasifikojn kontrau +Procesoro-Divido; Angel, Bampis, kaj Pascual [21] mezuris SPT-planadan +kvaliton kontrau justaj optimecoaj kriterioj. + +Ci tiu antaua laboro analizas justecon en CPU- kaj servila planado. La +nuna artikolo aplikas la samajn matematikajn rezultojn al *organiza +tasko-administrado*, kie la "planadilo" estas homa teamo, la "taskoj" +estas klientaj petoj kun komerc-efik-prioritatoj, kaj la "cela funkcio" +estas administrada metriko. La mekanismo estas identa; la konsekvencoj +diferencas car organiza planado havas prioritatajn sistemojn, klientajn +rilatojn, kaj psikologiajn kostojn kiujn CPU-planado ne havas. + +### 11.2 Mezura Misfunkcio + +Austin [18] pruvis ke nekompleta mezurado --- mezuri nur subaron de +koncernaj dimensioj --- kreas instigojn optimumigi la mezuritajn +dimensiojn je la kosto de nemezuritaj, kaj ke ci tiu efiko estas ne +nur ebla sed *neevitebla* kiam mezurado estas ligita al rekompencoj. Lia +informasimetria kadro proksime paralelas Sekcion 7. La nuna artikolo +provizas la specifan matematikan mekanismon (Teoremoj 1--2) por la kazo +de taskplanado, kaj etendas la argumenton tra psikologio (Sekcio 8) por +spuri la kompletan cenon de organiza damagho. + +Muller [19] dokumentis "metrikan fiksighon" tra edukado, sanservo, +policado, kaj financoj, provizante ampleksan empirian evidenton por la +skemoj teorizitaj en Sekcio 7.4. Campbell [24] formalizis la koruptigan +efikon de uzado de indikiloj kiel celojn, komplementante la originalan +observon de Goodhart [6] kaj la gheneraligon de Strathern [7]. + +Bevan kaj Hood [26] empirie dokumentis manipulajn kondutojn en la angla +publika sansistemo --- inkluzive de la ekzaktaj skemoj de "trafi la celon +kaj maltrafi la celon" priskribitaj en nia Sekcio 5.2. + +### 11.3 Psikologiaj Kostoj de Metrika Misfunkcio + +La apliko de morala vundo (Shay [16], Litz et al. [17]) al komercaj medioj +havas lastatempan precedencon: studo de 2024 en *Journal of Business Ethics* +[25] eksplicite etendis la konstrukton al profitcelaj laborejoj, trovante +strukturajn kondicojn similajn al tiuj priskribitaj en Sekcio 8.4. Moore +[27] analizis moralan *malengaghighon* --- la kognan restrukturizon kiu +ebligas maletan konduton sub organiza premo. La nuna artikolo traktas la +komplementan fenomenon: la damaghon al individuoj kiuj *rifuzas* +malengaghighi. + +### 11.4 Kio Estas Nova + +La individuaj komponantoj --- SPT-optimumeco, la Legho de Goodhart, mezura +misfunkcio, morala vundo --- ciuj havas precedenton. La kontribuoj de ci +tiu artikolo estas: + +1. **La konservolegho (Teoremo 2) uzita preskribe** --- kiel konstruktiva + argumento ke labor-pondita kompletiga tempo *ne povas* esti manipulita, + prefere ol kiel teoria planada rezulto. + +2. **La specifa pruvo ke prioritataj klasoj faras la metrikon algebre + kontraua** (Teoremoj 8--9) --- ne nur empirie malbona sed strukture + kontraudira, kun nul reciproka informo inter la planado kaj la prioritata + sistemo. + +3. **La integrita ceno** de matematika pruvo tra informasimetrio tra + psikologia damagho tra kontrauselekta spiralo --- spurante unu solan + metrikon de Smith (1956) al organiza malplenigho. + +4. **La administranta internaliza strategio** (Sekcio 9) kun formala + lud-teoria analizo de ghia stabileco kaj romkondichoj sub inter-teama + konkurenco. + +5. **La apliko de planada teorio al organiza administra kritiko** --- + pruvante ke vaste uzita teama metriko havas specifajn, kvantigeblajn + patologiojn prefere ol argumenti el anekdoto au ghenerala principo. + +--- + +## 12. Konkludo + +La nepondita meznombra kompletiga tempo estas **biasita statistiko** kiu: + +1. **Povas esti manipulita** per planada politiko (Teoremo 1), malsame ol + labor-pondita kompletiga tempo kiu estas planed-invarianta (Teoremo 2). +2. **Instigas malsatigon** de grandaj taskoj (Teoremo 3). +3. **Degradas klientan kontentighon** kun nul kompensia produkteca gajno + (Teoremo 7). +4. **Aktive kontraudiras prioritatajn sistemojn** portante nul informon + pri komerc-efik-klasifiko (Teoremo 9). +5. **Tute ignoras prioritaton** en sia planada rekomendo, produktante + suboptimuman prioritat-ponditan prokraston kiam ajn prioritato kaj + grandeco ne estas perfekte inverse korelaciigataj (Teoremo 10). + +Metriko kiu povas esti plibonigita per reordigo de laboro --- sen fari +iun ajn plian laboron --- mezuras la planadan politikon, ne la kapacitan +de la sistemo. Kombinite kun prioritata sistemo, ghi rekomendas la +planadon kiu infliktas la plej grandan damaghon al la plej alt-prioritata +laboro. + +Kiam la metriko estas raportita al klientoj, ghi kreas informasimetrion +(Sekcio 7) kies komerca ekvilibro estas profitdona sed fragila. Kiam +teamanoj komprenas ghiajn mankojn, ghi malobservas ilian intrinsekan +motivon kaj selektas por la foriro de la plej kompetentaj homoj (Sekcio 8). +Unu sola informita administranto povas parte mildigi ci tiujn efikojn tra +limigita optimumigo (Sekcio 9), sed ci tiu kunlabora strategio ne estas +stabila sub inter-teama konkurenco. + +La nepondita meznombro estas defendebla nur sub mallarghaj kondicoj +(Sekcio 10.5): uniformaj taskograndecoj, neniuj prioritatoj, unu-al-unu +kliento-taska mapado, kaj neniu konduta influo. Ci tiuj kondicoj malofte +plenumigas. + +**Nepondita meznombra kompletiga tempo ne estas justa nek preciza mezuro +de task-plenuma rendimento. Ghia adopto kiel teama metriko racie produktos +malsatigon de kompleksa laboro, malobservon de deklaritaj prioritatoj, +maljustajn klientajn rezultojn, kaj la iluzion de produkteco kie neniu +ekzistas.** + +La plej bona solvo estas organiza metrika reformo. La aga solvo estas +administranto kiu komprenas ci tiun pruvon. + +--- + +## Referencoj + +### Planada Teorio + +[1] Smith, W. E. (1956). Various optimizers for single-stage production. +*Naval Research Logistics Quarterly*, 3(1–2), 59–66. +doi:[10.1002/nav.3800030106](https://doi.org/10.1002/nav.3800030106) + +> Origino de la SPT-optimumeca rezulto (Teoremo 1), la pondita kompletiga +> tempa regulo $w_i/p_i$ malkreskante (WSJF, Teoremo 11), kaj la apud-taska +> parinterchangha (interchangha argumento) pruva tekniko uzita tralonghe. + +[2] Conway, R. W., Maxwell, W. L., & Miller, L. W. (1967). *Theory of +Scheduling*. Addison-Wesley. + +> Norma lernolibra traktado de unu-mashina planada teorio, etendanta la +> rezultojn de Smith. + +[3] Little, J. D. C. (1961). A proof for the queuing formula: L = λW. +*Operations Research*, 9(3), 383–387. +doi:[10.1287/opre.9.3.383](https://doi.org/10.1287/opre.9.3.383) + +> Unua rigora pruvo de la Legho de Little. Referencita en Sekcio 3.2 por +> victeoria kunteksto. + +[4] Little, J. D. C. (2011). Little's Law as viewed on its 50th +anniversary. *Operations Research*, 59(3), 536–549. +doi:[10.1287/opre.1110.0941](https://doi.org/10.1287/opre.1110.0941) + +> Retrospektivo diskutanta amplekson, limigojn, kaj oftajn misaplikojn. + +[5] Reinertsen, D. G. (2009). *The Principles of Product Development +Flow: Second Generation Lean Product Development*. Celeritas Publishing. +ISBN: 978-0-9844512-0-8. + +> Popularigis WSJF kaj "Kosto de Prokrasto / Dauro" en agile/lean-kuntekstoj. +> Matematika fundamento estas Smith (1956) [1]. + +### Mezurado kaj Instigoj + +[6] Goodhart, C. A. E. (1984). Problems of monetary management: The U.K. +experience. In *Monetary Theory and Practice* (pp. 91–121). Macmillan. + +> Fonto de la Legho de Goodhart: "Iu ajn observita statistika reguleco +> tendencas kolapsi post kiam premo estas metita sur ghin por kontrolceloj." + +[7] Strathern, M. (1997). 'Improving ratings': Audit in the British +university system. *European Review*, 5(3), 305–321. +doi:[10.1002/(SICI)1234-981X(199707)5:3<305::AID-EURO184>3.0.CO;2-4](https://doi.org/10.1002/(SICI)1234-981X(199707)5:3%3C305::AID-EURO184%3E3.0.CO;2-4) + +> Gheneraligis la Leghon de Goodhart: "Kiam mezuro farighas celo, ghi +> chesas esti bona mezuro." + +### Konduta Ekonomiko + +[8] Kahneman, D., & Tversky, A. (1979). Prospect theory: An analysis of +decision under risk. *Econometrica*, 47(2), 263–292. +doi:[10.2307/1914185](https://doi.org/10.2307/1914185) + +> Establis perd-averzion. Referencita en Sekcio 4.5. + +### Ludteorio kaj Kontrakta Teorio + +[9] Akerlof, G. A. (1970). The market for "lemons": Quality uncertainty +and the market mechanism. *The Quarterly Journal of Economics*, 84(3), +488–500. doi:[10.2307/1879431](https://doi.org/10.2307/1879431) + +> Informasimetrio kaj kontraua selektado. La kunigebla ekvilibro en +> Sekcio 7.5 estas strukture analoga. + +[10] Hölmstrom, B. (1979). Moral hazard and observability. *The Bell +Journal of Economics*, 10(1), 74–91. +doi:[10.2307/3003320](https://doi.org/10.2307/3003320) + +> Formala traktado de morala dangero. La metrik-raportada scenaro en +> Sekcio 7.5 estas morala dangero-problemo. + +### Psikologio + +[11] Festinger, L. (1957). *A Theory of Cognitive Dissonance*. Stanford +University Press. ISBN: 978-0-8047-0131-0. + +> Fundamenta teorio. Referencita en Sekcio 8.2. + +[12] Deci, E. L., & Ryan, R. M. (1985). *Intrinsic Motivation and +Self-Determination in Human Behavior*. Plenum Press. +ISBN: 978-0-306-42022-1. + +> Origina traktado de Mem-Determina Teorio. Referencita en Sekcio 8.3. + +[13] Ryan, R. M., & Deci, E. L. (2000). Self-determination theory and +the facilitation of intrinsic motivation, social development, and +well-being. *American Psychologist*, 55(1), 68–78. +doi:[10.1037/0003-066X.55.1.68](https://doi.org/10.1037/0003-066X.55.1.68) + +> SDT-superrigardo liganta bezonan kontentighon al intrinseka motivo kaj +> bonfarto. + +[14] Seligman, M. E. P., & Maier, S. F. (1967). Failure to escape +traumatic shock. *Journal of Experimental Psychology*, 74(1), 1–9. +doi:[10.1037/h0024514](https://doi.org/10.1037/h0024514) + +> Origina demonstro de lernita senpotenco. Referencita en Sekcio 8.5. + +[15] Seligman, M. E. P. (1975). *Helplessness: On Depression, +Development, and Death*. W. H. Freeman. ISBN: 978-0-7167-0752-3. + +> Etendita traktado liganta lernitan senpotencon al homa depresio kaj +> institucia konduto. + +[16] Shay, J. (1994). *Achilles in Vietnam: Combat Trauma and the Undoing +of Character*. Atheneum / Simon & Schuster. ISBN: 978-0-689-12182-3. + +> Enkondukis la koncepton de morala vundo. Referencita en Sekcio 8.4. + +[17] Litz, B. T., Stein, N., Delaney, E., Lebowitz, L., Nash, W. P., +Silva, C., & Maguen, S. (2009). Moral injury and moral repair in war +veterans: A preliminary model and intervention strategy. *Clinical +Psychology Review*, 29(8), 695–706. +doi:[10.1016/j.cpr.2009.07.003](https://doi.org/10.1016/j.cpr.2009.07.003) + +> Formalizis moralan vundon kiel klinikan konstrukton. Difino citita en +> Sekcio 8.4. + +### Organiza Mezurado + +[18] Austin, R. D. (1996). *Measuring and Managing Performance in +Organizations*. Dorset House. ISBN: 978-0-932633-36-1. + +> Pruvis ke nekompleta mezurado kreas neeviteblajn instigojn optimumigi +> mezuritajn dimensiojn je la kosto de nemezuritaj. La informasimetria +> kadro proksime paralelas Sekcion 7. La unu plej grava antaulo de la +> argumento de ci tiu artikolo. + +[19] Muller, J. Z. (2018). *The Tyranny of Metrics*. Princeton University +Press. ISBN: 978-0-691-17495-2. + +> Ampleksa traktado de "metrika fiksigho" tra edukado, sanservo, policado, +> kaj financoj. Ampleksa empiria evidento por la skemoj teorizitaj en +> Sekcio 7.4. + +### Planada Justeco + +[20] Coffman, E. G., Shanthikumar, J. G., & Yao, D. D. (1992). +Multiclass queueing systems: Polymatroid structure and optimal scheduling +control. *Operations Research*, 40(S2), S293–S299. + +> Konservoleghoj en planado. La planed-invarianteco de labor-pondita +> kompletiga tempo (Teoremo 2) estas okazo de ci tiuj konservoleghoj. + +[21] Angel, E., Bampis, E., & Pascual, F. (2008). How good are SPT +schedules for fair optimality criteria? *Annals of Operations Research*, +159(1), 53–64. doi:[10.1007/s10479-007-0267-0](https://doi.org/10.1007/s10479-007-0267-0) + +> Rekte mezuras SPT-planadan kvaliton kontrau justecaj kriterioj. Plej +> proksima antaulo en planada teorio al la justeca analizo de Sekcio 4. + +[22] Bansal, N., & Harchol-Balter, M. (2001). Analysis of SRPT +scheduling: Investigating unfairness. *ACM SIGMETRICS Performance +Evaluation Review*, 29(1), 279–290. +doi:[10.1145/384268.378792](https://doi.org/10.1145/384268.378792) + +> Esploras la kredon ke SRPT maljuste punas grandajn taskojn en komputila +> planado. Argumentas ke maljusteco estas pli malgranda ol kredite sed +> agnoskas la kernan tension. + +[23] Wierman, A., & Harchol-Balter, M. (2003). Classifying scheduling +policies with respect to unfairness in an M/GI/1. *ACM SIGMETRICS +Performance Evaluation Review*, 31(1), 238–249. + +> Formaligas justecajn difinojn por planadaj politikoj per komparo al +> Procesoro-Divido. + +### Pliaj Referencoj + +[24] Campbell, D. T. (1979). Assessing the impact of planned social +change. *Evaluation and Program Planning*, 2(1), 67–90. +doi:[10.1016/0149-7189(79)90048-X](https://doi.org/10.1016/0149-7189(79)90048-X) + +> La Legho de Campbell: "Ju pli iu ajn kvanta socia indikilo estas uzita +> por socia decidofarado, des pli submetita ghi estos al koruptaj premoj +> kaj des pli tauge ghi estos distordi kaj korupti la sociajn procezojn +> kiujn ghi intencas monitori." Komplementas la Leghon de Goodhart [6]. + +[25] Ferreira, C. M., et al. (2024). It's business: A qualitative study +of moral injury in business settings. *Journal of Business Ethics*. +doi:[10.1007/s10551-024-05615-0](https://doi.org/10.1007/s10551-024-05615-0) + +> Etendas moralan vundon al profitcelaj laborejoj. Validigas la aplikon de +> Sekcio 8.4 de Shay/Litz ekster armeaj kaj sansrvaj medioj. + +[26] Bevan, G., & Hood, C. (2006). What's measured is what matters: +Targets and gaming in the English public health care system. *Public +Administration*, 84(3), 517–538. +doi:[10.1111/j.1467-9299.2006.00600.x](https://doi.org/10.1111/j.1467-9299.2006.00600.x) + +> Empirie dokumentas manipulajn kondutojn inkluzive de "trafi la celon +> kaj maltrafi la celon." Provizas realmondajn pruvojn por la +> prioritato-metrika kontraudiro de Sekcio 5.2. + +[27] Moore, C. (2012). Why employees do bad things: Moral disengagement +and unethical organizational behavior. *Personnel Psychology*, 65(1), +1–48. doi:[10.1111/j.1744-6570.2011.01237.x](https://doi.org/10.1111/j.1744-6570.2011.01237.x) + +> Analizas moralan *malengaghighon* --- la kognan restrukturizon ebliganta +> maletan konduton. Sekcio 8 traktas la komplementan fenomenon: la +> damaghon al individuoj kiuj *rifuzas* malengaghighi. + +--- + +*Ci tiu pruvo estis konversacie evoluigita kaj formalizita je 2026-03-28.* diff --git a/README.es.md b/README.es.md new file mode 100644 index 0000000..634e738 --- /dev/null +++ b/README.es.md @@ -0,0 +1,1314 @@ +# El tiempo medio de finalización no ponderado no es una métrica justa para la planificación de tareas + +Una demostración matemática de que el tiempo medio de finalización de tareas +no ponderado es un estadístico sesgado que incentiva la selección preferencial +de trabajo fácil, y de que cualquier ventaja de planificación que aparente +revelar es un artefacto de la métrica — no un reflejo de rendimiento genuino +ni de calidad de servicio. + +--- + +## 1. Introducción + +Muchas organizaciones miden el rendimiento en la ejecución de tareas mediante +el **tiempo medio de finalización no ponderado**: el número promedio de horas +(o días) entre el envío de una tarea y su resolución, contando cada tarea por +igual independientemente de su tamaño o prioridad. + +Este artículo demuestra que esta métrica no es meramente imprecisa, sino +estructuralmente sesgada. Puede mejorarse reordenando el trabajo sin realizar +ningún trabajo adicional (Teorema 1), mientras que una alternativa ponderada +adecuadamente es completamente inmune a la manipulación del orden de ejecución +(Teorema 2). Cuando se combina con un sistema de prioridades, la métrica +contradice activamente las propias clasificaciones de prioridad de la +organización (Teorema 9). + +El argumento se desarrolla en cuatro partes: + +- **Parte I** (Secciones 2–4) establece la base matemática: la media no + ponderada es manipulable mediante la planificación por Tiempo de + Procesamiento más Corto Primero (SPT), la media ponderada por trabajo es + invariante respecto al orden de ejecución, y las consecuencias resultantes + para la calidad del servicio son demostrablemente negativas. + +- **Parte II** (Secciones 5–6) extiende el modelo a tareas clasificadas por + prioridad, demuestra que la métrica se vuelve adversarial respecto al + sistema de prioridades, y propone alternativas ponderadas con un ejemplo + práctico de mesa de servicio de TI. + +- **Parte III** (Secciones 7–9) examina las dinámicas organizacionales: qué + ocurre cuando la métrica se reporta a los clientes (asimetría de + información), qué sucede con los miembros del equipo que comprenden sus + defectos (daño psicológico), y qué puede hacer un gerente informado al + respecto (optimización restringida con análisis de estabilidad desde la + teoría de juegos). + +- **Parte IV** (Secciones 10–12) presenta contraargumentos honestos, sitúa + el trabajo en la literatura existente y concluye. + +Los resultados fundamentales se basan en la teoría fundacional de planificación +de Smith (1956) [1], extendida mediante la teoría de juegos [9, 10], la teoría +de medición organizacional [18, 19] y la psicología [11–17] para trazar una +cadena completa desde una demostración matemática sobre una métrica específica +hasta los resultados organizacionales. + +--- + +# Parte I: Fundamentos matemáticos + +## 2. Definiciones + +Sean **n** tareas con tiempos de procesamiento $p_1, p_2, \ldots, p_n$. + +Un **calendario de ejecución** $\sigma$ es una permutación de $\{1, 2, \ldots, n\}$ que +asigna tareas a un orden de ejecución en un único ejecutor. + +El **tiempo de finalización** de la tarea $\sigma(k)$ bajo el calendario $\sigma$ es: + +$$C_{\sigma(k)} = \sum_{j=1}^{k} p_{\sigma(j)}$$ + +El **tiempo medio de finalización no ponderado** es: + +$$\bar{C}(\sigma) = \frac{1}{n} \sum_{k=1}^{n} C_{\sigma(k)}$$ + +El **tiempo medio de finalización ponderado por trabajo** es: + +$$\bar{C}_w(\sigma) = \frac{\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)}}{\sum_{k=1}^{n} p_{\sigma(k)}}$$ + +--- + +## 3. Resultados fundamentales + +### 3.1 La media no ponderada es manipulable + +**Teorema 1** (Smith, 1956 [1])**.** El calendario que minimiza +$\bar{C}(\sigma)$ es el de Tiempo de Procesamiento más Corto Primero (SPT): +ordenar las tareas de modo que +$p_{\sigma(1)} \le p_{\sigma(2)} \le \cdots \le p_{\sigma(n)}$. + +**Demostración (argumento de intercambio [1, 2]).** + +Considérese cualquier calendario $\sigma$ en el que dos tareas adyacentes $i, j$ +satisfacen $p_i > p_j$, con la tarea $i$ programada inmediatamente antes de la +tarea $j$. Sea $t$ el tiempo de inicio de la tarea $i$. + +| | La tarea $i$ finaliza | La tarea $j$ finaliza | Suma | +|---|---|---|---| +| **Antes del intercambio** ($i$ luego $j$) | $t + p_i$ | $t + p_i + p_j$ | $2t + 2p_i + p_j$ | +| **Después del intercambio** ($j$ luego $i$) | $t + p_j$ | $t + p_j + p_i$ | $2t + p_i + 2p_j$ | + +El cambio en la suma de tiempos de finalización es: + +$$(2p_i + p_j) - (p_i + 2p_j) = p_i - p_j > 0$$ + +Cada intercambio de un par adyacente largo-antes-de-corto reduce estrictamente +el total. Todo calendario no-SPT contiene dicho par. Los intercambios +repetidos convergen a SPT. Por lo tanto, SPT minimiza de forma única +$\bar{C}(\sigma)$. $\blacksquare$ + +### 3.2 La media ponderada por trabajo es invariante respecto al calendario + +**Teorema 2.** El tiempo medio de finalización ponderado por trabajo +$\bar{C}_w(\sigma)$ es el mismo para todo calendario $\sigma$. + +**Demostración.** + +Expandamos el numerador: + +$$\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)} = \sum_{k=1}^{n} p_{\sigma(k)} \sum_{j=1}^{k} p_{\sigma(j)}$$ + +Reindexemos haciendo $a = \sigma(k)$ y $b = \sigma(j)$. La suma doble cuenta +cada par ordenado $(a, b)$ donde $b$ está programado no después de $a$: + +$$= \sum_{\substack{a, b \\ b \preceq_\sigma a}} p_a \, p_b$$ + +Para cualquier par $(a, b)$ con $a \ne b$, se cumple exactamente uno de +$\{b \preceq_\sigma a\}$ o $\{a \prec_\sigma b\}$. Los términos diagonales +($a = b$) contribuyen $p_a^2$ independientemente del orden. Por lo tanto: + +$$\sum_{\substack{a, b \\ b \preceq_\sigma a}} p_a \, p_b = \sum_{a} p_a^2 + \sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b$$ + +Junto con la suma complementaria, las dos sumas fuera de la diagonal cubren +todos los pares no ordenados: + +$$\sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b + \sum_{\substack{a \ne b \\ a \prec_\sigma b}} p_a \, p_b = \sum_{a \ne b} p_a \, p_b$$ + +El lado derecho es independiente del calendario. Por la simetría de $p_a p_b$, +ambas sumas fuera de la diagonal son iguales: + +$$\sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b = \frac{1}{2} \sum_{a \ne b} p_a \, p_b$$ + +Por lo tanto: + +$$\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)} = \sum_a p_a^2 + \frac{1}{2} \sum_{a \ne b} p_a \, p_b = \frac{1}{2}\left(\sum_a p_a\right)^2 + \frac{1}{2}\sum_a p_a^2$$ + +Esta expresión no contiene referencia alguna a $\sigma$. Dado que el +denominador $\sum p_a$ también es independiente del calendario: + +$$\bar{C}_w(\sigma) = \frac{\frac{1}{2}\left(\sum p_a\right)^2 + \frac{1}{2}\sum p_a^2}{\sum p_a}$$ + +es **constante para todos los calendarios**. $\blacksquare$ + +Este es un caso de las leyes de conservación en planificación identificadas +por Coffman, Shanthikumar y Yao [20]. La invariancia corresponde a medir +cuánto tiempo espera una unidad de *trabajo* en lugar de cuánto tiempo espera +una *tarea* — el estadístico no ponderado cuenta finalizaciones en vez de +trabajo, razón por la cual es manipulable. (Véase también Little [3, 4] para +el contexto de la teoría de colas, con la advertencia de que la Ley de Little +se aplica directamente solo a sistemas en estado estacionario, no al caso por +lotes analizado aquí.) + +### 3.3 Ejemplo ilustrativo + +Dos tareas: $A$ con $p_A = 1$ hora, $B$ con $p_B = 10$ horas. + +| Calendario | $C_A$ | $C_B$ | Media no ponderada | Media ponderada por trabajo | +|----------|-------|-------|-----------------|-------------------| +| SPT (A primero) | 1 | 11 | 6.0 | 111/11 ≈ 10.09 | +| Inverso (B primero) | 11 | 10 | 10.5 | 111/11 ≈ 10.09 | + +SPT parece **4.5 horas mejor** en la métrica no ponderada, pero proporciona +**cero mejora** en la métrica ponderada por trabajo. La ventaja aparente +existe solo porque el estadístico no ponderado permite que una tarea de +1 hora "vote" con el mismo peso que una tarea de 10 horas. + +--- + +## 4. Consecuencias para la calidad del servicio + +### 4.1 Inanición de tareas grandes + +**Teorema 3 (Sesgo de la métrica).** Cualquier política de planificación que +minimice el tiempo medio de finalización no ponderado necesariamente maximiza +el tiempo de finalización de la tarea más grande. + +**Demostración.** SPT coloca la tarea más grande en último lugar. Su tiempo +de finalización es igual al tiempo total de procesamiento $\sum p_i$, que es +el máximo tiempo de finalización posible para cualquier tarea individual. +Bajo cualquier calendario que no coloque la tarea más grande en último lugar, +dicha tarea se completa estrictamente antes. $\blacksquare$ + +Esto crea un **incentivo de inanición**: agentes racionales que optimizan +el estadístico no ponderado postergarán indefinidamente las tareas grandes +en favor de las pequeñas. Austin [18] identificó este patrón general — que +la medición incompleta crea incentivos para optimizar la dimensión medida a +expensas de las no medidas — en el contexto de la gestión del rendimiento +organizacional. El Teorema 3 proporciona el mecanismo específico para la +planificación de tareas. + +### 4.2 Tiempo de finalización máximo para la tarea más grande + +**Teorema 4 (SPT maximiza de forma única el tiempo de finalización de la tarea más grande).** +Entre todos los calendarios, SPT es la única política que asigna el máximo +tiempo de finalización posible ($\sum p_i$) a la tarea más grande. + +**Demostración.** SPT ordena las tareas en orden ascendente de $p_i$, +colocando la tarea más grande $p_{\max}$ en la última posición. La última +tarea en cualquier calendario tiene un tiempo de finalización de +$\sum_{i=1}^{n} p_i$, que es el máximo que cualquier tarea individual puede +recibir. Bajo cualquier calendario que no coloque $p_{\max}$ en último lugar, +esta se completa estrictamente antes de $\sum p_i$. $\blacksquare$ + +**Corolario 4.1.** Un equipo que optimiza el tiempo medio de finalización +no ponderado proporcionará sistemáticamente la peor experiencia a los +clientes con las necesidades más complejas. Esto no es un efecto secundario +— es el *mecanismo* por el cual la métrica mejora. + +**Nota sobre las razones de ralentización.** SPT en realidad *comprime* las +razones de ralentización ($S_i = C_i / p_i$) porque las tareas más grandes +en posiciones posteriores tienen denominadores grandes que absorben la suma +acumulada. Por ejemplo, con las tareas $[1, 5, 10]$: SPT produce +ralentizaciones $[1, 1.2, 1.6]$ (baja varianza) mientras que LPT produce +$[1, 3, 16]$ (alta varianza). El perjuicio de SPT a los clientes con tareas +grandes no es visible en la razón de ralentización — es visible en el +**tiempo de finalización absoluto**. Esta distinción es importante: la +literatura sobre equidad en planificación [21, 22, 23] ha debatido la +injusticia de SPT/SRPT principalmente mediante medidas basadas en +ralentización, que pueden ocultar la carga de retraso absoluto demostrada +a continuación. + +### 4.3 Concentración del retraso + +**Teorema 5 (SPT concentra el retraso en la tarea más grande).** Bajo SPT, +la tarea más grande soporta más retraso absoluto que bajo cualquier otro +calendario. + +**Demostración.** Defínase el retraso absoluto como $\Delta_i = C_i - p_i$ +(tiempo de espera, independiente del tamaño propio). Bajo SPT, la tarea +más grande está en la posición $n$ con: + +$$\Delta_{\max\text{-task}}^{\text{SPT}} = C_n - p_n = \sum_{i=1}^{n-1} p_i$$ + +Esta es la suma de los tiempos de procesamiento de todas las demás tareas — +el máximo retraso posible para cualquier tarea individual. Bajo cualquier +calendario donde la tarea más grande no está en último lugar, su retraso es +estrictamente menor. Mientras tanto, SPT otorga a la tarea más pequeña +retraso cero ($\Delta_1^{\text{SPT}} = 0$). Toda la carga de espera se +transfiere de las tareas pequeñas a las grandes. $\blacksquare$ + +SPT minimiza el retraso *total* (bueno para la eficiencia agregada) +concentrando el retraso en las tareas más capaces de absorberlo en términos +de razón de ralentización. Pero en términos absolutos — horas de espera — +la tarea más grande soporta todo el peso. + +### 4.4 Invariancia del rendimiento + +**Teorema 6 (Invariancia del rendimiento).** El trabajo total completado en +cualquier horizonte temporal $T$ es idéntico bajo todas las políticas de +planificación. + +**Demostración.** El ejecutor procesa trabajo a una tasa fija. En cualquier +horizonte $T \ge \sum p_i$, el trabajo total realizado es exactamente +$\sum p_i$ independientemente del orden. Para el caso de estado estacionario +con llegadas continuas, el rendimiento a largo plazo está determinado por la +tasa de servicio $\mu$ y es completamente independiente de la planificación: + +$$\lim_{T \to \infty} \frac{W(T)}{T} = \mu \quad \text{for all schedules } \sigma$$ + +$\blacksquare$ + +**Corolario 6.1.** Un equipo que cambia de cualquier política de planificación +a SPT observará una mejora en el tiempo medio de finalización no ponderado con +**cero cambio en el rendimiento real**. La métrica mejora. La producción no. + +### 4.5 El efecto compuesto + +Combinando los Teoremas 4, 5 y 6: + +| Medida | Efecto de optimizar la media no ponderada | +|---------|--------------------------------------| +| Rendimiento (trabajo/tiempo) | Sin cambio (Teorema 6) | +| Retraso para tareas pequeñas | Minimizado — se aproxima a cero (SPT) | +| Retraso para tareas grandes | **Maximizado** — soporta toda la carga de espera (Teorema 5) | +| Tiempo de finalización de la tarea más grande | **Máximo posible**: $\sum p_i$ (Teorema 4) | + +El efecto neto sobre la calidad percibida es negativo porque: + +1. **La aversión a la pérdida es asimétrica** [8]. Un cliente cuya tarea de + 100 horas es desprioritizada experimenta un impacto negativo grande y + prominente. Un cliente cuya tarea de 1 hora es expedida experimenta un + beneficio pequeño y frecuentemente inadvertido. + +2. **Las tareas de alto esfuerzo se correlacionan con clientes de alto + valor.** Las tareas grandes provienen desproporcionadamente de clientes + importantes, contratos complejos o necesidades empresariales críticas. + +3. **La inanición se acumula.** En un sistema continuo (Teorema 3), las + tareas grandes pueden ser **postergadas indefinidamente** a medida que + siguen llegando nuevas tareas pequeñas. + +**Teorema 7 (El resultado central).** Para un equipo que procesa tareas de +tamaño no uniforme, adoptar el tiempo medio de finalización no ponderado como +métrica de rendimiento: + +(a) Proporciona **cero ganancia de productividad** (Teorema 6), mientras que +(b) **Asigna el máximo tiempo de finalización posible** a la tarea más grande + (Teorema 4), y +(c) **Concentra todo el retraso de espera** en las tareas más grandes, + eliminando el retraso de las más pequeñas (Teorema 5). + +Esto no es un compromiso. La métrica crea una transferencia pura de calidad +de servicio de los clientes de alto esfuerzo a los clientes de bajo esfuerzo, +sin trabajo neto ganado. $\blacksquare$ + +--- + +# Parte II: Sistemas de prioridad + +## 5. Colapso bajo clasificación por prioridad + +Las secciones anteriores demostraron que el tiempo medio de finalización no +ponderado está sesgado cuando las tareas varían en tamaño. Ahora mostramos +que la introducción de un **sistema de prioridades** — como el que +prácticamente todos los equipos reales utilizan — hace que la métrica pase +de ser meramente sesgada a ser **activamente adversarial** respecto a los +objetivos declarados de la organización. + +### 5.1 Modelo extendido: tareas con prioridad + +Sea cada tarea $i$ con tiempo de procesamiento $p_i$ y una clase de prioridad +$q_i \in \{1, 2, 3, 4\}$ donde 1 es la prioridad más alta (crítica) y +4 es la más baja (cosmética/mejora). Asígnense pesos de prioridad: + +$$w(q) = \begin{cases} 8 & q = 1 \text{ (Critical)} \\ 4 & q = 2 \text{ (High)} \\ 2 & q = 3 \text{ (Medium)} \\ 1 & q = 4 \text{ (Low)} \end{cases}$$ + +Los pesos específicos son ilustrativos; los resultados se mantienen para +cualquier función de pesos estrictamente decreciente. La propiedad clave +es que la prioridad se asigna por **impacto de negocio**, no por tamaño +de tarea. + +### 5.2 La métrica contradice el sistema de prioridades + +**Teorema 8 (Inversión de prioridad-tamaño).** Cuando la prioridad es +independiente del tamaño de la tarea, el calendario que minimiza el tiempo +medio de finalización no ponderado (SPT) completará, en expectativa, las +tareas de baja prioridad antes que las tareas de alta prioridad de mayor +tamaño. + +**Demostración.** SPT ordena las tareas por $p_i$ ascendente, sin importar +$q_i$. Considérense dos tareas: + +- Tarea A: $p_A = 40$ horas, $q_A = 1$ (Crítica — p. ej., caída del servidor) +- Tarea B: $p_B = 0.5$ horas, $q_B = 4$ (Baja — p. ej., corrección cosmética de interfaz) + +SPT programa B antes que A. La media no ponderada para este par: + +$$\bar{C}^{\text{SPT}} = \frac{0.5 + 40.5}{2} = 20.5 \qquad \bar{C}^{\text{priority}} = \frac{40 + 40.5}{2} = 40.25$$ + +La métrica declara que SPT es casi **el doble de bueno** — a pesar de +completar una corrección cosmética mientras un servidor está caído. + +En general, cuando $q_i$ es estadísticamente independiente de $p_i$, el +ordenamiento de SPT tiene **correlación cero** con la prioridad. En la +práctica, las tareas Críticas (interrupciones, incidentes de seguridad, +pérdida de datos) frecuentemente requieren más trabajo que las tareas Bajas, +por lo que la métrica está plausiblemente **anti-correlacionada** con el +sistema de prioridades. $\blacksquare$ + +### 5.3 Destrucción de información + +La media no ponderada reduce una tarea tridimensional $(p_i, q_i, C_i)$ a +una señal unidimensional ($C_i$), y luego promedia uniformemente. Esto +descarta la prioridad por completo e invierte implícitamente el tamaño. + +**Teorema 9 (Destrucción de información).** Sea $I(\sigma)$ la información +mutua entre la clasificación de prioridad implícita del calendario (posición) +y la asignación real de prioridad $q_i$. Para SPT: + +$$I(\sigma_{\text{SPT}}) = 0 \quad \text{when } p_i \perp q_i$$ + +**Demostración.** SPT asigna posiciones basándose únicamente en $p_i$. +Cuando $p_i$ y $q_i$ son independientes, conocer la posición de una tarea +en el calendario SPT proporciona cero información sobre su prioridad. +$\blacksquare$ + +**Corolario 9.1.** Un equipo que optimiza el tiempo medio de finalización +no ponderado opera un sistema de planificación que no contiene información +alguna sobre su propia clasificación de prioridades. El campo de prioridad +en su sistema de tickets es, con respecto al orden de ejecución, decorativo. + +Este es un caso de lo que Austin [18] denomina el problema fundamental de +la medición incompleta: cuando el sistema de medición captura solo un +subconjunto de las dimensiones relevantes, optimizar la medición degrada +sistemáticamente las dimensiones no medidas. + +### 5.4 Coste de retraso ponderado por prioridad + +Defínase el **coste de retraso ponderado por prioridad** de un calendario: + +$$D(\sigma) = \sum_{i=1}^{n} w(q_i) \cdot C_i$$ + +**Teorema 10 (SPT y coste de retraso ponderado por prioridad).** El calendario +óptimo para minimizar $D(\sigma)$ es WSJF: ordenar por $w(q_i)/p_i$ +descendente [1, 5]. El ordenamiento de SPT — por $1/p_i$ descendente — ignora +la prioridad por completo y produce un $D$ mayor que las alternativas que +respetan la prioridad cuando la prioridad está correlacionada con el tamaño +de la tarea. + +**Demostración.** Mediante el argumento de intercambio, el intercambio de +tareas adyacentes $i, j$ cambia $D$ en: + +$$\Delta D = w(q_j) \cdot p_i - w(q_i) \cdot p_j$$ + +El intercambio mejora $D$ cuando $w(q_j)/p_j > w(q_i)/p_i$ pero $j$ está +programada después de $i$. Por lo tanto, el orden óptimo es $w(q_i)/p_i$ +decreciente — la regla WSJF. SPT corresponde a WSJF solo cuando +$w(q_i) = \text{const}$ (todas las tareas tienen igual prioridad). + +**Ejemplo.** Crítica ($w = 8$, $p = 3$) y Baja ($w = 1$, $p = 2$): + +- SPT (Baja primero): $D = 1 \cdot 2 + 8 \cdot 5 = 42$ +- WSJF (Crítica primero): $D = 8 \cdot 3 + 1 \cdot 5 = 29$ + +SPT incurre en un 45% más de retraso ponderado por prioridad. En la práctica, +las tareas Críticas tienden a ser más grandes (interrupciones, incidentes de +seguridad), haciendo que la divergencia sea sistemática. $\blacksquare$ + +--- + +## 6. Soluciones propuestas + +### 6.1 Métricas ponderadas por prioridad + +Reemplazar el tiempo medio de finalización no ponderado con la **Puntuación +de Finalización Ponderada por Prioridad (PWCS)**: + +$$\text{PWCS}(\sigma) = \frac{\sum_{i=1}^{n} w(q_i) \cdot \frac{C_i}{p_i}}{\sum_{i=1}^{n} w(q_i)}$$ + +Esta es la media ponderada por prioridad de la razón de ralentización. Mide +cuánto esperó cada tarea en relación con su tamaño, ponderado por la +importancia de esa tarea. Menor es mejor. + +**Propiedades:** + +1. **Respetuosa con la prioridad.** Los retrasos en tareas Críticas cuestan + 8 veces más que los retrasos en tareas Bajas. +2. **Justa con el tamaño.** Utiliza la razón de ralentización $C_i / p_i$, + de modo que las tareas grandes no son penalizadas por ser grandes. +3. **No manipulable por SPT.** Reordenar por tiempo de procesamiento no + mejora sistemáticamente la puntuación. +4. **Se reduce a la media no ponderada cuando las tareas son uniformes.** + Es una generalización estricta. + +### 6.2 Política óptima: WSJF + +**Teorema 11.** El calendario que minimiza el tiempo de finalización ponderado +por prioridad $\text{PWCT}(\sigma) = \sum w(q_i) \cdot C_i / \sum w(q_i)$ +procesa las tareas en orden decreciente de $w(q_i)/p_i$ — la regla de +**Trabajo Ponderado más Corto Primero (WSJF)** [1, 5]. + +**Demostración.** Mediante el argumento de intercambio (como en el +Teorema 10), el intercambio de tareas adyacentes $i, j$ mejora el PWCT cuando +$w(q_j)/p_j > w(q_i)/p_i$ pero $j$ está programada después de $i$. Por lo +tanto, el orden óptimo es $w(q_i)/p_i$ decreciente. $\blacksquare$ + +Dentro de una clase de prioridad, esto se reduce a SPT (la más corta +primero). Entre clases, una tarea Crítica de 4 horas ($w/p = 2.0$) supera a +una tarea Baja de 1 hora ($w/p = 1.0$). + +**Advertencia práctica.** El WSJF puro puede colocar tareas diminutas de +prioridad Baja por delante de tareas Críticas grandes (una tarea Baja de +15 minutos tiene $w/p = 1/0.25 = 4.0$, superando a una Crítica de 6 horas +con $w/p = 8/6 = 1.33$). En la práctica, esto se mitiga imponiendo un +**ordenamiento estricto por clase de prioridad** y aplicando WSJF solo +*dentro* de cada clase. + +### 6.3 Ejemplo aplicado: mesa de servicio de TI + +Considérese un equipo de TI con la siguiente cola de tickets: + +| Ticket | Prioridad | Tipo | Horas est. | +|--------|----------|------|-----------| +| T1 | P1 (Crítica) | Servidor de correo caído | 6 | +| T2 | P2 (Alta) | VPN fallando para equipo remoto | 4 | +| T3 | P3 (Media) | Configuración de portátil para nuevo empleado | 2 | +| T4 | P4 (Baja) | Actualizar política de fondo de escritorio | 0.5 | +| T5 | P3 (Media) | Instalar licencia de software | 1 | +| T6 | P1 (Crítica) | Respaldo de base de datos fallando | 3 | +| T7 | P2 (Alta) | Flota de impresoras fuera de línea | 2 | +| T8 | P4 (Baja) | Archivar carpeta antigua de unidad compartida | 0.25 | + +**Orden SPT** (optimizando la media no ponderada): T8, T4, T5, T3, T7, T6, T2, T1 + +| Pos | Ticket | Prioridad | Horas | Finalización | Ralentización | +|-----|--------|----------|-------|------------|----------| +| 1 | T8 (archivar carpeta) | P4 Baja | 0.25 | 0.25 | 1.0 | +| 2 | T4 (fondo de escritorio) | P4 Baja | 0.5 | 0.75 | 1.5 | +| 3 | T5 (software) | P3 Media | 1 | 1.75 | 1.75 | +| 4 | T3 (portátil) | P3 Media | 2 | 3.75 | 1.875 | +| 5 | T7 (impresoras) | P2 Alta | 2 | 5.75 | 2.875 | +| 6 | T6 (respaldos) | P1 Crítica | 3 | 8.75 | 2.917 | +| 7 | T2 (VPN) | P2 Alta | 4 | 12.75 | 3.188 | +| 8 | T1 (correo) | P1 Crítica | 6 | 18.75 | 3.125 | + +**WSJF práctico** (prioridad de clase primero, SPT dentro de cada clase): + +| Pos | Ticket | Prioridad | Horas | Finalización | +|-----|--------|----------|-------|------------| +| 1 | T6 (respaldos) | P1 Crítica | 3 | 3 | +| 2 | T1 (correo) | P1 Crítica | 6 | 9 | +| 3 | T7 (impresoras) | P2 Alta | 2 | 11 | +| 4 | T2 (VPN) | P2 Alta | 4 | 15 | +| 5 | T5 (software) | P3 Media | 1 | 16 | +| 6 | T3 (portátil) | P3 Media | 2 | 18 | +| 7 | T8 (archivo) | P4 Baja | 0.25 | 18.25 | +| 8 | T4 (fondo de escritorio) | P4 Baja | 0.5 | 18.75 | + +**Comparación:** + +| Métrica | SPT | WSJF práctico | Ganador | +|--------|-----|----------------|--------| +| Media de finalización no ponderada | **6.56 hrs** | 13.63 hrs | SPT | +| Tiempo medio de resolución P1 | 13.75 hrs | **6 hrs** | WSJF | +| Tiempo medio de resolución P2 | 9.25 hrs | **13 hrs** | SPT | +| Tiempo para reparar servidor de correo | 18.75 hrs | **9 hrs** | WSJF | +| Tiempo para reparar respaldos de BD | 8.75 hrs | **3 hrs** | WSJF | +| Tiempo para actualizar fondo de escritorio | **0.75 hrs** | 18.75 hrs | SPT | + +Los tiempos de finalización ponderados por prioridad agregados son casi +idénticos (PWCT: 10.2 vs 10.17) porque la agregación oculta el daño +distribucional. La diferencia real está en el desglose **por clase de +prioridad**: el servidor de correo está caído durante 18.75 horas bajo SPT +frente a 9 horas bajo WSJF. Los respaldos de base de datos fallan durante +8.75 horas frente a 3. + +La métrica no ponderada reporta con confianza que SPT es **más del doble de +eficiente** (6.56 vs 13.63), premiando al equipo que actualizó el fondo de +escritorio mientras el servidor de correo estaba en llamas. + +### 6.4 Conjunto de métricas recomendado + +Incluso las métricas agregadas ponderadas por prioridad pueden fallar en +distinguir buenos de malos calendarios, porque la agregación oculta el daño +distribucional. Ninguna métrica individual es suficiente. Un sistema de +medición completo debe rastrear: + +| Métrica | Qué mide | Fórmula | +|--------|-----------------|---------| +| **Media de finalización por clase de prioridad** | Capacidad de respuesta por clase | $\bar{C}$ filtrado por $q$ | +| **Tiempo medio de resolución P1** | Respuesta a incidentes críticos | $\bar{C}$ para $q = 1$ | +| **Rendimiento** | Capacidad bruta de trabajo | Horas-trabajo completadas / tiempo calendario | +| **Violaciones por antigüedad** | Prevención de inanición | Tareas que exceden el SLA por prioridad | +| **Tiempo máximo de finalización (P1/P2)** | Peor caso de respuesta crítica | $\max(C_i)$ para $q \le 2$ | + +La idea clave: las **métricas por clase de prioridad** exponen fallos de +planificación que las métricas agregadas ocultan. + +--- + +# Parte III: Dinámicas organizacionales + +## 7. Cuando la métrica es el producto + +Las Secciones 2–6 suponen que la satisfacción del cliente es una función de +la *calidad de servicio experimentada*. Pero existe un escenario en el que +este supuesto falla y todo el argumento se derrumba. + +### 7.1 La métrica autorreferencial + +Supóngase que el proveedor reporta la media no ponderada directamente al +cliente — en un panel de control, en un informe de SLA, en una página de +marketing — y que la satisfacción del cliente se deriva principalmente de +*ese número*: + +$$U_{\text{client}} = f\!\left(\bar{C}(\sigma)\right), \quad f' < 0$$ + +Bajo este modelo, SPT genuinamente maximiza la satisfacción del cliente +(Teorema 1). El rendimiento no cambia (Teorema 6). El resultado de negocio +mejora: mismo trabajo realizado, cliente más satisfecho. + +**Todos los teoremas de este artículo siguen siendo matemáticamente +correctos. Pero la conclusión se invierte.** La métrica ya no es un proxy +que pueda ser manipulado — ella *es* la calidad del servicio, porque el +cliente ha aceptado evaluar la calidad mediante el número agregado. + +### 7.2 La economía + +Esto crea un equilibrio coherente y estable: + +| Actor | Comportamiento | Resultado | +|-------|----------|---------| +| Proveedor | Optimiza la media no ponderada (SPT) | La métrica mejora, sin trabajo extra | +| Cliente | Lee el panel de control, ve un promedio bajo | Reporta satisfacción | +| Gerencia | Ve cliente satisfecho + buena métrica | Recompensa al equipo | + +El proveedor extrae satisfacción a coste marginal cero, optimizando un +número que el cliente ha aceptado como proxy de calidad. + +### 7.3 La fragilidad + +Este equilibrio es estable solo mientras el cliente nunca inspeccione su +propia experiencia. Se rompe cuando: + +1. **El cliente revisa su propio ticket.** Un CTO cuyo servidor de correo + estuvo caído 18.75 horas no se tranquilizará con "Resolución promedio: + 6.56 horas." Los clientes más propensos a inspeccionar son exactamente + los que reciben el peor servicio (Teorema 4). + +2. **Un competidor ofrece SLAs por ticket.** "P1 resuelto en 4 horas" + supera a "resolución promedio inferior a 7 horas" para cualquier cliente + con necesidades críticas. + +3. **El equipo internaliza la métrica.** Si el equipo cree que la métrica + refleja el rendimiento real, pierde la capacidad de reconocer cuándo se + descuida el trabajo crítico. La métrica se convierte en un peligro + epistémico. + +### 7.4 El patrón general + +Este patrón — el proxy reemplaza la calidad, el proxy se optimiza, la +calidad diverge, el sistema es estable hasta que la realidad lo pone a +prueba — se repite en múltiples dominios. Muller [19] lo documenta +extensamente como "fijación métrica"; Campbell [24] formalizó el efecto +corruptor de usar indicadores como objetivos. + +| Dominio | Métrica proxy | Calidad subyacente | Divergencia | +|--------|-------------|-------------------|------------| +| Soporte de TI | Tiempo medio de resolución | Disponibilidad de sistemas críticos | Servidor caído 19 hrs, el promedio dice 6.5 | +| Educación | Calificaciones de exámenes | Aprendizaje real | Enseñar para el examen | +| Salud | Rendimiento de pacientes | Resultados de salud | Altas más rápidas, mayor reingreso | +| Finanzas | Ganancias trimestrales | Valor a largo plazo | Recorte de costes infla BPA, erosiona capacidad | +| Software | Velocidad (puntos de historia) | Calidad del producto | Inflación de puntos, funcionalidades a medio terminar | + +### 7.5 Asimetría de información + +Modélese el sistema como un juego entre el proveedor (P) y el cliente (C). +P observa los $\{C_i\}$ individuales y elige $\sigma$; C observa únicamente +$\bar{C}(\sigma)$. Este es un problema de **riesgo moral** [10]: la +estrategia óptima de P es minimizar la señal observable sin importar la +distribución no observable. + +El equilibrio es un **equilibrio agrupador** [9]: la métrica reportada por +P es idéntica independientemente del rendimiento ponderado por prioridad +subyacente. Es estable hasta que C obtiene acceso a los valores individuales +de $C_i$ — mediante un portal de cliente, la transparencia de un competidor, +o un incidente suficientemente doloroso. + +### 7.6 La conclusión incómoda + +La respuesta honesta a "¿optimizar la media no ponderada perjudica al +negocio?" es: **no necesariamente, siempre y cuando el cliente nunca mire +detrás del número**. La respuesta honesta a "¿es esto sostenible?" es: es +exactamente tan sostenible como cualquier sistema en el que el vendedor sabe +más que el comprador — estable durante períodos prolongados, luego colapso +rápido cuando la asimetría se rompe. + +--- + +## 8. El coste psicológico de saber + +La Sección 7 modeló al proveedor como un actor unitario. Pero los equipos +están compuestos por individuos. Cuando un miembro del equipo comprende la +demostración — cuando *sabe* que la métrica es sintética, que el panel de +control es teatro, que el servidor de correo sigue caído mientras cierra +tickets de fondo de escritorio — aparece un nuevo coste que el modelo de +equilibrio omitió. + +### 8.1 La variable oculta: conciencia del equipo + +| Actor | Observa $C_i$ individuales | Observa $\bar{C}$ | Comprende la demostración | +|-------|--------------------------|--------------------|-----------------------| +| Gerencia | Posiblemente | Sí | Variable | +| Miembro del equipo | **Sí** | Sí | **Sí** (en este escenario) | +| Cliente | No | Sí | No | + +El miembro del equipo tiene información completa. Ve la cola de tickets. +Sabe que el servidor de correo ha estado caído desde las 7 AM. Sabe que +está cerrando un ticket de fondo de escritorio porque mejora el número. +Y sabe *por qué*. + +### 8.2 Disonancia cognitiva bajo información completa + +La disonancia cognitiva [11] surge cuando un individuo sostiene cogniciones +contradictorias. Sin comprender el *por qué*, la contradicción puede +racionalizarse: "la gerencia sabe más." Comprender la demostración elimina +la ambigüedad. El miembro del equipo ahora sostiene: + +- **Cognición A:** "Soy un profesional competente. Mi trabajo es resolver + problemas importantes." +- **Cognición B:** "Estoy cerrando un ticket de fondo de escritorio mientras + el servidor de correo está caído, porque la métrica es matemáticamente + sesgada (Teorema 1), la reordenación produce cero rendimiento (Teorema 6), + y el único beneficiario es el panel de control (Sección 7). Puedo + demostrarlo." + +La disonancia es ahora *estructural*. Las resoluciones disponibles — +abandonar la identidad profesional, rechazar la demostración, abogar por el +cambio, o irse — cada una impone costes que no existían antes. + +### 8.3 Teoría de la Autodeterminación: tres necesidades violadas + +La Teoría de la Autodeterminación de Deci y Ryan [12, 13] identifica tres +necesidades que predicen la motivación intrínseca: + +**Autonomía.** La métrica restringe las decisiones de una manera que el +miembro del equipo sabe que es matemáticamente subóptima. Un trabajador que +comprende que el proceso es demostrablemente contraproducente no puede +sentirse autónomo siguiéndolo. + +**Competencia.** La métrica recompensa la efectividad *aparente* (bajo +$\bar{C}$) mientras es invariante a la efectividad *real* (Teorema 6). La +competencia genuina — reparar primero el servidor de correo — es *castigada* +por la métrica. + +**Vinculación.** El miembro del equipo sabe que el servidor de correo del +cliente está caído. Podría ayudar. En cambio, está actualizando el fondo de +escritorio — no porque ayude a alguien, sino porque ayuda a un número. La +conexión entre el trabajo y el impacto humano ha sido cortada, y el miembro +del equipo puede ver los extremos cortados. + +### 8.4 Daño moral + +El daño moral [16, 17] es el perjuicio duradero causado por "perpetrar, no +prevenir, presenciar o enterarse de actos que transgreden creencias morales +profundamente arraigadas" [17]. Desde entonces se ha extendido a entornos +empresariales [25]. La distinción clave respecto al agotamiento: **el +agotamiento es extenuación por hacer demasiado. El daño moral es perjuicio +por hacer lo incorrecto.** + +Un miembro del equipo que sabe que el servidor de correo está caído, sabe +que debería repararlo, cierra un ticket de fondo de escritorio en su lugar, +y lo hace porque la métrica lo exige, está experimentando las condiciones +estructurales para el daño moral. + +### 8.5 Indefensión aprendida y fatalismo métrico + +La indefensión aprendida de Seligman [14, 15] describe cómo la exposición +a resultados negativos incontrolables conduce a la pasividad. La secuencia: + +1. La métrica es defectuosa (demostración comprendida). +2. Abogar por el cambio. +3. Rechazado ("los números son buenos, no causes problemas"). +4. Repetir con convicción decreciente. +5. Estado terminal: "La métrica es lo que es. Solo cerraré tickets." + +Esto no es pereza. Es la respuesta racional a un sistema que castiga el +comportamiento correcto y recompensa el comportamiento incorrecto, cuando +el individuo carece de poder para cambiar el sistema. + +### 8.6 La espiral de selección adversa + +Combinando el equilibrio de la Sección 7 con la dinámica de rotación: + +1. La organización adopta la media no ponderada. La métrica se ve bien (SPT). +2. Los miembros del equipo conscientes y competentes experimentan costes + psicológicos (8.2–8.5). +3. Esos miembros se van. Son reemplazados por miembros que no comprenden + los defectos de la métrica o a quienes no les importa. +4. La métrica sigue viéndose bien — siempre lo hace bajo SPT, + independientemente de la competencia del equipo (Corolario 6.1). +5. La calidad real del servicio se degrada, pero la métrica no puede + detectarlo (Corolario 9.1). +6. Volver al paso 1. + +La métrica selecciona *en contra* de las personas que mejorarían el sistema +y *a favor* de las personas que no lo cuestionarán. El sistema se estabiliza +en un nivel inferior de competencia, invisible para su propio aparato de +medición. + +### 8.7 El modelo de coste completo + +| Sección 7 (visible) | Sección 8 (oculto) | +|---------------------|---------------------| +| Cliente satisfecho (buen número) | Equipo insatisfecho (mala realidad) | +| Rendimiento sin cambios | Esfuerzo discrecional retirado | +| La métrica mejora | Los miembros competentes se van | +| Economía de negocio estable | La competencia institucional se degrada | + +Estos operan en escalas temporales diferentes: el equilibrio es visible +trimestralmente; la degradación de competencia es visible a lo largo de +años. El modelo completo es: **la métrica funciona, y es destructiva, y la +destrucción es invisible para la métrica.** La métrica es pintura fresca +sobre acero corrugado corroído. + +--- + +## 9. Internalización por parte del gerente: la solución accionable + +Las Secciones 2–6 dicen rechazar la métrica. La Sección 7 dice que la +métrica funciona (para el negocio). La Sección 8 dice que destruye al +equipo. En la práctica, la mayoría de los gerentes no pueden cambiar +unilateralmente la métrica. La mejor solución es la reforma métrica a nivel +de toda la empresa. La solución *accionable* es lo que un solo gerente +informado puede hacer ahora mismo. + +### 9.1 La estrategia + +Un gerente que comprende la demostración puede **internalizar las +limitaciones de la métrica sin propagarlas al equipo**: + +1. **Planificar principalmente por prioridad.** El equipo trabaja primero + las tareas críticas. +2. **Intercalar tácticamente tareas pequeñas.** Cuando una tarea pequeña + de baja prioridad puede completarse sin retrasar materialmente el trabajo + de alta prioridad, hacerla. No porque la métrica lo exija, sino porque + también necesita hacerse y cuesta casi nada. +3. **Nunca revelar la métrica como la motivación.** "Despacha esta rápida + mientras esperamos la llamada del proveedor por el P1" — no "necesitamos + bajar nuestro promedio." La motivación intrínseca del equipo permanece + intacta (Sección 8). El gerente absorbe la carga de gestión de la + métrica. + +### 9.2 Formalización + +El problema del gerente es una optimización restringida: + +$$\min_{\sigma} \sum_{i=1}^{n} w(q_i) \cdot C_i \quad \text{subject to} \quad \bar{C}(\sigma) \le \bar{C}_{\text{target}}$$ + +**Teorema 12 (Coste métrico acotado de la planificación por prioridad).** Un +gerente que usa SPT *dentro* de cada clase de prioridad y ordenamiento por +prioridad *entre* clases producirá una métrica cercana al valor SPT-óptimo — +la brecha surge únicamente de las inversiones entre clases. + +**Bosquejo de demostración.** Dentro de cada clase de prioridad, SPT es +gratuito (todas las tareas tienen igual prioridad). La única desviación del +SPT global es el ordenamiento entre clases. Cada inversión entre clases +cuesta a lo sumo $p_{\text{large}} - p_{\text{small}}$ en la suma no +ponderada, y estas inversiones están acotadas por el número de clases. En la +práctica, la brecha está típicamente dentro del 10–20% del óptimo SPT. +$\blacksquare$ + +### 9.3 El gerente como barrera de información + +| Capa | Ve la métrica | Ve las prioridades | Ve la demostración | +|-------|-----------|----------------|------------| +| Organización | Sí | Nominalmente | No | +| Gerente | Sí | Sí | **Sí** | +| Equipo | No (protegido) | Sí | Irrelevante | +| Cliente | Sí (panel de control) | Vía SLA | No | + +El gerente es el único actor que posee las tres piezas de información. Esto +no es manipulación — están haciendo el trabajo correcto en el orden correcto, +y la métrica resulta ser aceptable porque el SPT dentro de cada clase es +gratuito. + +### 9.4 El colapso competitivo + +Esta estrategia falla cuando la métrica se convierte en **competitiva entre +equipos**. + +**Caso 1: Cooperativo** — Los equipos se miden por paridad, no por +clasificación. Cada gerente usa independientemente la estrategia de +internalización. La métrica es decorativa pero inofensiva. Este es un +**juego de coordinación** con un equilibrio cooperativo estable. + +**Caso 2: Competitivo** — Los equipos se clasifican por $\bar{C}$. Este es +un **dilema del prisionero**: + +| | Equipo B: prioridad primero | Equipo B: SPT | +|---|---|---| +| **Equipo A: prioridad primero** | (Buen trabajo, Buen trabajo) | (A se ve mal, B se ve bien) | +| **Equipo A: SPT** | (A se ve bien, B se ve mal) | (Ambos se ven bien, ambos hacen mal trabajo) | + +El equilibrio de Nash es (SPT, SPT). La estrategia de internalización es un +equilibrio cooperativo que **no es estable bajo competencia**. + +### 9.5 Alcance + +| Condición | Viabilidad | +|-----------|-----------| +| Métrica usada para verificación de salud / paridad | **Viable** | +| Métrica visible pero no clasificada | **Viable** | +| Métrica clasificada entre equipos | **Frágil** — requiere que todos los gerentes cooperen | +| Métrica vinculada a compensación / recursos | **No viable** — el dilema del prisionero domina | +| Reforma métrica posible a nivel organizacional | **Innecesaria** — corregir la métrica en su lugar | + +**La mejor solución es a nivel de toda la empresa. La solución accionable +es un gerente que comprende esta demostración, protege a su equipo de la +métrica, planifica por prioridad, y usa SPT solo dentro de las clases de +prioridad para mantener el número en un rango razonable.** + +--- + +# Parte IV: Evaluación + +## 10. Abogado del diablo + +La honestidad intelectual exige reconocer dónde tiene límites el argumento. + +### 10.1 La simplicidad tiene valor real + +**Argumento.** La media no ponderada no requiere pesos de prioridad, ni +estimaciones de tamaño de tarea, ni calibración. + +**Evaluación: Verdadero.** Pero la métrica no ponderada no evita supuestos — +los *oculta* al establecer implícitamente todos los pesos en 1 y todos los +tamaños en 1. Una estimación de tamaño de tarea conocidamente imprecisa es +aún más informativa que el supuesto implícito de que todos los tamaños son +iguales. + +### 10.2 Minimizar el número de personas esperando + +**Argumento.** SPT minimiza el total de horas-persona de espera. Si cada +tarea representa un cliente, esto es óptimo. + +**Evaluación: Matemáticamente correcto.** Si se opera una oficina de +atención y el tiempo de cada persona es igualmente valioso, SPT es la +política correcta. Falla cuando las tareas no tienen correspondencia 1:1 +con los clientes, el coste de espera no es uniforme, o la métrica se usa +para evaluar equipos en lugar de atender una cola literal. + +### 10.3 SPT como heurística de triaje + +**Argumento.** Cuando los tamaños de tarea se agrupan estrechamente, SPT +aproxima FIFO y la media no ponderada aproxima la media ponderada. + +**Evaluación: Correcto.** El coeficiente de variación $CV = \sigma_p / \bar{p}$ determina la gravedad de la distorsión: + +| $CV$ | Distribución de tamaños | Distorsión | +|------|----------------------|------------| +| < 0.3 | Estrecha (centro de llamadas) | Despreciable | +| 0.3 – 1.0 | Moderada (TI mixta) | Moderada | +| > 1.0 | Amplia (cola típica de TI) | Severa | + +Una mesa de servicio de TI típica abarca de 15 minutos a más de 40 horas +($CV > 2$). La distorsión no es un caso marginal — es el caso por defecto. + +### 10.4 La manipulación requiere malicia + +**Argumento.** Los teoremas muestran que la métrica *puede* ser manipulada, +no que *será* manipulada. + +**Evaluación: Este es el contraargumento más fuerte.** Si la métrica es +puramente informacional y nunca influye en el comportamiento, el incentivo +de manipulación está ausente. Sin embargo, cualquier métrica reportada a la +gerencia, vinculada a OKRs, o discutida en retrospectivas influirá en el +comportamiento. Esta es la Ley de Goodhart [6, 7] — y se aplica a equipos +bienintencionados con la misma fiabilidad que a los cínicos. La deriva +ocurre orgánicamente: completar tres tickets fáciles "se siente productivo" +mientras la métrica valida la sensación. + +### 10.5 Cuándo la media no ponderada es defendible + +La métrica es defendible **solo cuando se cumplen las cuatro condiciones**: + +1. Los tamaños de tarea son aproximadamente uniformes ($CV < 0.3$) +2. No hay diferenciación de prioridad (todas las tareas igualmente importantes) +3. Cada tarea representa exactamente un cliente +4. La métrica no se usa para evaluar, recompensar ni dirigir el comportamiento + +Estas condiciones rara vez se cumplen en los sistemas donde la métrica se +utiliza con mayor frecuencia. + +--- + +## 11. Trabajo relacionado + +Este artículo se sitúa en la intersección de varias literaturas que no habían +sido conectadas previamente. + +### 11.1 Teoría de planificación y equidad + +Smith [1] estableció el resultado de optimalidad de SPT y la regla WSJF en +1956. Conway, Maxwell y Miller [2] proporcionaron el tratamiento de libro de +texto exhaustivo. La equidad de las políticas de planificación basadas en +tamaño ha sido debatida en la planificación de sistemas informáticos: Bansal +y Harchol-Balter [22] investigaron la injusticia de SRPT; Wierman y +Harchol-Balter [23] formalizaron clasificaciones de equidad contra +Processor-Sharing; Angel, Bampis y Pascual [21] midieron la calidad de los +calendarios SPT contra criterios de optimalidad justa. + +Este trabajo previo analiza la equidad en la planificación de CPUs y +servidores. El presente artículo aplica los mismos resultados matemáticos a +la *gestión organizacional de tareas*, donde el "planificador" es un equipo +humano, los "trabajos" son solicitudes de clientes con prioridades de impacto +de negocio, y la "función objetivo" es una métrica de gestión. El mecanismo +es idéntico; las consecuencias difieren porque la planificación organizacional +tiene sistemas de prioridades, relaciones con clientes y costes psicológicos +que la planificación de CPUs no tiene. + +### 11.2 Disfunción de la medición + +Austin [18] demostró que la medición incompleta — medir solo un subconjunto +de las dimensiones relevantes — crea incentivos para optimizar las +dimensiones medidas a expensas de las no medidas, y que este efecto no es +meramente posible sino *inevitable* cuando la medición está vinculada a +recompensas. Su enfoque de asimetría de información es estrechamente paralelo +a la Sección 7. El presente artículo proporciona el mecanismo matemático +específico (Teoremas 1–2) para el caso de la planificación de tareas, y +extiende el argumento a través de la psicología (Sección 8) para trazar la +cadena completa de daño organizacional. + +Muller [19] documentó la "fijación métrica" en educación, salud, policía y +finanzas, proporcionando evidencia empírica extensa para los patrones +teorizados en la Sección 7.4. Campbell [24] formalizó el efecto corruptor de +usar indicadores como objetivos, complementando la observación original de +Goodhart [6] y la generalización de Strathern [7]. + +Bevan y Hood [26] documentaron empíricamente los comportamientos de +manipulación en el sistema público de salud inglés — incluyendo los patrones +exactos de "cumplir el objetivo y perder el sentido" descritos en nuestra +Sección 5.2. + +### 11.3 Costes psicológicos de la disfunción métrica + +La aplicación del daño moral (Shay [16], Litz et al. [17]) a entornos +empresariales tiene precedente reciente: un estudio de 2024 en el *Journal +of Business Ethics* [25] extendió explícitamente el constructo a lugares de +trabajo con fines de lucro, encontrando condiciones estructurales similares +a las descritas en la Sección 8.4. Moore [27] analizó el *desvinculamiento* +moral — la reestructuración cognitiva que posibilita el comportamiento poco +ético bajo presión organizacional. El presente artículo aborda el fenómeno +complementario: el daño a los individuos que *se niegan* a desvincularse. + +### 11.4 Qué es novedoso + +Los componentes individuales — la optimalidad de SPT, la Ley de Goodhart, la +disfunción de la medición, el daño moral — todos tienen precedentes. Las +contribuciones de este artículo son: + +1. **La ley de conservación (Teorema 2) utilizada de forma prescriptiva** — + como un argumento constructivo de que el tiempo de finalización ponderado + por trabajo *no puede* ser manipulado, en lugar de como un resultado + teórico de planificación. + +2. **La demostración específica de que las clases de prioridad hacen que la + métrica sea algebraicamente adversarial** (Teoremas 8–9) — no meramente + empíricamente mala sino estructuralmente contradictoria, con cero + información mutua entre el calendario y el sistema de prioridades. + +3. **La cadena integrada** desde la demostración matemática, pasando por la + asimetría de información, el daño psicológico y la espiral de selección + adversa — trazando una única métrica desde Smith (1956) hasta el vaciamiento + organizacional. + +4. **La estrategia de internalización del gerente** (Sección 9) con un + análisis formal de teoría de juegos de su estabilidad y condiciones de + colapso bajo competencia entre equipos. + +5. **La aplicación de la teoría de planificación a la crítica de la gestión + organizacional** — demostrando que una métrica de equipo comúnmente + utilizada tiene patologías específicas y cuantificables, en lugar de + argumentar desde la anécdota o el principio general. + +--- + +## 12. Conclusión + +El tiempo medio de finalización no ponderado es un **estadístico sesgado** +que: + +1. **Puede ser manipulado** mediante la política de planificación (Teorema 1), + a diferencia del tiempo de finalización ponderado por trabajo que es + invariante respecto al calendario (Teorema 2). +2. **Incentiva la inanición** de tareas grandes (Teorema 3). +3. **Degrada la satisfacción del cliente** sin ganancia compensatoria de + productividad (Teorema 7). +4. **Contradice activamente los sistemas de prioridad** al no contener + información alguna sobre la clasificación de impacto de negocio + (Teorema 9). +5. **Ignora la prioridad por completo** en su recomendación de planificación, + produciendo un retraso ponderado por prioridad subóptimo siempre que la + prioridad y el tamaño no estén perfectamente inversamente correlacionados + (Teorema 10). + +Una métrica que puede mejorarse reordenando el trabajo — sin realizar ningún +trabajo adicional — está midiendo la política de planificación, no la +capacidad del sistema. Cuando se combina con un sistema de prioridades, +recomienda el calendario que inflige el mayor daño al trabajo de más alta +prioridad. + +Cuando la métrica se reporta a los clientes, crea una asimetría de +información (Sección 7) cuyo equilibrio de negocio es rentable pero frágil. +Cuando los miembros del equipo comprenden sus defectos, viola su motivación +intrínseca y selecciona la partida de las personas más competentes +(Sección 8). Un solo gerente informado puede mitigar parcialmente estos +efectos mediante optimización restringida (Sección 9), pero esta estrategia +cooperativa no es estable bajo competencia entre equipos. + +La media no ponderada es defendible solo bajo condiciones estrechas +(Sección 10.5): tamaños de tarea uniformes, sin prioridades, correspondencia +uno a uno entre cliente y tarea, y sin influencia conductual. Estas +condiciones rara vez se cumplen. + +**El tiempo medio de finalización no ponderado no es una medida justa ni +precisa del rendimiento en la ejecución de tareas. Su adopción como métrica +de equipo producirá racionalmente inanición de trabajo complejo, violación +de prioridades declaradas, resultados inequitativos para los clientes, y la +ilusión de productividad donde no existe ninguna.** + +La mejor solución es la reforma métrica organizacional. La solución +accionable es un gerente que comprende esta demostración. + +--- + +## Referencias + +### Scheduling Theory + +[1] Smith, W. E. (1956). Various optimizers for single-stage production. +*Naval Research Logistics Quarterly*, 3(1–2), 59–66. +doi:[10.1002/nav.3800030106](https://doi.org/10.1002/nav.3800030106) + +> Origen del resultado de optimalidad de SPT (Teorema 1), la regla de tiempo +> de finalización ponderado $w_i/p_i$ descendente (WSJF, Teorema 11), y la +> técnica de demostración por intercambio de pares adyacentes (argumento de +> intercambio) utilizada a lo largo del artículo. + +[2] Conway, R. W., Maxwell, W. L., & Miller, L. W. (1967). *Theory of +Scheduling*. Addison-Wesley. + +> Tratamiento de libro de texto estándar de la teoría de planificación de +> máquina única, extendiendo los resultados de Smith. + +[3] Little, J. D. C. (1961). A proof for the queuing formula: L = λW. +*Operations Research*, 9(3), 383–387. +doi:[10.1287/opre.9.3.383](https://doi.org/10.1287/opre.9.3.383) + +> Primera demostración rigurosa de la Ley de Little. Referenciada en la +> Sección 3.2 para el contexto de la teoría de colas. + +[4] Little, J. D. C. (2011). Little's Law as viewed on its 50th +anniversary. *Operations Research*, 59(3), 536–549. +doi:[10.1287/opre.1110.0941](https://doi.org/10.1287/opre.1110.0941) + +> Retrospectiva que discute el alcance, las limitaciones y las aplicaciones +> erróneas comunes. + +[5] Reinertsen, D. G. (2009). *The Principles of Product Development +Flow: Second Generation Lean Product Development*. Celeritas Publishing. +ISBN: 978-0-9844512-0-8. + +> Popularizó WSJF y "Coste de Retraso / Duración" en contextos ágiles/lean. +> La base matemática es Smith (1956) [1]. + +### Measurement and Incentives + +[6] Goodhart, C. A. E. (1984). Problems of monetary management: The U.K. +experience. In *Monetary Theory and Practice* (pp. 91–121). Macmillan. + +> Fuente de la Ley de Goodhart: "Toda regularidad estadística observada +> tenderá a colapsar una vez que se ejerza presión sobre ella con fines de +> control." + +[7] Strathern, M. (1997). 'Improving ratings': Audit in the British +university system. *European Review*, 5(3), 305–321. +doi:[10.1002/(SICI)1234-981X(199707)5:3<305::AID-EURO184>3.0.CO;2-4](https://doi.org/10.1002/(SICI)1234-981X(199707)5:3%3C305::AID-EURO184%3E3.0.CO;2-4) + +> Generalizó la Ley de Goodhart: "Cuando una medida se convierte en un +> objetivo, deja de ser una buena medida." + +### Behavioral Economics + +[8] Kahneman, D., & Tversky, A. (1979). Prospect theory: An analysis of +decision under risk. *Econometrica*, 47(2), 263–292. +doi:[10.2307/1914185](https://doi.org/10.2307/1914185) + +> Estableció la aversión a la pérdida. Referenciada en la Sección 4.5. + +### Game Theory and Contract Theory + +[9] Akerlof, G. A. (1970). The market for "lemons": Quality uncertainty +and the market mechanism. *The Quarterly Journal of Economics*, 84(3), +488–500. doi:[10.2307/1879431](https://doi.org/10.2307/1879431) + +> Asimetría de información y selección adversa. El equilibrio agrupador de +> la Sección 7.5 es estructuralmente análogo. + +[10] Hölmstrom, B. (1979). Moral hazard and observability. *The Bell +Journal of Economics*, 10(1), 74–91. +doi:[10.2307/3003320](https://doi.org/10.2307/3003320) + +> Tratamiento formal del riesgo moral. El escenario de reporte de métricas +> de la Sección 7.5 es un problema de riesgo moral. + +### Psychology + +[11] Festinger, L. (1957). *A Theory of Cognitive Dissonance*. Stanford +University Press. ISBN: 978-0-8047-0131-0. + +> Teoría fundacional. Referenciada en la Sección 8.2. + +[12] Deci, E. L., & Ryan, R. M. (1985). *Intrinsic Motivation and +Self-Determination in Human Behavior*. Plenum Press. +ISBN: 978-0-306-42022-1. + +> Tratamiento original de la Teoría de la Autodeterminación. Referenciada +> en la Sección 8.3. + +[13] Ryan, R. M., & Deci, E. L. (2000). Self-determination theory and +the facilitation of intrinsic motivation, social development, and +well-being. *American Psychologist*, 55(1), 68–78. +doi:[10.1037/0003-066X.55.1.68](https://doi.org/10.1037/0003-066X.55.1.68) + +> Resumen de la Teoría de la Autodeterminación que vincula la satisfacción +> de necesidades con la motivación intrínseca y el bienestar. + +[14] Seligman, M. E. P., & Maier, S. F. (1967). Failure to escape +traumatic shock. *Journal of Experimental Psychology*, 74(1), 1–9. +doi:[10.1037/h0024514](https://doi.org/10.1037/h0024514) + +> Demostración original de la indefensión aprendida. Referenciada en la +> Sección 8.5. + +[15] Seligman, M. E. P. (1975). *Helplessness: On Depression, +Development, and Death*. W. H. Freeman. ISBN: 978-0-7167-0752-3. + +> Tratamiento extendido que conecta la indefensión aprendida con la +> depresión humana y el comportamiento institucional. + +[16] Shay, J. (1994). *Achilles in Vietnam: Combat Trauma and the Undoing +of Character*. Atheneum / Simon & Schuster. ISBN: 978-0-689-12182-3. + +> Introdujo el concepto de daño moral. Referenciado en la Sección 8.4. + +[17] Litz, B. T., Stein, N., Delaney, E., Lebowitz, L., Nash, W. P., +Silva, C., & Maguen, S. (2009). Moral injury and moral repair in war +veterans: A preliminary model and intervention strategy. *Clinical +Psychology Review*, 29(8), 695–706. +doi:[10.1016/j.cpr.2009.07.003](https://doi.org/10.1016/j.cpr.2009.07.003) + +> Formalizó el daño moral como constructo clínico. Definición citada en la +> Sección 8.4. + +### Organizational Measurement + +[18] Austin, R. D. (1996). *Measuring and Managing Performance in +Organizations*. Dorset House. ISBN: 978-0-932633-36-1. + +> Demostró que la medición incompleta crea inevitablemente incentivos para +> optimizar las dimensiones medidas a expensas de las no medidas. El enfoque +> de asimetría de información es estrechamente paralelo a la Sección 7. El +> predecesor más importante del argumento de este artículo. + +[19] Muller, J. Z. (2018). *The Tyranny of Metrics*. Princeton University +Press. ISBN: 978-0-691-17495-2. + +> Tratamiento exhaustivo de la "fijación métrica" en educación, salud, +> policía y finanzas. Evidencia empírica extensa para los patrones +> teorizados en la Sección 7.4. + +### Scheduling Fairness + +[20] Coffman, E. G., Shanthikumar, J. G., & Yao, D. D. (1992). +Multiclass queueing systems: Polymatroid structure and optimal scheduling +control. *Operations Research*, 40(S2), S293–S299. + +> Leyes de conservación en planificación. La invariancia respecto al +> calendario del tiempo de finalización ponderado por trabajo (Teorema 2) +> es un caso de estas leyes de conservación. + +[21] Angel, E., Bampis, E., & Pascual, F. (2008). How good are SPT +schedules for fair optimality criteria? *Annals of Operations Research*, +159(1), 53–64. doi:[10.1007/s10479-007-0267-0](https://doi.org/10.1007/s10479-007-0267-0) + +> Mide directamente la calidad de los calendarios SPT contra criterios de +> equidad. El predecesor más cercano en la teoría de planificación al +> análisis de equidad de la Sección 4. + +[22] Bansal, N., & Harchol-Balter, M. (2001). Analysis of SRPT +scheduling: Investigating unfairness. *ACM SIGMETRICS Performance +Evaluation Review*, 29(1), 279–290. +doi:[10.1145/384268.378792](https://doi.org/10.1145/384268.378792) + +> Investiga la creencia de que SRPT penaliza injustamente a los trabajos +> grandes en la planificación informática. Argumenta que la injusticia es +> menor de lo que se creía pero reconoce la tensión fundamental. + +[23] Wierman, A., & Harchol-Balter, M. (2003). Classifying scheduling +policies with respect to unfairness in an M/GI/1. *ACM SIGMETRICS +Performance Evaluation Review*, 31(1), 238–249. + +> Formaliza las definiciones de equidad para políticas de planificación +> mediante comparación con Processor-Sharing. + +### Additional References + +[24] Campbell, D. T. (1979). Assessing the impact of planned social +change. *Evaluation and Program Planning*, 2(1), 67–90. +doi:[10.1016/0149-7189(79)90048-X](https://doi.org/10.1016/0149-7189(79)90048-X) + +> Ley de Campbell: "Cuanto más se utilice cualquier indicador social +> cuantitativo para la toma de decisiones sociales, más sujeto estará a +> presiones de corrupción y más propenso será a distorsionar y corromper +> los procesos sociales que pretende monitorear." Complementa la Ley de +> Goodhart [6]. + +[25] Ferreira, C. M., et al. (2024). It's business: A qualitative study +of moral injury in business settings. *Journal of Business Ethics*. +doi:[10.1007/s10551-024-05615-0](https://doi.org/10.1007/s10551-024-05615-0) + +> Extiende el daño moral a lugares de trabajo con fines de lucro. Valida la +> aplicación de la Sección 8.4 de Shay/Litz más allá de entornos militares +> y de salud. + +[26] Bevan, G., & Hood, C. (2006). What's measured is what matters: +Targets and gaming in the English public health care system. *Public +Administration*, 84(3), 517–538. +doi:[10.1111/j.1467-9299.2006.00600.x](https://doi.org/10.1111/j.1467-9299.2006.00600.x) + +> Documenta empíricamente los comportamientos de manipulación, incluyendo +> "cumplir el objetivo y perder el sentido." Proporciona evidencia del mundo +> real para la contradicción métrica-prioridad de la Sección 5.2. + +[27] Moore, C. (2012). Why employees do bad things: Moral disengagement +and unethical organizational behavior. *Personnel Psychology*, 65(1), +1–48. doi:[10.1111/j.1744-6570.2011.01237.x](https://doi.org/10.1111/j.1744-6570.2011.01237.x) + +> Analiza el *desvinculamiento* moral — la reestructuración cognitiva que +> posibilita el comportamiento poco ético. La Sección 8 aborda el fenómeno +> complementario: el daño a los individuos que *se niegan* a desvincularse. + +--- + +*Esta demostración fue desarrollada de forma conversacional y formalizada el 28-03-2026.* diff --git a/README.fr.md b/README.fr.md new file mode 100644 index 0000000..1657f20 --- /dev/null +++ b/README.fr.md @@ -0,0 +1,1360 @@ +# Le temps moyen non pondéré d'achèvement des tâches n'est pas une mesure équitable pour l'ordonnancement des tâches + +Une preuve mathématique que le temps moyen non pondéré d'achèvement des +tâches est une statistique biaisée qui incite à privilégier les travaux +faciles, et que tout avantage d'ordonnancement qu'elle semble révéler est +un artefact de la mesure — et non le reflet d'un véritable gain de débit +ou de qualité de service. + +--- + +## 1. Introduction + +De nombreuses organisations mesurent la performance d'exécution des tâches +par le **temps moyen non pondéré d'achèvement** : le nombre moyen d'heures +(ou de jours) entre la soumission et la résolution d'une tâche, chaque +tâche comptant de manière égale indépendamment de sa taille ou de sa +priorité. + +Cet article démontre que cette mesure n'est pas simplement imprécise, mais +structurellement biaisée. Elle peut être améliorée en réordonnant le travail +sans effectuer aucun travail supplémentaire (Théorème 1), tandis qu'une +alternative correctement pondérée est totalement immunisée contre toute +manipulation d'ordonnancement (Théorème 2). Combinée à un système de +priorités, la mesure contredit activement les propres classifications de +priorité de l'organisation (Théorème 9). + +L'argumentation se déroule en quatre parties : + +- **Partie I** (Sections 2–4) établit les fondements mathématiques : + la moyenne non pondérée est manipulable par l'ordonnancement SPT + (Shortest Processing Time), la moyenne pondérée par le travail est + invariante par rapport à l'ordonnancement, et les conséquences sur la + qualité de service qui en résultent sont prouvablement négatives. + +- **Partie II** (Sections 5–6) étend le modèle aux tâches classifiées + par priorité, démontre que la mesure devient antagoniste au système de + priorités, et propose des alternatives pondérées avec un exemple + détaillé de centre de services informatiques. + +- **Partie III** (Sections 7–9) examine les dynamiques organisationnelles : + ce qui se passe lorsque la mesure est communiquée aux clients (asymétrie + d'information), ce qui arrive aux membres de l'équipe qui en comprennent + les défauts (préjudice psychologique), et ce qu'un responsable informé + peut faire (optimisation sous contrainte avec analyse de stabilité en + théorie des jeux). + +- **Partie IV** (Sections 10–12) présente des contre-arguments honnêtes, + situe le travail dans la littérature existante et conclut. + +Les résultats fondamentaux s'appuient sur la théorie fondatrice de +l'ordonnancement de Smith (1956) [1], étendue par la théorie des jeux +[9, 10], la théorie de la mesure organisationnelle [18, 19] et la +psychologie [11–17] pour tracer une chaîne complète allant d'une preuve +mathématique sur une mesure spécifique aux conséquences organisationnelles. + +--- + +# Partie I : Fondements mathématiques + +## 2. Définitions + +Soit **n** tâches avec des temps de traitement $p_1, p_2, \ldots, p_n$. + +Un **ordonnancement** $\sigma$ est une permutation de $\{1, 2, \ldots, n\}$ +assignant les tâches à un ordre d'exécution sur un exécuteur unique. + +Le **temps d'achèvement** de la tâche $\sigma(k)$ sous l'ordonnancement +$\sigma$ est : + +$$C_{\sigma(k)} = \sum_{j=1}^{k} p_{\sigma(j)}$$ + +Le **temps moyen non pondéré d'achèvement** est : + +$$\bar{C}(\sigma) = \frac{1}{n} \sum_{k=1}^{n} C_{\sigma(k)}$$ + +Le **temps moyen d'achèvement pondéré par le travail** est : + +$$\bar{C}_w(\sigma) = \frac{\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)}}{\sum_{k=1}^{n} p_{\sigma(k)}}$$ + +--- + +## 3. Résultats fondamentaux + +### 3.1 La moyenne non pondérée est manipulable + +**Théorème 1** (Smith, 1956 [1])**.** L'ordonnancement qui minimise +$\bar{C}(\sigma)$ est le SPT (Shortest Processing Time first) : trier les +tâches de sorte que +$p_{\sigma(1)} \le p_{\sigma(2)} \le \cdots \le p_{\sigma(n)}$. + +**Preuve (argument d'échange [1, 2]).** + +Considérons un ordonnancement $\sigma$ dans lequel deux tâches adjacentes +$i, j$ satisfont $p_i > p_j$, la tâche $i$ étant ordonnancée immédiatement +avant la tâche $j$. Soit $t$ le temps de début de la tâche $i$. + +| | La tâche $i$ se termine | La tâche $j$ se termine | Somme | +|---|---|---|---| +| **Avant permutation** ($i$ puis $j$) | $t + p_i$ | $t + p_i + p_j$ | $2t + 2p_i + p_j$ | +| **Après permutation** ($j$ puis $i$) | $t + p_j$ | $t + p_j + p_i$ | $2t + p_i + 2p_j$ | + +La variation de la somme des temps d'achèvement est : + +$$(2p_i + p_j) - (p_i + 2p_j) = p_i - p_j > 0$$ + +Chaque permutation d'une paire adjacente plus-long-avant-plus-court réduit +strictement le total. Tout ordonnancement non-SPT contient une telle paire. +Les permutations répétées convergent vers le SPT. Par conséquent, le SPT +minimise de manière unique $\bar{C}(\sigma)$. $\blacksquare$ + +### 3.2 La moyenne pondérée par le travail est invariante par rapport à l'ordonnancement + +**Théorème 2.** Le temps moyen d'achèvement pondéré par le travail +$\bar{C}_w(\sigma)$ est identique pour tout ordonnancement $\sigma$. + +**Preuve.** + +Développons le numérateur : + +$$\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)} = \sum_{k=1}^{n} p_{\sigma(k)} \sum_{j=1}^{k} p_{\sigma(j)}$$ + +Réindexons en posant $a = \sigma(k)$ et $b = \sigma(j)$. La double somme +compte chaque paire ordonnée $(a, b)$ où $b$ est ordonnancé au plus tard +en même temps que $a$ : + +$$= \sum_{\substack{a, b \\ b \preceq_\sigma a}} p_a \, p_b$$ + +Pour toute paire $(a, b)$ avec $a \ne b$, exactement l'une des relations +$\{b \preceq_\sigma a\}$ ou $\{a \prec_\sigma b\}$ est vérifiée. Les +termes diagonaux ($a = b$) contribuent $p_a^2$ indépendamment de l'ordre. +Par conséquent : + +$$\sum_{\substack{a, b \\ b \preceq_\sigma a}} p_a \, p_b = \sum_{a} p_a^2 + \sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b$$ + +Avec la somme complémentaire, les deux sommes hors-diagonale couvrent +toutes les paires non ordonnées : + +$$\sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b + \sum_{\substack{a \ne b \\ a \prec_\sigma b}} p_a \, p_b = \sum_{a \ne b} p_a \, p_b$$ + +Le membre de droite est indépendant de l'ordonnancement. Par symétrie de +$p_a p_b$, les deux sommes hors-diagonale sont égales : + +$$\sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b = \frac{1}{2} \sum_{a \ne b} p_a \, p_b$$ + +Par conséquent : + +$$\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)} = \sum_a p_a^2 + \frac{1}{2} \sum_{a \ne b} p_a \, p_b = \frac{1}{2}\left(\sum_a p_a\right)^2 + \frac{1}{2}\sum_a p_a^2$$ + +Cette expression ne contient aucune référence à $\sigma$. Comme le +dénominateur $\sum p_a$ est également indépendant de l'ordonnancement : + +$$\bar{C}_w(\sigma) = \frac{\frac{1}{2}\left(\sum p_a\right)^2 + \frac{1}{2}\sum p_a^2}{\sum p_a}$$ + +est **constant pour tous les ordonnancements**. $\blacksquare$ + +Il s'agit d'une instance des lois de conservation en ordonnancement +identifiées par Coffman, Shanthikumar et Yao [20]. L'invariance correspond +à la mesure du temps d'attente d'une unité de *travail* plutôt que du temps +d'attente d'une *tâche* — la statistique non pondérée compte les +achèvements plutôt que le travail, ce qui explique sa manipulabilité. (Voir +aussi Little [3, 4] pour le contexte en théorie des files d'attente, avec +la réserve que la loi de Little s'applique directement uniquement aux +systèmes en régime permanent, et non au cas par lots analysé ici.) + +### 3.3 Exemple illustratif + +Deux tâches : $A$ avec $p_A = 1$ heure, $B$ avec $p_B = 10$ heures. + +| Ordonnancement | $C_A$ | $C_B$ | Moyenne non pondérée | Moyenne pondérée par le travail | +|----------|-------|-------|-----------------|-------------------| +| SPT (A en premier) | 1 | 11 | 6.0 | 111/11 ≈ 10.09 | +| Inverse (B en premier) | 11 | 10 | 10.5 | 111/11 ≈ 10.09 | + +Le SPT semble **4,5 heures meilleur** selon la mesure non pondérée mais +apporte **zéro amélioration** selon la mesure pondérée par le travail. +L'avantage apparent n'existe que parce que la statistique non pondérée +permet à une tâche d'1 heure de « voter » à égalité avec une tâche de +10 heures. + +--- + +## 4. Conséquences pour la qualité de service + +### 4.1 Famine des tâches volumineuses + +**Théorème 3 (Biais de la mesure).** Toute politique d'ordonnancement +qui minimise le temps moyen non pondéré d'achèvement maximise nécessairement +le temps d'achèvement de la tâche la plus volumineuse. + +**Preuve.** Le SPT place la tâche la plus volumineuse en dernier. Son +temps d'achèvement est égal au temps total de traitement $\sum p_i$, qui +est le temps d'achèvement maximal possible pour toute tâche individuelle. +Sous tout ordonnancement qui ne place pas la tâche la plus volumineuse en +dernier, cette tâche s'achève strictement plus tôt. $\blacksquare$ + +Cela crée une **incitation à la famine** : les agents rationnels optimisant +la statistique non pondérée reporteront indéfiniment les tâches volumineuses +au profit des petites. Austin [18] a identifié ce schéma général — selon +lequel une mesure incomplète crée des incitations à optimiser la dimension +mesurée au détriment des dimensions non mesurées — dans le contexte de la +gestion de la performance organisationnelle. Le Théorème 3 fournit le +mécanisme spécifique pour l'ordonnancement des tâches. + +### 4.2 Temps d'achèvement maximal pour la tâche la plus volumineuse + +**Théorème 4 (Le SPT maximise de manière unique le temps d'achèvement +de la tâche la plus volumineuse).** Parmi tous les ordonnancements, le SPT +est l'unique politique qui attribue le temps d'achèvement maximal possible +($\sum p_i$) à la tâche la plus volumineuse. + +**Preuve.** Le SPT trie les tâches par ordre croissant de $p_i$, plaçant +la tâche la plus volumineuse $p_{\max}$ en dernière position. La dernière +tâche de tout ordonnancement a un temps d'achèvement de +$\sum_{i=1}^{n} p_i$, qui est le maximum qu'une tâche individuelle puisse +recevoir. Sous tout ordonnancement qui ne place pas $p_{\max}$ en dernier, +elle s'achève strictement avant $\sum p_i$. $\blacksquare$ + +**Corollaire 4.1.** Une équipe optimisant le temps moyen non pondéré +d'achèvement offrira systématiquement la pire expérience aux clients ayant +les besoins les plus complexes. Ce n'est pas un effet secondaire — c'est +le *mécanisme* par lequel la mesure s'améliore. + +**Note sur les ratios de ralentissement.** Le SPT *compresse* en réalité +les ratios de ralentissement ($S_i = C_i / p_i$) car les tâches plus +volumineuses en positions ultérieures ont de grands dénominateurs qui +absorbent la somme accumulée. Par exemple, avec les tâches $[1, 5, 10]$ : +le SPT donne des ralentissements de $[1, 1.2, 1.6]$ (faible variance) +tandis que le LPT donne $[1, 3, 16]$ (forte variance). Le préjudice du +SPT envers les clients à tâches volumineuses n'est pas visible dans le +ratio de ralentissement — il est visible dans le **temps d'achèvement +absolu**. Cette distinction est importante : la littérature sur l'équité +en ordonnancement [21, 22, 23] a débattu de l'inéquité du SPT/SRPT +principalement à travers des mesures fondées sur le ralentissement, ce qui +peut occulter la charge de délai absolu démontrée ci-dessous. + +### 4.3 Concentration du délai + +**Théorème 5 (Le SPT concentre le délai sur la tâche la plus volumineuse).** +Sous le SPT, la tâche la plus volumineuse supporte plus de délai absolu que +sous tout autre ordonnancement. + +**Preuve.** Définissons le délai absolu comme $\Delta_i = C_i - p_i$ +(temps passé en attente, indépendant de la propre taille de la tâche). Sous +le SPT, la tâche la plus volumineuse est en position $n$ avec : + +$$\Delta_{\max\text{-task}}^{\text{SPT}} = C_n - p_n = \sum_{i=1}^{n-1} p_i$$ + +C'est la somme des temps de traitement de toutes les autres tâches — le +délai maximal possible pour une seule tâche. Sous tout ordonnancement où +la tâche la plus volumineuse n'est pas en dernier, son délai est strictement +inférieur. En revanche, le SPT attribue un délai nul à la plus petite tâche +($\Delta_1^{\text{SPT}} = 0$). L'intégralité de la charge d'attente est +transférée des petites tâches vers les tâches volumineuses. $\blacksquare$ + +Le SPT minimise le délai *total* (bénéfique pour l'efficacité globale) en +concentrant le délai sur les tâches les plus aptes à l'absorber en termes +de ratio de ralentissement. Mais en termes absolus — les heures passées à +attendre — la tâche la plus volumineuse supporte tout le poids. + +### 4.4 Invariance du débit + +**Théorème 6 (Invariance du débit).** Le travail total accompli sur tout +horizon temporel $T$ est identique sous toutes les politiques +d'ordonnancement. + +**Preuve.** L'exécuteur traite le travail à un rythme fixe. Sur tout +horizon $T \ge \sum p_i$, le travail total accompli est exactement +$\sum p_i$ quel que soit l'ordre. Pour le cas en régime permanent avec des +arrivées continues, le débit à long terme est déterminé par le taux de +service $\mu$ et est totalement indépendant de l'ordonnancement : + +$$\lim_{T \to \infty} \frac{W(T)}{T} = \mu \quad \text{pour tout ordonnancement } \sigma$$ + +$\blacksquare$ + +**Corollaire 6.1.** Une équipe qui passe de n'importe quelle politique +d'ordonnancement au SPT observera une amélioration du temps moyen non +pondéré d'achèvement avec **aucun changement du débit réel**. La mesure +s'améliore. La production ne change pas. + +### 4.5 L'effet composé + +En combinant les Théorèmes 4, 5 et 6 : + +| Mesure | Effet de l'optimisation de la moyenne non pondérée | +|---------|--------------------------------------| +| Débit (travail/temps) | Aucun changement (Théorème 6) | +| Délai pour les petites tâches | Minimisé — tend vers zéro (SPT) | +| Délai pour les tâches volumineuses | **Maximisé** — supporte toute la charge d'attente (Théorème 5) | +| Temps d'achèvement de la tâche la plus volumineuse | **Maximum possible** : $\sum p_i$ (Théorème 4) | + +L'effet net sur la qualité perçue est négatif car : + +1. **L'aversion à la perte est asymétrique** [8]. Un client dont la tâche + de 100 heures est dépriorisée subit un préjudice important et saillant. + Un client dont la tâche d'1 heure est accélérée bénéficie d'un avantage + faible, souvent imperceptible. + +2. **Les tâches à forte intensité de travail sont corrélées aux clients + à forte valeur.** Les tâches volumineuses proviennent de manière + disproportionnée de clients majeurs, de contrats complexes ou de besoins + métier critiques. + +3. **La famine se cumule.** Dans un système continu (Théorème 3), les + tâches volumineuses peuvent être **indéfiniment reportées** à mesure + que de nouvelles petites tâches arrivent. + +**Théorème 7 (Le résultat central).** Pour une équipe traitant des tâches +de taille non uniforme, l'adoption du temps moyen non pondéré d'achèvement +comme mesure de performance : + +(a) N'apporte **aucun gain de productivité** (Théorème 6), tout en +(b) **Attribuant le temps d'achèvement maximal possible** à la tâche la + plus volumineuse (Théorème 4), et +(c) **Concentrant tout le délai d'attente** sur les tâches les plus + volumineuses tout en éliminant le délai pour les plus petites + (Théorème 5). + +Il ne s'agit pas d'un compromis. La mesure crée un pur transfert de +qualité de service des clients à fort effort vers les clients à faible +effort, sans aucun gain net de travail. $\blacksquare$ + +--- + +# Partie II : Systèmes de priorités + +## 5. Défaillance en présence de classification par priorité + +Les sections précédentes ont démontré que le temps moyen non pondéré +d'achèvement est biaisé lorsque les tâches varient en taille. Nous montrons +maintenant que l'introduction d'un **système de priorités** — comme +l'utilisent pratiquement toutes les équipes réelles — fait passer la mesure +d'un simple biais à un comportement **activement antagoniste** envers les +objectifs déclarés de l'organisation. + +### 5.1 Modèle étendu : tâches avec priorité + +Soit chaque tâche $i$ ayant un temps de traitement $p_i$ et une classe de +priorité $q_i \in \{1, 2, 3, 4\}$ où 1 est la priorité la plus élevée +(critique) et 4 la plus basse (cosmétique/amélioration). Assignons des +poids de priorité : + +$$w(q) = \begin{cases} 8 & q = 1 \text{ (Critique)} \\ 4 & q = 2 \text{ (Élevée)} \\ 2 & q = 3 \text{ (Moyenne)} \\ 1 & q = 4 \text{ (Basse)} \end{cases}$$ + +Les poids spécifiques sont illustratifs ; les résultats sont valables pour +toute fonction de poids strictement décroissante. La propriété essentielle +est que la priorité est assignée selon l'**impact métier**, et non selon la +taille de la tâche. + +### 5.2 La mesure contredit le système de priorités + +**Théorème 8 (Inversion priorité-taille).** Lorsque la priorité est +indépendante de la taille de la tâche, l'ordonnancement qui minimise le +temps moyen non pondéré d'achèvement (SPT) achèvera, en espérance, les +tâches de basse priorité avant les tâches de haute priorité de plus grande +taille. + +**Preuve.** Le SPT ordonne les tâches par $p_i$ croissant, indépendamment +de $q_i$. Considérons deux tâches : + +- Tâche A : $p_A = 40$ heures, $q_A = 1$ (Critique — ex. : panne de + serveur) +- Tâche B : $p_B = 0.5$ heure, $q_B = 4$ (Basse — ex. : correction + cosmétique d'interface) + +Le SPT ordonnance B avant A. La moyenne non pondérée pour cette paire : + +$$\bar{C}^{\text{SPT}} = \frac{0.5 + 40.5}{2} = 20.5 \qquad \bar{C}^{\text{priority}} = \frac{40 + 40.5}{2} = 40.25$$ + +La mesure déclare le SPT presque **deux fois meilleur** — alors même qu'une +correction cosmétique est effectuée pendant qu'un serveur est en panne. + +En général, lorsque $q_i$ est statistiquement indépendant de $p_i$, +l'ordonnancement SPT a une **corrélation nulle** avec la priorité. En +pratique, les tâches critiques (pannes, incidents de sécurité, pertes de +données) nécessitent souvent plus de travail que les tâches basses, de +sorte que la mesure est plausiblement **anti-corrélée** avec le système de +priorités. $\blacksquare$ + +### 5.3 Destruction de l'information + +La moyenne non pondérée réduit une tâche tridimensionnelle +$(p_i, q_i, C_i)$ à un signal unidimensionnel ($C_i$), puis fait la +moyenne uniformément. Cela supprime entièrement la priorité et inverse +implicitement la taille. + +**Théorème 9 (Destruction de l'information).** Soit $I(\sigma)$ +l'information mutuelle entre le classement implicite de priorité de +l'ordonnancement (position) et l'assignation réelle de priorité $q_i$. +Pour le SPT : + +$$I(\sigma_{\text{SPT}}) = 0 \quad \text{lorsque } p_i \perp q_i$$ + +**Preuve.** Le SPT assigne les positions en se basant uniquement sur $p_i$. +Lorsque $p_i$ et $q_i$ sont indépendants, connaître la position d'une +tâche dans l'ordonnancement SPT n'apporte aucune information sur sa +priorité. $\blacksquare$ + +**Corollaire 9.1.** Une équipe qui optimise le temps moyen non pondéré +d'achèvement exploite un système d'ordonnancement qui ne contient aucune +information sur sa propre classification de priorité. Le champ de priorité +dans leur système de tickets est, vis-à-vis de l'ordre d'exécution, +purement décoratif. + +Il s'agit d'une instance de ce qu'Austin [18] appelle le problème +fondamental de la mesure incomplète : lorsque le système de mesure ne +capture qu'un sous-ensemble des dimensions pertinentes, l'optimisation de +la mesure dégrade systématiquement les dimensions non mesurées. + +### 5.4 Coût de délai pondéré par la priorité + +Définissons le **coût de délai pondéré par la priorité** d'un +ordonnancement : + +$$D(\sigma) = \sum_{i=1}^{n} w(q_i) \cdot C_i$$ + +**Théorème 10 (SPT et coût de délai pondéré par la priorité).** +L'ordonnancement optimal pour minimiser $D(\sigma)$ est le WSJF : ordonner +par $w(q_i)/p_i$ décroissant [1, 5]. L'ordonnancement SPT — par $1/p_i$ +décroissant — ignore entièrement la priorité et produit un $D$ plus élevé +que les alternatives respectant les priorités lorsque la priorité est +corrélée à la taille de la tâche. + +**Preuve.** Par l'argument d'échange, la permutation de tâches adjacentes +$i, j$ modifie $D$ de : + +$$\Delta D = w(q_j) \cdot p_i - w(q_i) \cdot p_j$$ + +La permutation améliore $D$ lorsque $w(q_j)/p_j > w(q_i)/p_i$ mais que +$j$ est ordonnancé après $i$. L'ordre optimal est donc $w(q_i)/p_i$ +décroissant — la règle WSJF. Le SPT correspond au WSJF uniquement lorsque +$w(q_i) = \text{const}$ (toutes les tâches ont une priorité égale). + +**Exemple.** Critique ($w = 8$, $p = 3$) et Basse ($w = 1$, $p = 2$) : + +- SPT (Basse en premier) : $D = 1 \cdot 2 + 8 \cdot 5 = 42$ +- WSJF (Critique en premier) : $D = 8 \cdot 3 + 1 \cdot 5 = 29$ + +Le SPT entraîne 45 % de coût de délai pondéré par la priorité en plus. En +pratique, les tâches critiques tendent à être plus volumineuses (pannes, +incidents de sécurité), rendant la divergence +systématique. $\blacksquare$ + +--- + +## 6. Solutions proposées + +### 6.1 Mesures pondérées par la priorité + +Remplacer le temps moyen non pondéré d'achèvement par le **Score +d'achèvement pondéré par la priorité (PWCS)** : + +$$\text{PWCS}(\sigma) = \frac{\sum_{i=1}^{n} w(q_i) \cdot \frac{C_i}{p_i}}{\sum_{i=1}^{n} w(q_i)}$$ + +Il s'agit du ratio moyen de ralentissement pondéré par la priorité. Il +mesure le temps d'attente de chaque tâche par rapport à sa taille, pondéré +par l'importance de cette tâche. Plus il est bas, mieux c'est. + +**Propriétés :** + +1. **Respecte les priorités.** Les retards sur les tâches critiques coûtent + 8 fois plus que les retards sur les tâches basses. +2. **Équitable en taille.** Utilise le ratio de ralentissement $C_i / p_i$, + de sorte que les tâches volumineuses ne sont pas pénalisées pour leur + taille. +3. **Non manipulable par le SPT.** Réordonner par temps de traitement + n'améliore pas systématiquement le score. +4. **Se réduit à la moyenne non pondérée lorsque les tâches sont + uniformes.** Une généralisation stricte. + +### 6.2 Politique optimale : WSJF + +**Théorème 11.** L'ordonnancement minimisant le temps d'achèvement pondéré +par la priorité +$\text{PWCT}(\sigma) = \sum w(q_i) \cdot C_i / \sum w(q_i)$ traite les +tâches par ordre décroissant de $w(q_i)/p_i$ — la règle **Weighted Shortest +Job First (WSJF)** [1, 5]. + +**Preuve.** Par l'argument d'échange (comme dans le Théorème 10), la +permutation de tâches adjacentes $i, j$ améliore le PWCT lorsque +$w(q_j)/p_j > w(q_i)/p_i$ mais que $j$ est ordonnancé après $i$. L'ordre +optimal est donc $w(q_i)/p_i$ décroissant. $\blacksquare$ + +Au sein d'une classe de priorité, cela se réduit au SPT (la plus courte en +premier). Entre les classes, une tâche critique de 4 heures +($w/p = 2.0$) l'emporte sur une tâche basse d'1 heure ($w/p = 1.0$). + +**Mise en garde pratique.** Le WSJF pur peut placer de minuscules tâches +de basse priorité devant de volumineuses tâches critiques (une tâche basse +de 15 minutes a $w/p = 1/0.25 = 4.0$, battant une tâche critique de +6 heures à $w/p = 8/6 = 1.33$). En pratique, cela est atténué en imposant +un **ordonnancement strict par classe de priorité** et en appliquant le +WSJF uniquement *au sein* de chaque classe. + +### 6.3 Exemple appliqué : centre de services informatiques + +Considérons une équipe informatique avec la file de tickets suivante : + +| Ticket | Priorité | Type | Heures est. | +|--------|----------|------|-----------| +| T1 | P1 (Critique) | Serveur de messagerie en panne | 6 | +| T2 | P2 (Élevée) | VPN en panne pour l'équipe distante | 4 | +| T3 | P3 (Moyenne) | Configuration du poste d'un nouvel employé | 2 | +| T4 | P4 (Basse) | Mise à jour de la politique de fond d'écran | 0.5 | +| T5 | P3 (Moyenne) | Installation d'une licence logicielle | 1 | +| T6 | P1 (Critique) | Sauvegarde de la base de données en échec | 3 | +| T7 | P2 (Élevée) | Parc d'imprimantes hors ligne | 2 | +| T8 | P4 (Basse) | Archivage d'un ancien dossier partagé | 0.25 | + +**Ordre SPT** (optimisant la moyenne non pondérée) : T8, T4, T5, T3, T7, T6, T2, T1 + +| Pos | Ticket | Priorité | Heures | Achèvement | Ralentissement | +|-----|--------|----------|-------|------------|----------| +| 1 | T8 (archivage dossier) | P4 Basse | 0.25 | 0.25 | 1.0 | +| 2 | T4 (fond d'écran) | P4 Basse | 0.5 | 0.75 | 1.5 | +| 3 | T5 (logiciel) | P3 Moy. | 1 | 1.75 | 1.75 | +| 4 | T3 (poste) | P3 Moy. | 2 | 3.75 | 1.875 | +| 5 | T7 (imprimantes) | P2 Élevée | 2 | 5.75 | 2.875 | +| 6 | T6 (sauvegardes) | P1 Crit. | 3 | 8.75 | 2.917 | +| 7 | T2 (VPN) | P2 Élevée | 4 | 12.75 | 3.188 | +| 8 | T1 (messagerie) | P1 Crit. | 6 | 18.75 | 3.125 | + +**WSJF pratique** (priorité de classe d'abord, SPT au sein de chaque classe) : + +| Pos | Ticket | Priorité | Heures | Achèvement | +|-----|--------|----------|-------|------------| +| 1 | T6 (sauvegardes) | P1 Crit. | 3 | 3 | +| 2 | T1 (messagerie) | P1 Crit. | 6 | 9 | +| 3 | T7 (imprimantes) | P2 Élevée | 2 | 11 | +| 4 | T2 (VPN) | P2 Élevée | 4 | 15 | +| 5 | T5 (logiciel) | P3 Moy. | 1 | 16 | +| 6 | T3 (poste) | P3 Moy. | 2 | 18 | +| 7 | T8 (archivage) | P4 Basse | 0.25 | 18.25 | +| 8 | T4 (fond d'écran) | P4 Basse | 0.5 | 18.75 | + +**Comparaison :** + +| Mesure | SPT | WSJF pratique | Vainqueur | +|--------|-----|----------------|--------| +| Moyenne non pondérée d'achèvement | **6,56 h** | 13,63 h | SPT | +| Temps moyen de résolution P1 | 13,75 h | **6 h** | WSJF | +| Temps moyen de résolution P2 | 9,25 h | **13 h** | SPT | +| Temps de réparation du serveur de messagerie | 18,75 h | **9 h** | WSJF | +| Temps de réparation des sauvegardes de la BDD | 8,75 h | **3 h** | WSJF | +| Temps de mise à jour du fond d'écran | **0,75 h** | 18,75 h | SPT | + +Les temps d'achèvement agrégés pondérés par la priorité sont presque +identiques (PWCT : 10,2 vs 10,17) car l'agrégation masque les dommages +distributionnels. La vraie différence réside dans la ventilation +**par classe de priorité** : le serveur de messagerie est en panne pendant +18,75 heures sous SPT contre 9 heures sous WSJF. Les sauvegardes de la +base de données échouent pendant 8,75 heures contre 3. + +La mesure non pondérée rapporte avec assurance que le SPT est **plus de +deux fois plus efficace** (6,56 vs 13,63), récompensant l'équipe qui a +mis à jour le fond d'écran pendant que le serveur de messagerie était en +flammes. + +### 6.4 Ensemble de mesures recommandé + +Même les mesures agrégées pondérées par la priorité peuvent échouer à +distinguer les bons des mauvais ordonnancements, car l'agrégation masque +les dommages distributionnels. Aucune mesure unique ne suffit. Un système +de mesure complet devrait suivre : + +| Mesure | Ce qu'elle mesure | Formule | +|--------|-----------------|---------| +| **Achèvement moyen par classe de priorité** | Réactivité par classe | $\bar{C}$ filtré par $q$ | +| **Temps moyen de résolution P1** | Réponse aux incidents critiques | $\bar{C}$ pour $q = 1$ | +| **Débit** | Capacité brute de travail | Heures-travail accomplies / temps calendaire | +| **Violations de vieillissement** | Prévention de la famine | Tâches dépassant le SLA par priorité | +| **Temps d'achèvement max (P1/P2)** | Pire cas de réponse critique | $\max(C_i)$ pour $q \le 2$ | + +L'enseignement clé : les **mesures par classe de priorité** exposent les +défaillances d'ordonnancement que les mesures agrégées masquent. + +--- + +# Partie III : Dynamiques organisationnelles + +## 7. Quand la mesure est le produit + +Les Sections 2–6 supposent que la satisfaction du client est fonction de +la *qualité de service vécue*. Mais il existe un scénario dans lequel cette +hypothèse échoue et l'ensemble de l'argumentation s'effondre. + +### 7.1 La mesure autoréférentielle + +Supposons que le prestataire communique la moyenne non pondérée directement +au client — sur un tableau de bord, dans un rapport de SLA, sur une page +marketing — et que la satisfaction du client dérive principalement de +*ce nombre* : + +$$U_{\text{client}} = f\!\left(\bar{C}(\sigma)\right), \quad f' < 0$$ + +Sous ce modèle, le SPT maximise véritablement la satisfaction du client +(Théorème 1). Le débit est inchangé (Théorème 6). Le résultat commercial +s'améliore : même travail effectué, client plus satisfait. + +**Chaque théorème de cet article reste mathématiquement correct. Mais la +conclusion s'inverse.** La mesure n'est plus un indicateur substituable +pouvant être manipulé — elle *est* la qualité de service, car le client a +accepté d'évaluer la qualité par le nombre agrégé. + +### 7.2 L'économie + +Cela crée un équilibre cohérent et stable : + +| Acteur | Comportement | Résultat | +|-------|----------|---------| +| Prestataire | Optimise la moyenne non pondérée (SPT) | La mesure s'améliore, aucun travail supplémentaire | +| Client | Lit le tableau de bord, voit une moyenne basse | Exprime sa satisfaction | +| Direction | Voit un client satisfait + une bonne mesure | Récompense l'équipe | + +Le prestataire extrait de la satisfaction à coût marginal nul, en +optimisant un nombre que le client a accepté comme indicateur de qualité. + +### 7.3 La fragilité + +Cet équilibre n'est stable que tant que le client n'examine jamais sa +propre expérience. Il se rompt lorsque : + +1. **Le client vérifie son propre ticket.** Un directeur technique dont le + serveur de messagerie a été en panne pendant 18,75 heures ne sera pas + rassuré par « Résolution moyenne : 6,56 heures. » Les clients les plus + susceptibles de vérifier sont exactement ceux qui reçoivent le pire + service (Théorème 4). + +2. **Un concurrent propose des SLA par ticket.** « P1 résolu en moins de + 4 heures » surpasse « résolution moyenne inférieure à 7 heures » pour + tout client ayant des besoins critiques. + +3. **L'équipe intériorise la mesure.** Si l'équipe croit que la mesure + reflète la performance réelle, elle perd la capacité de reconnaître + quand le travail critique est négligé. La mesure devient un danger + épistémique. + +### 7.4 Le schéma général + +Ce schéma — l'indicateur remplace la qualité, l'indicateur est optimisé, +la qualité diverge, le système est stable jusqu'à ce que la réalité le +mette à l'épreuve — se retrouve dans de nombreux domaines. Muller [19] le +documente abondamment sous le terme de « fixation métrique » ; Campbell +[24] a formalisé l'effet corrupteur de l'utilisation d'indicateurs comme +objectifs. + +| Domaine | Indicateur substituable | Qualité sous-jacente | Divergence | +|--------|-------------|-------------------|------------| +| Support informatique | Temps moyen de résolution | Disponibilité des systèmes critiques | Serveur en panne 19 h, la moyenne indique 6,5 | +| Éducation | Résultats aux tests | Apprentissage réel | Enseignement orienté vers l'examen | +| Santé | Débit de patients | Résultats pour les patients | Sorties plus rapides, réadmissions plus élevées | +| Finance | Résultats trimestriels | Valeur à long terme | Les réductions de coûts gonflent le BPA, érodent les capacités | +| Logiciel | Vélocité (story points) | Qualité du produit | Inflation des points, fonctionnalités à moitié terminées | + +### 7.5 Asymétrie d'information + +Modélisons le système comme un jeu entre le prestataire (P) et le client +(C). P observe les $\{C_i\}$ individuels et choisit $\sigma$ ; C n'observe +que $\bar{C}(\sigma)$. Il s'agit d'un problème d'**aléa moral** [10] : la +stratégie optimale de P est de minimiser le signal observable +indépendamment de la distribution inobservable. + +L'équilibre est un **équilibre de regroupement** [9] : la mesure rapportée +par P est identique quelle que soit la performance sous-jacente pondérée +par la priorité. Il est stable jusqu'à ce que C obtienne l'accès aux +valeurs individuelles de $C_i$ — via un portail client, la transparence +d'un concurrent ou un incident suffisamment douloureux. + +### 7.6 La conclusion inconfortable + +La réponse honnête à « l'optimisation de la moyenne non pondérée nuit-elle +à l'entreprise ? » est : **pas nécessairement, tant que le client ne +regarde jamais derrière le nombre**. La réponse honnête à « est-ce +durable ? » est : c'est exactement aussi durable que tout système dans +lequel le vendeur en sait plus que l'acheteur — stable pendant de longues +périodes, puis effondrement rapide lorsque l'asymétrie est percée. + +--- + +## 8. Le coût psychologique du savoir + +La Section 7 a modélisé le prestataire comme un acteur unitaire. Mais les +équipes sont composées d'individus. Lorsqu'un membre de l'équipe comprend +la preuve — lorsqu'il *sait* que la mesure est synthétique, que le tableau +de bord est du théâtre, que le serveur de messagerie est toujours en panne +pendant qu'il ferme des tickets de fond d'écran — un nouveau coût apparaît +que le modèle d'équilibre avait omis. + +### 8.1 La variable cachée : la conscience de l'équipe + +| Acteur | Observe les $C_i$ individuels | Observe $\bar{C}$ | Comprend la preuve | +|-------|--------------------------|--------------------|-----------------------| +| Direction | Possiblement | Oui | Variable | +| Membre de l'équipe | **Oui** | Oui | **Oui** (dans ce scénario) | +| Client | Non | Oui | Non | + +Le membre de l'équipe dispose de l'information complète. Il voit la file +de tickets. Il sait que le serveur de messagerie est en panne depuis 7h du +matin. Il sait qu'il ferme un ticket de fond d'écran parce que cela +améliore le nombre. Et il sait *pourquoi*. + +### 8.2 Dissonance cognitive sous information complète + +La dissonance cognitive [11] survient lorsqu'un individu détient des +cognitions contradictoires. Sans comprendre *pourquoi*, la contradiction +peut être rationalisée : « la direction sait ce qu'elle fait. » Comprendre +la preuve supprime l'ambiguïté. Le membre de l'équipe détient désormais : + +- **Cognition A :** « Je suis un professionnel compétent. Mon travail + consiste à résoudre des problèmes importants. » +- **Cognition B :** « Je ferme un ticket de fond d'écran pendant que le + serveur de messagerie est en panne, parce que la mesure est + mathématiquement biaisée (Théorème 1), le réordonnancement produit un + débit nul (Théorème 6), et le seul bénéficiaire est le tableau de bord + (Section 7). Je peux le démontrer. » + +La dissonance est désormais *structurante*. Les résolutions disponibles — +abandonner l'identité professionnelle, rejeter la preuve, plaider pour un +changement, ou partir — imposent chacune des coûts qui n'existaient pas +auparavant. + +### 8.3 Théorie de l'autodétermination : trois besoins violés + +La théorie de l'autodétermination de Deci et Ryan [12, 13] identifie trois +besoins prédisant la motivation intrinsèque : + +**Autonomie.** La mesure contraint les choix d'une manière que le membre +de l'équipe sait être mathématiquement sous-optimale. Un travailleur qui +comprend que le processus est prouvablement contre-productif ne peut se +sentir autonome en le suivant. + +**Compétence.** La mesure récompense l'efficacité *apparente* (un +$\bar{C}$ bas) tout en étant invariante par rapport à l'efficacité +*réelle* (Théorème 6). La compétence véritable — réparer le serveur de +messagerie en premier — est *pénalisée* par la mesure. + +**Appartenance.** Le membre de l'équipe sait que le serveur de messagerie +du client est en panne. Il pourrait aider. Il met à jour le fond d'écran +à la place — non pas parce que cela aide quelqu'un, mais parce que cela +aide un nombre. Le lien entre le travail et l'impact humain a été rompu, +et le membre de l'équipe peut voir les extrémités rompues. + +### 8.4 Blessure morale + +La blessure morale [16, 17] est le préjudice durable causé par le fait de +« perpétrer, ne pas empêcher, être témoin ou apprendre des actes qui +transgressent des convictions morales profondément ancrées » [17]. Elle a +depuis été étendue aux environnements professionnels [25]. La distinction +clé avec l'épuisement professionnel : **l'épuisement est l'exténuation +due à un excès de travail. La blessure morale est le dommage causé par le +fait de faire la mauvaise chose.** + +Un membre de l'équipe qui sait que le serveur de messagerie est en panne, +sait qu'il devrait le réparer, ferme un ticket de fond d'écran à la place, +et le fait parce que la mesure l'exige, subit les conditions structurelles +de la blessure morale. + +### 8.5 Impuissance acquise et fatalisme métrique + +L'impuissance acquise de Seligman [14, 15] décrit comment l'exposition à +des résultats négatifs incontrôlables conduit à la passivité. La +séquence : + +1. La mesure est défaillante (preuve comprise). +2. Plaider pour un changement. +3. Rejeté (« les chiffres sont bons, ne faites pas de vagues »). +4. Répéter avec une conviction décroissante. +5. État terminal : « La mesure est ce qu'elle est. Je vais juste fermer + des tickets. » + +Ce n'est pas de la paresse. C'est la réponse rationnelle à un système qui +punit le comportement correct et récompense le comportement incorrect, +lorsque l'individu n'a pas le pouvoir de changer le système. + +### 8.6 La spirale de sélection adverse + +En combinant l'équilibre de la Section 7 avec la dynamique de rotation du +personnel : + +1. L'organisation adopte la moyenne non pondérée. La mesure paraît bonne + (SPT). +2. Les membres compétents et conscients de l'équipe subissent des coûts + psychologiques (8.2–8.5). +3. Ces membres partent. Remplacés par des membres qui ne comprennent pas + les défauts de la mesure ou qui s'en moquent. +4. La mesure continue de paraître bonne — elle paraît toujours bonne sous + SPT, indépendamment de la compétence de l'équipe (Corollaire 6.1). +5. La qualité réelle du service se dégrade, mais la mesure ne peut le + détecter (Corollaire 9.1). +6. Retour à l'étape 1. + +La mesure sélectionne *contre* les personnes qui amélioreraient le système +et *en faveur* de celles qui ne le contesteront pas. Le système se +stabilise à un niveau inférieur de compétence, invisible pour son propre +appareil de mesure. + +### 8.7 Le modèle de coût complet + +| Section 7 (visible) | Section 8 (caché) | +|---------------------|---------------------| +| Client satisfait (bon nombre) | Équipe insatisfaite (mauvaise réalité) | +| Débit inchangé | Effort discrétionnaire retiré | +| La mesure s'améliore | Les membres compétents partent | +| Économie commerciale stable | La compétence institutionnelle se dégrade | + +Ces effets opèrent sur des échelles de temps différentes : l'équilibre est +visible trimestriellement ; la dégradation des compétences est visible sur +des années. Le modèle complet est : **la mesure fonctionne, et elle est +destructrice, et la destruction est invisible pour la mesure.** La mesure +est une couche de peinture fraîche sur des armatures corrodées. + +--- + +## 9. Intériorisation par le responsable : la solution actionnable + +Les Sections 2–6 disent de rejeter la mesure. La Section 7 dit que la +mesure fonctionne (pour l'entreprise). La Section 8 dit qu'elle détruit +l'équipe. En pratique, la plupart des responsables ne peuvent pas changer +unilatéralement la mesure. La meilleure solution est une réforme des +mesures à l'échelle de l'entreprise. La solution *actionnable* est ce +qu'un seul responsable informé peut faire dès maintenant. + +### 9.1 La stratégie + +Un responsable qui comprend la preuve peut **intérioriser les limites de +la mesure sans les propager à l'équipe** : + +1. **Ordonnancer principalement par priorité.** L'équipe traite les tâches + critiques en premier. +2. **Intercaler tactiquement les petites tâches.** Lorsqu'une petite tâche + de basse priorité peut être achevée sans retarder matériellement le + travail de haute priorité, la traiter. Non pas parce que la mesure + l'exige, mais parce qu'elle doit aussi être faite et ne coûte presque + rien. +3. **Ne jamais révéler la mesure comme motivation.** « Expédiez celle-ci + rapidement en attendant le rappel du fournisseur sur le P1 » — et non + « nous devons faire baisser notre moyenne. » La motivation intrinsèque + de l'équipe reste intacte (Section 8). Le responsable absorbe la charge + de gestion de la mesure. + +### 9.2 Formalisation + +Le problème du responsable est une optimisation sous contrainte : + +$$\min_{\sigma} \sum_{i=1}^{n} w(q_i) \cdot C_i \quad \text{sous la contrainte} \quad \bar{C}(\sigma) \le \bar{C}_{\text{target}}$$ + +**Théorème 12 (Coût métrique borné de l'ordonnancement par priorité).** Un +responsable qui utilise le SPT *au sein* de chaque classe de priorité et +l'ordonnancement par priorité *entre* les classes produira une mesure +proche de la valeur optimale SPT — l'écart ne provient que des inversions +entre classes. + +**Esquisse de preuve.** Au sein de chaque classe de priorité, le SPT est +gratuit (toutes les tâches ont une priorité égale). La seule déviation par +rapport au SPT global est l'ordonnancement entre classes. Chaque inversion +inter-classes coûte au plus $p_{\text{large}} - p_{\text{small}}$ dans la +somme non pondérée, et ces inversions sont bornées par le nombre de +classes. En pratique, l'écart se situe typiquement entre 10 et 20 % de +l'optimum SPT. $\blacksquare$ + +### 9.3 Le responsable comme barrière informationnelle + +| Niveau | Voit la mesure | Voit les priorités | Voit la preuve | +|-------|-----------|----------------|------------| +| Organisation | Oui | Nominalement | Non | +| Responsable | Oui | Oui | **Oui** | +| Équipe | Non (protégée) | Oui | Sans objet | +| Client | Oui (tableau de bord) | Via le SLA | Non | + +Le responsable est le seul acteur détenant les trois informations. Ce +n'est pas de la manipulation — il fait le bon travail dans le bon ordre, +et la mesure se trouve être acceptable parce que le SPT intra-classe est +gratuit. + +### 9.4 La rupture concurrentielle + +Cette stratégie échoue lorsque la mesure devient **concurrentielle entre +équipes**. + +**Cas 1 : Coopératif** — Les équipes sont mesurées pour la parité, non +pour le classement. Chaque responsable utilise indépendamment la stratégie +d'intériorisation. La mesure est décorative mais inoffensive. Il s'agit +d'un **jeu de coordination** avec un équilibre coopératif stable. + +**Cas 2 : Concurrentiel** — Les équipes sont classées par $\bar{C}$. Il +s'agit d'un **dilemme du prisonnier** : + +| | Équipe B : Priorité d'abord | Équipe B : SPT | +|---|---|---| +| **Équipe A : Priorité d'abord** | (Bon travail, Bon travail) | (A paraît mauvaise, B paraît bonne) | +| **Équipe A : SPT** | (A paraît bonne, B paraît mauvaise) | (Les deux paraissent bonnes, les deux font le mauvais travail) | + +L'équilibre de Nash est (SPT, SPT). La stratégie d'intériorisation est un +équilibre coopératif qui **n'est pas stable sous compétition**. + +### 9.5 Périmètre + +| Condition | Viabilité | +|-----------|-----------| +| Mesure utilisée pour le contrôle de santé / la parité | **Viable** | +| Mesure visible mais non classée | **Viable** | +| Mesure classée entre équipes | **Fragile** — nécessite la coopération de tous les responsables | +| Mesure liée à la rémunération / aux ressources | **Non viable** — le dilemme du prisonnier domine | +| Réforme des mesures possible au niveau de l'organisation | **Inutile** — corriger la mesure directement | + +**La meilleure solution est à l'échelle de l'entreprise. La solution +actionnable est un responsable qui comprend cette preuve, protège son +équipe de la mesure, ordonnance par priorité, et utilise le SPT uniquement +au sein des classes de priorité pour maintenir le nombre à un niveau +raisonnable.** + +--- + +# Partie IV : Évaluation + +## 10. Avocat du diable + +L'honnêteté intellectuelle impose de reconnaître les limites de +l'argumentation. + +### 10.1 La simplicité a une valeur réelle + +**Argument.** La moyenne non pondérée ne nécessite ni poids de priorité, +ni estimations de taille des tâches, ni calibration. + +**Évaluation : Vrai.** Mais la mesure non pondérée n'évite pas les +hypothèses — elle les *masque* en fixant implicitement tous les poids à 1 +et toutes les tailles à 1. Une estimation connue comme imprécise de la +taille des tâches reste plus informative que l'hypothèse implicite que +toutes les tailles sont égales. + +### 10.2 Minimiser le nombre de personnes en attente + +**Argument.** Le SPT minimise le total des heures-personnes d'attente. Si +chaque tâche représente un client, c'est optimal. + +**Évaluation : Mathématiquement correct.** Si vous gérez un guichet de +préfecture et que le temps de chaque personne a la même valeur, le SPT est +la bonne politique. Cela ne fonctionne plus lorsque les tâches ne +correspondent pas à un ratio 1:1 avec les clients, que le coût d'attente +n'est pas uniforme, ou que la mesure est utilisée pour évaluer des équipes +plutôt que pour gérer une file d'attente littérale. + +### 10.3 Le SPT comme heuristique de triage + +**Argument.** Lorsque les tailles de tâches sont étroitement regroupées, +le SPT se rapproche du FIFO et la moyenne non pondérée se rapproche de la +moyenne pondérée. + +**Évaluation : Correct.** Le coefficient de variation $CV = \sigma_p / \bar{p}$ détermine la sévérité de la distorsion : + +| $CV$ | Distribution de la taille des tâches | Distorsion | +|------|----------------------|------------| +| < 0.3 | Serrée (centre d'appels) | Négligeable | +| 0.3 – 1.0 | Modérée (informatique mixte) | Modérée | +| > 1.0 | Large (file informatique typique) | Sévère | + +Un centre de services informatique typique s'étend de 15 minutes à plus de +40 heures ($CV > 2$). La distorsion n'est pas un cas limite — c'est la +situation par défaut. + +### 10.4 La manipulation requiert de la malveillance + +**Argument.** Les théorèmes montrent que la mesure *peut* être manipulée, +pas qu'elle le *sera*. + +**Évaluation : C'est le contre-argument le plus solide.** Si la mesure est +purement informationnelle et n'influence jamais le comportement, +l'incitation à la manipulation est absente. Cependant, toute mesure +rapportée à la direction, liée aux OKR, ou discutée en rétrospective +influencera le comportement. C'est la loi de Goodhart [6, 7] — et elle +s'applique aux équipes bien intentionnées aussi sûrement qu'aux équipes +cyniques. La dérive se produit organiquement : fermer trois tickets faciles +« donne le sentiment d'être productif » tandis que la mesure valide ce +sentiment. + +### 10.5 Quand la moyenne non pondérée est défendable + +La mesure n'est défendable **que lorsque les quatre conditions suivantes +sont réunies** : + +1. Les tailles de tâches sont approximativement uniformes ($CV < 0.3$) +2. Pas de différenciation de priorité (toutes les tâches ont la même + importance) +3. Chaque tâche représente exactement un client +4. La mesure n'est pas utilisée pour évaluer, récompenser ou diriger le + comportement + +Ces conditions sont rarement remplies dans les systèmes où la mesure est +le plus couramment utilisée. + +--- + +## 11. Travaux connexes + +Cet article se situe à l'intersection de plusieurs corpus de littérature +qui n'avaient pas été connectés auparavant. + +### 11.1 Théorie de l'ordonnancement et équité + +Smith [1] a établi le résultat d'optimalité du SPT et la règle WSJF en +1956. Conway, Maxwell et Miller [2] ont fourni le traitement de référence +sous forme de manuel. L'équité des politiques d'ordonnancement basées sur +la taille a été débattue dans l'ordonnancement des systèmes informatiques : +Bansal et Harchol-Balter [22] ont étudié l'inéquité du SRPT ; Wierman et +Harchol-Balter [23] ont formalisé les classifications d'équité par rapport +au Processor-Sharing ; Angel, Bampis et Pascual [21] ont mesuré la qualité +de l'ordonnancement SPT par rapport à des critères d'optimalité équitable. + +Ces travaux antérieurs analysent l'équité dans l'ordonnancement CPU et +serveur. Le présent article applique les mêmes résultats mathématiques à +la *gestion organisationnelle des tâches*, où l'« ordonnanceur » est une +équipe humaine, les « travaux » sont des demandes de clients avec des +priorités d'impact métier, et la « fonction objectif » est une mesure de +management. Le mécanisme est identique ; les conséquences diffèrent parce +que l'ordonnancement organisationnel comporte des systèmes de priorités, +des relations clients et des coûts psychologiques que l'ordonnancement CPU +n'a pas. + +### 11.2 Dysfonctionnement de la mesure + +Austin [18] a démontré que la mesure incomplète — ne mesurant qu'un +sous-ensemble des dimensions pertinentes — crée des incitations à optimiser +les dimensions mesurées au détriment de celles qui ne le sont pas, et que +cet effet est non seulement possible mais *inévitable* lorsque la mesure +est liée aux récompenses. Son cadre d'analyse en termes d'asymétrie +d'information est étroitement parallèle à la Section 7. Le présent article +fournit le mécanisme mathématique spécifique (Théorèmes 1–2) pour le cas +de l'ordonnancement des tâches, et étend l'argument par la psychologie +(Section 8) pour tracer la chaîne complète du préjudice organisationnel. + +Muller [19] a documenté la « fixation métrique » dans l'éducation, la +santé, la police et la finance, fournissant des preuves empiriques +abondantes pour les schémas théorisés dans la Section 7.4. Campbell [24] a +formalisé l'effet corrupteur de l'utilisation d'indicateurs comme +objectifs, complétant l'observation originale de Goodhart [6] et la +généralisation de Strathern [7]. + +Bevan et Hood [26] ont documenté empiriquement les comportements de +manipulation dans le système de santé publique anglais — y compris les +schémas exacts de « atteindre la cible en manquant l'essentiel » décrits +dans notre Section 5.2. + +### 11.3 Coûts psychologiques du dysfonctionnement métrique + +L'application de la blessure morale (Shay [16], Litz et al. [17]) aux +environnements professionnels a un précédent récent : une étude de 2024 +du *Journal of Business Ethics* [25] a explicitement étendu le concept aux +lieux de travail à but lucratif, trouvant des conditions structurelles +similaires à celles décrites dans la Section 8.4. Moore [27] a analysé le +*désengagement* moral — la restructuration cognitive qui permet un +comportement contraire à l'éthique sous pression organisationnelle. Le +présent article traite du phénomène complémentaire : le préjudice subi par +les individus qui *refusent* de se désengager. + +### 11.4 Ce qui est nouveau + +Les composants individuels — l'optimalité du SPT, la loi de Goodhart, le +dysfonctionnement de la mesure, la blessure morale — ont tous des +précédents. Les contributions de cet article sont : + +1. **La loi de conservation (Théorème 2) utilisée de manière + prescriptive** — comme un argument constructif montrant que le temps + d'achèvement pondéré par le travail *ne peut pas* être manipulé, plutôt + que comme un résultat théorique d'ordonnancement. + +2. **La preuve spécifique que les classes de priorité rendent la mesure + algébriquement antagoniste** (Théorèmes 8–9) — non pas simplement + empiriquement mauvaise mais structurellement contradictoire, avec une + information mutuelle nulle entre l'ordonnancement et le système de + priorités. + +3. **La chaîne intégrée** allant de la preuve mathématique à l'asymétrie + d'information, au préjudice psychologique, à la spirale de sélection + adverse — traçant une seule mesure depuis Smith (1956) jusqu'à + l'évidement organisationnel. + +4. **La stratégie d'intériorisation par le responsable** (Section 9) avec + une analyse formelle en théorie des jeux de sa stabilité et de ses + conditions de rupture sous compétition inter-équipes. + +5. **L'application de la théorie de l'ordonnancement à la critique du + management organisationnel** — démontrant qu'une mesure d'équipe + couramment utilisée présente des pathologies spécifiques et + quantifiables plutôt que d'argumenter par l'anecdote ou le principe + général. + +--- + +## 12. Conclusion + +Le temps moyen non pondéré d'achèvement est une **statistique biaisée** +qui : + +1. **Peut être manipulé** par la politique d'ordonnancement (Théorème 1), + contrairement au temps d'achèvement pondéré par le travail qui est + invariant par rapport à l'ordonnancement (Théorème 2). +2. **Incite à la famine** des tâches volumineuses (Théorème 3). +3. **Dégrade la satisfaction des clients** sans aucun gain compensatoire de + productivité (Théorème 7). +4. **Contredit activement les systèmes de priorités** en ne contenant + aucune information sur la classification par impact métier (Théorème 9). +5. **Ignore entièrement la priorité** dans sa recommandation + d'ordonnancement, produisant un coût de délai pondéré par la priorité + sous-optimal chaque fois que la priorité et la taille ne sont pas + parfaitement inversement corrélées (Théorème 10). + +Une mesure qui peut être améliorée en réordonnant le travail — sans +effectuer aucun travail supplémentaire — mesure la politique +d'ordonnancement, et non la capacité du système. Combinée à un système de +priorités, elle recommande l'ordonnancement qui inflige le plus de dommages +au travail de plus haute priorité. + +Lorsque la mesure est communiquée aux clients, elle crée une asymétrie +d'information (Section 7) dont l'équilibre commercial est rentable mais +fragile. Lorsque les membres de l'équipe en comprennent les défauts, elle +viole leur motivation intrinsèque et sélectionne le départ des personnes +les plus compétentes (Section 8). Un seul responsable informé peut +partiellement atténuer ces effets par une optimisation sous contrainte +(Section 9), mais cette stratégie coopérative n'est pas stable sous +compétition inter-équipes. + +La moyenne non pondérée n'est défendable que sous des conditions étroites +(Section 10.5) : tailles de tâches uniformes, pas de priorités, +correspondance biunivoque entre clients et tâches, et aucune influence +comportementale. Ces conditions sont rarement remplies. + +**Le temps moyen non pondéré d'achèvement n'est pas une mesure juste ni +exacte de la performance d'exécution des tâches. Son adoption comme mesure +d'équipe produira rationnellement la famine du travail complexe, la +violation des priorités déclarées, des résultats inéquitables pour les +clients, et l'illusion de productivité là où il n'y en a aucune.** + +La meilleure solution est une réforme organisationnelle des mesures. La +solution actionnable est un responsable qui comprend cette preuve. + +--- + +## Références + +### Théorie de l'ordonnancement + +[1] Smith, W. E. (1956). Various optimizers for single-stage production. +*Naval Research Logistics Quarterly*, 3(1–2), 59–66. +doi:[10.1002/nav.3800030106](https://doi.org/10.1002/nav.3800030106) + +> Origine du résultat d'optimalité du SPT (Théorème 1), de la règle du +> temps d'achèvement pondéré $w_i/p_i$ décroissant (WSJF, Théorème 11), et +> de la technique de preuve par échange de paires adjacentes (argument +> d'échange) utilisée tout au long de l'article. + +[2] Conway, R. W., Maxwell, W. L., & Miller, L. W. (1967). *Theory of +Scheduling*. Addison-Wesley. + +> Traitement de référence sous forme de manuel de la théorie de +> l'ordonnancement sur machine unique, étendant les résultats de Smith. + +[3] Little, J. D. C. (1961). A proof for the queuing formula: L = λW. +*Operations Research*, 9(3), 383–387. +doi:[10.1287/opre.9.3.383](https://doi.org/10.1287/opre.9.3.383) + +> Première preuve rigoureuse de la loi de Little. Référencée en +> Section 3.2 pour le contexte en théorie des files d'attente. + +[4] Little, J. D. C. (2011). Little's Law as viewed on its 50th +anniversary. *Operations Research*, 59(3), 536–549. +doi:[10.1287/opre.1110.0941](https://doi.org/10.1287/opre.1110.0941) + +> Rétrospective discutant de la portée, des limitations et des erreurs +> courantes d'application. + +[5] Reinertsen, D. G. (2009). *The Principles of Product Development +Flow: Second Generation Lean Product Development*. Celeritas Publishing. +ISBN: 978-0-9844512-0-8. + +> A popularisé le WSJF et le « Coût du retard / Durée » dans les contextes +> agiles et lean. Le fondement mathématique est Smith (1956) [1]. + +### Mesure et incitations + +[6] Goodhart, C. A. E. (1984). Problems of monetary management: The U.K. +experience. In *Monetary Theory and Practice* (pp. 91–121). Macmillan. + +> Source de la loi de Goodhart : « Toute régularité statistique observée +> tendra à s'effondrer dès lors qu'une pression sera exercée sur elle à des +> fins de contrôle. » + +[7] Strathern, M. (1997). 'Improving ratings': Audit in the British +university system. *European Review*, 5(3), 305–321. +doi:[10.1002/(SICI)1234-981X(199707)5:3<305::AID-EURO184>3.0.CO;2-4](https://doi.org/10.1002/(SICI)1234-981X(199707)5:3%3C305::AID-EURO184%3E3.0.CO;2-4) + +> Généralisation de la loi de Goodhart : « Lorsqu'une mesure devient un +> objectif, elle cesse d'être une bonne mesure. » + +### Économie comportementale + +[8] Kahneman, D., & Tversky, A. (1979). Prospect theory: An analysis of +decision under risk. *Econometrica*, 47(2), 263–292. +doi:[10.2307/1914185](https://doi.org/10.2307/1914185) + +> A établi l'aversion à la perte. Référencée en Section 4.5. + +### Théorie des jeux et théorie des contrats + +[9] Akerlof, G. A. (1970). The market for "lemons": Quality uncertainty +and the market mechanism. *The Quarterly Journal of Economics*, 84(3), +488–500. doi:[10.2307/1879431](https://doi.org/10.2307/1879431) + +> Asymétrie d'information et sélection adverse. L'équilibre de +> regroupement de la Section 7.5 est structurellement analogue. + +[10] Hölmstrom, B. (1979). Moral hazard and observability. *The Bell +Journal of Economics*, 10(1), 74–91. +doi:[10.2307/3003320](https://doi.org/10.2307/3003320) + +> Traitement formel de l'aléa moral. Le scénario de communication de la +> mesure de la Section 7.5 est un problème d'aléa moral. + +### Psychologie + +[11] Festinger, L. (1957). *A Theory of Cognitive Dissonance*. Stanford +University Press. ISBN: 978-0-8047-0131-0. + +> Théorie fondatrice. Référencée en Section 8.2. + +[12] Deci, E. L., & Ryan, R. M. (1985). *Intrinsic Motivation and +Self-Determination in Human Behavior*. Plenum Press. +ISBN: 978-0-306-42022-1. + +> Traitement original de la théorie de l'autodétermination. Référencée en +> Section 8.3. + +[13] Ryan, R. M., & Deci, E. L. (2000). Self-determination theory and +the facilitation of intrinsic motivation, social development, and +well-being. *American Psychologist*, 55(1), 68–78. +doi:[10.1037/0003-066X.55.1.68](https://doi.org/10.1037/0003-066X.55.1.68) + +> Aperçu de la théorie de l'autodétermination liant la satisfaction des +> besoins à la motivation intrinsèque et au bien-être. + +[14] Seligman, M. E. P., & Maier, S. F. (1967). Failure to escape +traumatic shock. *Journal of Experimental Psychology*, 74(1), 1–9. +doi:[10.1037/h0024514](https://doi.org/10.1037/h0024514) + +> Démonstration originale de l'impuissance acquise. Référencée en +> Section 8.5. + +[15] Seligman, M. E. P. (1975). *Helplessness: On Depression, +Development, and Death*. W. H. Freeman. ISBN: 978-0-7167-0752-3. + +> Traitement approfondi reliant l'impuissance acquise à la dépression +> humaine et au comportement institutionnel. + +[16] Shay, J. (1994). *Achilles in Vietnam: Combat Trauma and the Undoing +of Character*. Atheneum / Simon & Schuster. ISBN: 978-0-689-12182-3. + +> A introduit le concept de blessure morale. Référencée en Section 8.4. + +[17] Litz, B. T., Stein, N., Delaney, E., Lebowitz, L., Nash, W. P., +Silva, C., & Maguen, S. (2009). Moral injury and moral repair in war +veterans: A preliminary model and intervention strategy. *Clinical +Psychology Review*, 29(8), 695–706. +doi:[10.1016/j.cpr.2009.07.003](https://doi.org/10.1016/j.cpr.2009.07.003) + +> A formalisé la blessure morale comme concept clinique. Définition citée +> en Section 8.4. + +### Mesure organisationnelle + +[18] Austin, R. D. (1996). *Measuring and Managing Performance in +Organizations*. Dorset House. ISBN: 978-0-932633-36-1. + +> A démontré que la mesure incomplète crée des incitations inévitables à +> optimiser les dimensions mesurées au détriment de celles qui ne le sont +> pas. Le cadre d'analyse en termes d'asymétrie d'information est +> étroitement parallèle à la Section 7. Le prédécesseur le plus important +> de l'argumentation de cet article. + +[19] Muller, J. Z. (2018). *The Tyranny of Metrics*. Princeton University +Press. ISBN: 978-0-691-17495-2. + +> Traitement complet de la « fixation métrique » dans l'éducation, la +> santé, la police et la finance. Preuves empiriques abondantes pour les +> schémas théorisés en Section 7.4. + +### Équité en ordonnancement + +[20] Coffman, E. G., Shanthikumar, J. G., & Yao, D. D. (1992). +Multiclass queueing systems: Polymatroid structure and optimal scheduling +control. *Operations Research*, 40(S2), S293–S299. + +> Lois de conservation en ordonnancement. L'invariance par rapport à +> l'ordonnancement du temps d'achèvement pondéré par le travail +> (Théorème 2) est une instance de ces lois de conservation. + +[21] Angel, E., Bampis, E., & Pascual, F. (2008). How good are SPT +schedules for fair optimality criteria? *Annals of Operations Research*, +159(1), 53–64. doi:[10.1007/s10479-007-0267-0](https://doi.org/10.1007/s10479-007-0267-0) + +> Mesure directement la qualité de l'ordonnancement SPT par rapport aux +> critères d'équité. Prédécesseur le plus proche dans la théorie de +> l'ordonnancement de l'analyse d'équité de la Section 4. + +[22] Bansal, N., & Harchol-Balter, M. (2001). Analysis of SRPT +scheduling: Investigating unfairness. *ACM SIGMETRICS Performance +Evaluation Review*, 29(1), 279–290. +doi:[10.1145/384268.378792](https://doi.org/10.1145/384268.378792) + +> Étudie la croyance selon laquelle le SRPT pénalise injustement les +> tâches volumineuses dans l'ordonnancement informatique. Argumente que +> l'inéquité est moindre qu'on ne le pense mais reconnaît la tension +> fondamentale. + +[23] Wierman, A., & Harchol-Balter, M. (2003). Classifying scheduling +policies with respect to unfairness in an M/GI/1. *ACM SIGMETRICS +Performance Evaluation Review*, 31(1), 238–249. + +> Formalise les définitions d'équité pour les politiques d'ordonnancement +> par comparaison avec le Processor-Sharing. + +### Références complémentaires + +[24] Campbell, D. T. (1979). Assessing the impact of planned social +change. *Evaluation and Program Planning*, 2(1), 67–90. +doi:[10.1016/0149-7189(79)90048-X](https://doi.org/10.1016/0149-7189(79)90048-X) + +> Loi de Campbell : « Plus un indicateur social quantitatif est utilisé +> pour la prise de décision sociale, plus il sera soumis à des pressions +> de corruption et plus il sera apte à distordre et corrompre les processus +> sociaux qu'il est censé surveiller. » Complète la loi de Goodhart [6]. + +[25] Ferreira, C. M., et al. (2024). It's business: A qualitative study +of moral injury in business settings. *Journal of Business Ethics*. +doi:[10.1007/s10551-024-05615-0](https://doi.org/10.1007/s10551-024-05615-0) + +> Étend la blessure morale aux lieux de travail à but lucratif. Valide +> l'application de la Section 8.4 de Shay/Litz au-delà des contextes +> militaires et de santé. + +[26] Bevan, G., & Hood, C. (2006). What's measured is what matters: +Targets and gaming in the English public health care system. *Public +Administration*, 84(3), 517–538. +doi:[10.1111/j.1467-9299.2006.00600.x](https://doi.org/10.1111/j.1467-9299.2006.00600.x) + +> Documente empiriquement les comportements de manipulation, y compris +> « atteindre la cible en manquant l'essentiel ». Fournit des preuves +> concrètes de la contradiction priorité-mesure de la Section 5.2. + +[27] Moore, C. (2012). Why employees do bad things: Moral disengagement +and unethical organizational behavior. *Personnel Psychology*, 65(1), +1–48. doi:[10.1111/j.1744-6570.2011.01237.x](https://doi.org/10.1111/j.1744-6570.2011.01237.x) + +> Analyse le *désengagement* moral — la restructuration cognitive +> permettant un comportement contraire à l'éthique. La Section 8 traite du +> phénomène complémentaire : le préjudice subi par les individus qui +> *refusent* de se désengager. + +--- + +*Cette preuve a été développée de manière conversationnelle et formalisée le 28 mars 2026.* diff --git a/README.pl.md b/README.pl.md new file mode 100644 index 0000000..83c6861 --- /dev/null +++ b/README.pl.md @@ -0,0 +1,1320 @@ +# Nieważony średni czas realizacji nie jest sprawiedliwą miarą szeregowania zadań + +Dowód matematyczny, że nieważony średni czas realizacji zadań jest obciążoną +statystyką, która zachęca do selektywnego wybierania łatwych zadań, oraz że +wszelka przewaga szeregowania, jaką wydaje się ona ujawniać, jest artefaktem +metryki — a nie odzwierciedleniem rzeczywistej przepustowości czy jakości +obsługi. + +--- + +## 1. Wprowadzenie + +Wiele organizacji mierzy wydajność realizacji zadań za pomocą **nieważonego +średniego czasu realizacji**: średniej liczby godzin (lub dni) od zgłoszenia +zadania do jego rozwiązania, traktując każde zadanie jednakowo, niezależnie +od rozmiaru czy priorytetu. + +Niniejsza praca dowodzi, że ta metryka jest nie tylko nieprecyzyjna, ale +strukturalnie obciążona. Można ją poprawić przez zmianę kolejności pracy +bez wykonywania jakiejkolwiek dodatkowej pracy (Twierdzenie 1), podczas +gdy odpowiednio ważona alternatywa jest całkowicie odporna na manipulację +kolejnością (Twierdzenie 2). W połączeniu z systemem priorytetów metryka +aktywnie przeczy własnym klasyfikacjom priorytetów organizacji +(Twierdzenie 9). + +Argumentacja przebiega w czterech częściach: + +- **Część I** (Rozdziały 2–4) ustanawia fundament matematyczny: + nieważona średnia jest podatna na manipulację przez szeregowanie + metodą najkrótszego czasu przetwarzania (SPT), średnia ważona pracą + jest niezmienna względem kolejności, a wynikające z tego konsekwencje + dla jakości obsługi są dowodliwie negatywne. + +- **Część II** (Rozdziały 5–6) rozszerza model o zadania z przypisanym + priorytetem, dowodzi, że metryka staje się adwersaryczna wobec + systemu priorytetów, oraz proponuje ważone alternatywy wraz + z rozpatrzonym przykładem działu obsługi IT. + +- **Część III** (Rozdziały 7–9) analizuje dynamikę organizacyjną: co się + dzieje, gdy metryka jest raportowana klientom (asymetria informacji), + co się dzieje z członkami zespołu, którzy rozumieją jej wady (szkoda + psychologiczna), oraz co może zrobić pojedynczy świadomy menedżer + (optymalizacja z ograniczeniami z analizą stabilności + teoriogrową). + +- **Część IV** (Rozdziały 10–12) przedstawia uczciwe kontrargumenty, + osadza pracę w istniejącej literaturze i formułuje wnioski. + +Główne wyniki opierają się na fundamentalnej teorii szeregowania Smitha +(1956) [1], rozszerzonej przez teorię gier [9, 10], teorię pomiarów +organizacyjnych [18, 19] oraz psychologię [11–17], tworząc kompletny +łańcuch od dowodu matematycznego dotyczącego konkretnej metryki do +wyników organizacyjnych. + +--- + +# Część I: Fundament matematyczny + +## 2. Definicje + +Niech będzie danych **n** zadań o czasach przetwarzania $p_1, p_2, \ldots, p_n$. + +**Harmonogram** $\sigma$ jest permutacją $\{1, 2, \ldots, n\}$ przypisującą +zadania do kolejności wykonania na pojedynczym wykonawcy. + +**Czas realizacji** zadania $\sigma(k)$ w harmonogramie $\sigma$ wynosi: + +$$C_{\sigma(k)} = \sum_{j=1}^{k} p_{\sigma(j)}$$ + +**Nieważony średni czas realizacji** wynosi: + +$$\bar{C}(\sigma) = \frac{1}{n} \sum_{k=1}^{n} C_{\sigma(k)}$$ + +**Średni czas realizacji ważony pracą** wynosi: + +$$\bar{C}_w(\sigma) = \frac{\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)}}{\sum_{k=1}^{n} p_{\sigma(k)}}$$ + +--- + +## 3. Wyniki główne + +### 3.1 Nieważona średnia jest podatna na manipulację + +**Twierdzenie 1** (Smith, 1956 [1])**.** Harmonogramem minimalizującym +$\bar{C}(\sigma)$ jest metoda najkrótszego czasu przetwarzania (SPT): +posortuj zadania tak, aby +$p_{\sigma(1)} \le p_{\sigma(2)} \le \cdots \le p_{\sigma(n)}$. + +**Dowód (argument wymiany [1, 2]).** + +Rozważmy dowolny harmonogram $\sigma$, w którym dwa sąsiednie zadania +$i, j$ spełniają $p_i > p_j$, przy czym zadanie $i$ jest zaplanowane +bezpośrednio przed zadaniem $j$. Niech $t$ będzie czasem rozpoczęcia +zadania $i$. + +| | Zadanie $i$ kończy się | Zadanie $j$ kończy się | Suma | +|---|---|---|---| +| **Przed zamianą** ($i$ potem $j$) | $t + p_i$ | $t + p_i + p_j$ | $2t + 2p_i + p_j$ | +| **Po zamianie** ($j$ potem $i$) | $t + p_j$ | $t + p_j + p_i$ | $2t + p_i + 2p_j$ | + +Zmiana w sumie czasów realizacji wynosi: + +$$(2p_i + p_j) - (p_i + 2p_j) = p_i - p_j > 0$$ + +Każda zamiana pary sąsiedniej typu dłuższy-przed-krótszym ściśle redukuje +sumę. Każdy harmonogram niebędący SPT zawiera taką parę. Powtarzane zamiany +zbiegają do SPT. Zatem SPT jednoznacznie minimalizuje $\bar{C}(\sigma)$. $\blacksquare$ + +### 3.2 Średnia ważona pracą jest niezmienna względem harmonogramu + +**Twierdzenie 2.** Średni czas realizacji ważony pracą $\bar{C}_w(\sigma)$ +jest taki sam dla każdego harmonogramu $\sigma$. + +**Dowód.** + +Rozwiń licznik: + +$$\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)} = \sum_{k=1}^{n} p_{\sigma(k)} \sum_{j=1}^{k} p_{\sigma(j)}$$ + +Przeindeksuj, niech $a = \sigma(k)$ i $b = \sigma(j)$. Podwójna suma +zlicza każdą uporządkowaną parę $(a, b)$, w której $b$ jest zaplanowane +nie później niż $a$: + +$$= \sum_{\substack{a, b \\ b \preceq_\sigma a}} p_a \, p_b$$ + +Dla dowolnej pary $(a, b)$ z $a \ne b$ zachodzi dokładnie jeden +z warunków: $\{b \preceq_\sigma a\}$ lub $\{a \prec_\sigma b\}$. Wyrazy +diagonalne ($a = b$) wnoszą $p_a^2$ niezależnie od kolejności. Zatem: + +$$\sum_{\substack{a, b \\ b \preceq_\sigma a}} p_a \, p_b = \sum_{a} p_a^2 + \sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b$$ + +Razem z sumą komplementarną obie sumy pozadiagonalne pokrywają wszystkie +pary nieuporządkowane: + +$$\sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b + \sum_{\substack{a \ne b \\ a \prec_\sigma b}} p_a \, p_b = \sum_{a \ne b} p_a \, p_b$$ + +Prawa strona jest niezależna od harmonogramu. Z symetrii $p_a p_b$ +obie sumy pozadiagonalne są równe: + +$$\sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b = \frac{1}{2} \sum_{a \ne b} p_a \, p_b$$ + +Zatem: + +$$\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)} = \sum_a p_a^2 + \frac{1}{2} \sum_{a \ne b} p_a \, p_b = \frac{1}{2}\left(\sum_a p_a\right)^2 + \frac{1}{2}\sum_a p_a^2$$ + +Wyrażenie to nie zawiera odwołania do $\sigma$. Ponieważ mianownik +$\sum p_a$ jest również niezależny od harmonogramu: + +$$\bar{C}_w(\sigma) = \frac{\frac{1}{2}\left(\sum p_a\right)^2 + \frac{1}{2}\sum p_a^2}{\sum p_a}$$ + +jest **stały dla wszystkich harmonogramów**. $\blacksquare$ + +Jest to przypadek praw zachowania w szeregowaniu zidentyfikowanych przez +Coffmana, Shanthikumara i Yao [20]. Niezmienniczość odpowiada pomiarowi +tego, jak długo jednostka *pracy* czeka, a nie jak długo *zadanie* +czeka — statystyka nieważona zlicza realizacje, a nie pracę, dlatego jest +podatna na manipulację. (Zob. także Little [3, 4] w kontekście +teorii kolejek, z zastrzeżeniem, że prawo Little'a stosuje się +bezpośrednio tylko do systemów w stanie ustalonym, a nie do przypadku +wsadowego analizowanego tutaj.) + +### 3.3 Przykład ilustracyjny + +Dwa zadania: $A$ z $p_A = 1$ godzina, $B$ z $p_B = 10$ godzin. + +| Harmonogram | $C_A$ | $C_B$ | Średnia nieważona | Średnia ważona pracą | +|----------|-------|-------|-----------------|-------------------| +| SPT (A najpierw) | 1 | 11 | 6,0 | 111/11 ≈ 10,09 | +| Odwrotny (B najpierw) | 11 | 10 | 10,5 | 111/11 ≈ 10,09 | + +SPT wydaje się **lepszy o 4,5 godziny** według metryki nieważonej, ale +zapewnia **zerową poprawę** według metryki ważonej pracą. Pozorna przewaga +istnieje wyłącznie dlatego, że statystyka nieważona pozwala zadaniu +1-godzinnemu „głosować" na równi z zadaniem 10-godzinnym. + +--- + +## 4. Konsekwencje dla jakości obsługi + +### 4.1 Zagłodzenie dużych zadań + +**Twierdzenie 3 (Obciążenie metryki).** Każda polityka szeregowania +minimalizująca nieważony średni czas realizacji z konieczności maksymalizuje +czas realizacji największego zadania. + +**Dowód.** SPT umieszcza największe zadanie na końcu. Jego czas realizacji +równa się całkowitemu czasowi przetwarzania $\sum p_i$, co stanowi +maksymalny możliwy czas realizacji dla dowolnego pojedynczego zadania. +W każdym harmonogramie, który nie umieszcza największego zadania na końcu, +to zadanie kończy się ściśle wcześniej. $\blacksquare$ + +Tworzy to **zachętę do zagłodzenia**: racjonalni agenci optymalizujący +statystykę nieważoną będą w nieskończoność odraczać duże zadania na rzecz +małych. Austin [18] zidentyfikował ten ogólny wzorzec — że niekompletny +pomiar tworzy zachęty do optymalizacji mierzonego wymiaru kosztem +wymiarów niemierzonych — w kontekście zarządzania wydajnością +organizacyjną. Twierdzenie 3 dostarcza konkretny mechanizm dla +szeregowania zadań. + +### 4.2 Maksymalny czas realizacji największego zadania + +**Twierdzenie 4 (SPT jednoznacznie maksymalizuje czas realizacji +największego zadania).** Spośród wszystkich harmonogramów SPT jest +jedyną polityką, która przypisuje maksymalny możliwy czas realizacji +($\sum p_i$) największemu zadaniu. + +**Dowód.** SPT sortuje zadania rosnąco według $p_i$, umieszczając +największe zadanie $p_{\max}$ na ostatniej pozycji. Ostatnie zadanie +w dowolnym harmonogramie ma czas realizacji $\sum_{i=1}^{n} p_i$, co +jest maksimum, jakie może otrzymać dowolne pojedyncze zadanie. W każdym +harmonogramie, który nie umieszcza $p_{\max}$ na końcu, kończy się ono +ściśle przed $\sum p_i$. $\blacksquare$ + +**Wniosek 4.1.** Zespół optymalizujący nieważony średni czas realizacji +będzie systematycznie dostarczał najgorsze doświadczenie klientom +o najbardziej złożonych potrzebach. Nie jest to efekt uboczny — jest to +*mechanizm*, dzięki któremu metryka się poprawia. + +**Uwaga o współczynnikach spowolnienia.** SPT w rzeczywistości *kompresuje* +współczynniki spowolnienia ($S_i = C_i / p_i$), ponieważ większe zadania +na późniejszych pozycjach mają duże mianowniki, które absorbują +skumulowaną sumę. Na przykład dla zadań $[1, 5, 10]$: SPT daje +spowolnienia $[1, 1{,}2, 1{,}6]$ (niska wariancja), podczas gdy LPT daje +$[1, 3, 16]$ (wysoka wariancja). Szkoda SPT dla klientów z dużymi +zadaniami nie jest widoczna we współczynniku spowolnienia — jest widoczna +w **bezwzględnym czasie realizacji**. To rozróżnienie jest istotne: +w literaturze dotyczącej sprawiedliwości szeregowania [21, 22, 23] +debatowano nad niesprawiedliwością SPT/SRPT głównie poprzez miary oparte +na spowolnieniu, które mogą zaciemniać obciążenie bezwzględnym opóźnieniem +udowodnione poniżej. + +### 4.3 Koncentracja opóźnień + +**Twierdzenie 5 (SPT koncentruje opóźnienie na największym zadaniu).** +W ramach SPT największe zadanie ponosi większe opóźnienie bezwzględne niż +w jakimkolwiek innym harmonogramie. + +**Dowód.** Zdefiniuj opóźnienie bezwzględne jako $\Delta_i = C_i - p_i$ +(czas spędzony na oczekiwaniu, niezależny od własnego rozmiaru). W ramach +SPT największe zadanie zajmuje pozycję $n$ z: + +$$\Delta_{\max\text{-task}}^{\text{SPT}} = C_n - p_n = \sum_{i=1}^{n-1} p_i$$ + +Jest to suma czasów przetwarzania wszystkich pozostałych zadań — maksymalne +możliwe opóźnienie dla dowolnego pojedynczego zadania. W każdym +harmonogramie, w którym największe zadanie nie jest ostatnie, jego +opóźnienie jest ściśle mniejsze. Jednocześnie SPT przyznaje najmniejszemu +zadaniu zerowe opóźnienie ($\Delta_1^{\text{SPT}} = 0$). Całe obciążenie +kolejkowe jest przeniesione z małych zadań na duże. $\blacksquare$ + +SPT minimalizuje *łączne* opóźnienie (co jest dobre dla zagregowanej +efektywności) poprzez koncentrację opóźnienia na zadaniach najlepiej +zdolnych do jego absorpcji pod względem współczynnika spowolnienia. +Ale w wartościach bezwzględnych — godzinach spędzonych na oczekiwaniu — +największe zadanie ponosi pełne obciążenie. + +### 4.4 Niezmienniczość przepustowości + +**Twierdzenie 6 (Niezmienniczość przepustowości).** Całkowita praca +wykonana w dowolnym horyzoncie czasowym $T$ jest identyczna dla +wszystkich polityk szeregowania. + +**Dowód.** Wykonawca przetwarza pracę ze stałą szybkością. W dowolnym +horyzoncie $T \ge \sum p_i$ całkowita wykonana praca wynosi dokładnie +$\sum p_i$, niezależnie od kolejności. W przypadku stanu ustalonego +z ciągłymi napływami długookresowa przepustowość jest zdeterminowana +przez szybkość obsługi $\mu$ i jest całkowicie niezależna od +szeregowania: + +$$\lim_{T \to \infty} \frac{W(T)}{T} = \mu \quad \text{dla wszystkich harmonogramów } \sigma$$ + +$\blacksquare$ + +**Wniosek 6.1.** Zespół, który przechodzi z dowolnej polityki szeregowania +na SPT, zaobserwuje poprawę nieważonego średniego czasu realizacji przy +**zerowej zmianie rzeczywistej przepustowości**. Metryka się poprawia. +Wynik nie. + +### 4.5 Efekt złożony + +Łącząc Twierdzenia 4, 5 i 6: + +| Miara | Efekt optymalizacji nieważonej średniej | +|---------|--------------------------------------| +| Przepustowość (praca/czas) | Bez zmian (Twierdzenie 6) | +| Opóźnienie małych zadań | Zminimalizowane — zbliża się do zera (SPT) | +| Opóźnienie dużych zadań | **Zmaksymalizowane** — ponosi całe obciążenie kolejkowe (Twierdzenie 5) | +| Czas realizacji największego zadania | **Maksymalny możliwy**: $\sum p_i$ (Twierdzenie 4) | + +Wynikowy efekt netto na postrzeganą jakość jest negatywny, ponieważ: + +1. **Awersja do strat jest asymetryczna** [8]. Klient, którego zadanie + 100-godzinne zostaje depriorytetyzowane, doświadcza dużego, wyrazistego + negatywu. Klient, którego zadanie 1-godzinne zostaje przyspieszone, + doświadcza małego, często niezauważonego pozytywu. + +2. **Zadania wymagające dużego nakładu pracy korelują z klientami o wysokiej + wartości.** Duże zadania nieproporcjonalnie często pochodzą od głównych + klientów, złożonych kontraktów lub krytycznych potrzeb biznesowych. + +3. **Zagłodzenie kumuluje się.** W systemie ciągłym (Twierdzenie 3) duże + zadania mogą być **odraczane w nieskończoność**, ponieważ wciąż + napływają nowe małe zadania. + +**Twierdzenie 7 (Wynik główny).** Dla zespołu przetwarzającego zadania +o niejednorodnym rozmiarze przyjęcie nieważonego średniego czasu realizacji +jako metryki wydajnościowej: + +(a) Zapewnia **zerowy zysk produktywności** (Twierdzenie 6), jednocześnie +(b) **Przypisując maksymalny możliwy czas realizacji** największemu zadaniu + (Twierdzenie 4), oraz +(c) **Koncentrując całe opóźnienie kolejkowe** na największych zadaniach, + eliminując opóźnienie dla najmniejszych (Twierdzenie 5). + +Nie jest to kompromis. Metryka tworzy czysty transfer jakości obsługi +od klientów z zadaniami wymagającymi dużego nakładu pracy do klientów +z zadaniami o małym nakładzie pracy, bez żadnego zysku netto w postaci +wykonanej pracy. $\blacksquare$ + +--- + +# Część II: Systemy priorytetów + +## 5. Rozpad w warunkach klasyfikacji priorytetowej + +Poprzednie rozdziały dowiodły, że nieważony średni czas realizacji jest +obciążony, gdy zadania różnią się rozmiarem. Teraz pokażemy, że +wprowadzenie **systemu priorytetów** — stosowanego przez praktycznie +wszystkie rzeczywiste zespoły — powoduje, że metryka staje się nie tylko +obciążona, ale **aktywnie adwersaryczna** wobec deklarowanych celów +organizacji. + +### 5.1 Model rozszerzony: zadania z priorytetem + +Niech każde zadanie $i$ ma czas przetwarzania $p_i$ oraz klasę priorytetu +$q_i \in \{1, 2, 3, 4\}$, gdzie 1 jest najwyższym priorytetem (krytyczny), +a 4 najniższym (kosmetyczny/ulepszenie). Przypisz wagi priorytetów: + +$$w(q) = \begin{cases} 8 & q = 1 \text{ (Krytyczny)} \\ 4 & q = 2 \text{ (Wysoki)} \\ 2 & q = 3 \text{ (Średni)} \\ 1 & q = 4 \text{ (Niski)} \end{cases}$$ + +Konkretne wagi mają charakter ilustracyjny; wyniki obowiązują dla dowolnej +ściśle malejącej funkcji wagowej. Kluczową właściwością jest to, że +priorytet jest przypisywany na podstawie **wpływu biznesowego**, a nie +rozmiaru zadania. + +### 5.2 Metryka przeczy systemowi priorytetów + +**Twierdzenie 8 (Inwersja priorytet–rozmiar).** Gdy priorytet jest +niezależny od rozmiaru zadania, harmonogram minimalizujący nieważony +średni czas realizacji (SPT) będzie, w wartości oczekiwanej, realizował +zadania o niskim priorytecie przed zadaniami o wysokim priorytecie +i większym rozmiarze. + +**Dowód.** SPT porządkuje zadania rosnąco według $p_i$, niezależnie +od $q_i$. Rozważmy dwa zadania: + +- Zadanie A: $p_A = 40$ godzin, $q_A = 1$ (Krytyczne — np. awaria serwera) +- Zadanie B: $p_B = 0{,}5$ godziny, $q_B = 4$ (Niskie — np. kosmetyczna + poprawka interfejsu) + +SPT planuje B przed A. Nieważona średnia dla tej pary: + +$$\bar{C}^{\text{SPT}} = \frac{0.5 + 40.5}{2} = 20.5 \qquad \bar{C}^{\text{priority}} = \frac{40 + 40.5}{2} = 40.25$$ + +Metryka deklaruje SPT jako prawie **dwukrotnie lepsze** — mimo że +realizowana jest kosmetyczna poprawka, podczas gdy serwer nie działa. + +Ogólnie, gdy $q_i$ jest statystycznie niezależne od $p_i$, porządek +SPT ma **zerową korelację** z priorytetem. W praktyce zadania krytyczne +(awarie, incydenty bezpieczeństwa, utrata danych) często wymagają więcej +pracy niż zadania o niskim priorytecie, więc metryka jest +prawdopodobnie **antykorelowana** z systemem priorytetów. $\blacksquare$ + +### 5.3 Destrukcja informacji + +Nieważona średnia redukuje trójwymiarowe zadanie $(p_i, q_i, C_i)$ do +jednowymiarowego sygnału ($C_i$), a następnie uśrednia równomiernie. +Priorytet jest w ten sposób całkowicie odrzucany, a rozmiar niejawnie +odwracany. + +**Twierdzenie 9 (Destrukcja informacji).** Niech $I(\sigma)$ będzie +informacją wzajemną między niejawnym rankingiem priorytetów harmonogramu +(pozycją) a rzeczywistym przypisaniem priorytetu $q_i$. Dla SPT: + +$$I(\sigma_{\text{SPT}}) = 0 \quad \text{gdy } p_i \perp q_i$$ + +**Dowód.** SPT przypisuje pozycje wyłącznie na podstawie $p_i$. Gdy +$p_i$ i $q_i$ są niezależne, znajomość pozycji zadania w harmonogramie +SPT dostarcza zerowej informacji o jego priorytecie. $\blacksquare$ + +**Wniosek 9.1.** Zespół optymalizujący nieważony średni czas realizacji +prowadzi system szeregowania, który nie niesie żadnej informacji o własnej +klasyfikacji priorytetowej. Pole priorytetu w systemie zgłoszeń jest, +w odniesieniu do kolejności realizacji, dekoracyjne. + +Jest to przypadek tego, co Austin [18] nazywa fundamentalnym problemem +niekompletnego pomiaru: gdy system pomiarowy obejmuje tylko podzbiór +istotnych wymiarów, optymalizacja pomiaru systematycznie degraduje +wymiary niemierzone. + +### 5.4 Koszt opóźnienia ważony priorytetem + +Zdefiniuj **koszt opóźnienia ważony priorytetem** harmonogramu: + +$$D(\sigma) = \sum_{i=1}^{n} w(q_i) \cdot C_i$$ + +**Twierdzenie 10 (SPT a koszt opóźnienia ważony priorytetem).** Optymalnym +harmonogramem minimalizującym $D(\sigma)$ jest WSJF: porządkuj według +$w(q_i)/p_i$ malejąco [1, 5]. Porządek SPT — według $1/p_i$ malejąco — +całkowicie ignoruje priorytet i daje wyższe $D$ niż alternatywy +respektujące priorytet, gdy priorytet jest skorelowany z rozmiarem zadania. + +**Dowód.** Z argumentu wymiany zamiana sąsiednich zadań $i, j$ zmienia +$D$ o: + +$$\Delta D = w(q_j) \cdot p_i - w(q_i) \cdot p_j$$ + +Zamiana poprawia $D$, gdy $w(q_j)/p_j > w(q_i)/p_i$, ale $j$ jest +zaplanowane po $i$. Zatem optymalny porządek to malejący $w(q_i)/p_i$ +— reguła WSJF. SPT odpowiada WSJF tylko wtedy, gdy +$w(q_i) = \text{const}$ (wszystkie zadania mają równy priorytet). + +**Przykład.** Krytyczne ($w = 8$, $p = 3$) i Niskie ($w = 1$, $p = 2$): + +- SPT (Niskie najpierw): $D = 1 \cdot 2 + 8 \cdot 5 = 42$ +- WSJF (Krytyczne najpierw): $D = 8 \cdot 3 + 1 \cdot 5 = 29$ + +SPT generuje o 45% wyższy koszt opóźnienia ważony priorytetem. W praktyce +zadania krytyczne bywają większe (awarie, incydenty bezpieczeństwa), co +czyni tę rozbieżność systematyczną. $\blacksquare$ + +--- + +## 6. Proponowane rozwiązania + +### 6.1 Metryki ważone priorytetem + +Zastąp nieważony średni czas realizacji **Wynikiem Realizacji Ważonym +Priorytetem (PWCS)**: + +$$\text{PWCS}(\sigma) = \frac{\sum_{i=1}^{n} w(q_i) \cdot \frac{C_i}{p_i}}{\sum_{i=1}^{n} w(q_i)}$$ + +Jest to średnia współczynnika spowolnienia ważona priorytetem. Mierzy, +jak długo każde zadanie czekało w stosunku do swojego rozmiaru, z wagą +proporcjonalną do jego ważności. Im mniej, tym lepiej. + +**Właściwości:** + +1. **Respektuje priorytety.** Opóźnienia zadań krytycznych kosztują 8x + więcej niż opóźnienia zadań o niskim priorytecie. +2. **Sprawiedliwa wobec rozmiaru.** Używa współczynnika spowolnienia + $C_i / p_i$, więc duże zadania nie są karane za to, że są duże. +3. **Niepodatna na manipulację przez SPT.** Zmiana kolejności według + czasu przetwarzania nie poprawia systematycznie wyniku. +4. **Redukuje się do nieważonej średniej, gdy zadania są jednorodne.** + Ścisłe uogólnienie. + +### 6.2 Polityka optymalna: WSJF + +**Twierdzenie 11.** Harmonogram minimalizujący priorytetowo ważony czas +realizacji $\text{PWCT}(\sigma) = \sum w(q_i) \cdot C_i / \sum w(q_i)$ +przetwarza zadania w kolejności malejącego $w(q_i)/p_i$ — reguła +**Weighted Shortest Job First (WSJF)** [1, 5]. + +**Dowód.** Z argumentu wymiany (jak w Twierdzeniu 10) zamiana +sąsiednich zadań $i, j$ poprawia PWCT, gdy $w(q_j)/p_j > w(q_i)/p_i$, +ale $j$ jest zaplanowane po $i$. Optymalny porządek to zatem malejący +$w(q_i)/p_i$. $\blacksquare$ + +W ramach klasy priorytetowej sprowadza się to do SPT (najkrótsze +najpierw). Między klasami 4-godzinne zadanie krytyczne ($w/p = 2{,}0$) +ma pierwszeństwo przed 1-godzinnym zadaniem o niskim priorytecie +($w/p = 1{,}0$). + +**Zastrzeżenie praktyczne.** Czyste WSJF może umieścić drobne zadania +o niskim priorytecie przed dużymi zadaniami krytycznymi (15-minutowe +zadanie o niskim priorytecie ma $w/p = 1/0{,}25 = 4{,}0$, przewyższając +6-godzinne zadanie krytyczne przy $w/p = 8/6 = 1{,}33$). W praktyce +łagodzi się to, narzucając **ścisłą kolejność klas priorytetowych** +i stosując WSJF tylko *w ramach* każdej klasy. + +### 6.3 Przykład zastosowany: dział obsługi IT + +Rozważmy zespół IT z następującą kolejką zgłoszeń: + +| Zgłoszenie | Priorytet | Typ | Szac. godziny | +|--------|----------|------|-----------| +| T1 | P1 (Krytyczny) | Awaria serwera pocztowego | 6 | +| T2 | P2 (Wysoki) | Awaria VPN dla zespołu zdalnego | 4 | +| T3 | P3 (Średni) | Konfiguracja laptopa nowego pracownika | 2 | +| T4 | P4 (Niski) | Aktualizacja polityki tapet pulpitu | 0,5 | +| T5 | P3 (Średni) | Instalacja licencji oprogramowania | 1 | +| T6 | P1 (Krytyczny) | Awaria kopii zapasowej bazy danych | 3 | +| T7 | P2 (Wysoki) | Flota drukarek offline | 2 | +| T8 | P4 (Niski) | Archiwizacja starego folderu współdzielonego | 0,25 | + +**Kolejność SPT** (optymalizacja nieważonej średniej): T8, T4, T5, T3, T7, T6, T2, T1 + +| Poz. | Zgłoszenie | Priorytet | Godziny | Realizacja | Spowolnienie | +|-----|--------|----------|-------|------------|----------| +| 1 | T8 (archiwizacja folderu) | P4 Niski | 0,25 | 0,25 | 1,0 | +| 2 | T4 (tapety) | P4 Niski | 0,5 | 0,75 | 1,5 | +| 3 | T5 (oprogramowanie) | P3 Średni | 1 | 1,75 | 1,75 | +| 4 | T3 (laptop) | P3 Średni | 2 | 3,75 | 1,875 | +| 5 | T7 (drukarki) | P2 Wysoki | 2 | 5,75 | 2,875 | +| 6 | T6 (kopie zapasowe) | P1 Kryt. | 3 | 8,75 | 2,917 | +| 7 | T2 (VPN) | P2 Wysoki | 4 | 12,75 | 3,188 | +| 8 | T1 (poczta) | P1 Kryt. | 6 | 18,75 | 3,125 | + +**Praktyczne WSJF** (najpierw klasa priorytetowa, SPT w ramach klasy): + +| Poz. | Zgłoszenie | Priorytet | Godziny | Realizacja | +|-----|--------|----------|-------|------------| +| 1 | T6 (kopie zapasowe) | P1 Kryt. | 3 | 3 | +| 2 | T1 (poczta) | P1 Kryt. | 6 | 9 | +| 3 | T7 (drukarki) | P2 Wysoki | 2 | 11 | +| 4 | T2 (VPN) | P2 Wysoki | 4 | 15 | +| 5 | T5 (oprogramowanie) | P3 Średni | 1 | 16 | +| 6 | T3 (laptop) | P3 Średni | 2 | 18 | +| 7 | T8 (archiwizacja) | P4 Niski | 0,25 | 18,25 | +| 8 | T4 (tapety) | P4 Niski | 0,5 | 18,75 | + +**Porównanie:** + +| Metryka | SPT | Praktyczne WSJF | Lepsze | +|--------|-----|----------------|--------| +| Nieważona średnia realizacji | **6,56 godz.** | 13,63 godz. | SPT | +| Średni czas rozwiązania P1 | 13,75 godz. | **6 godz.** | WSJF | +| Średni czas rozwiązania P2 | 9,25 godz. | **13 godz.** | SPT | +| Czas naprawy serwera pocztowego | 18,75 godz. | **9 godz.** | WSJF | +| Czas naprawy kopii zapasowych | 8,75 godz. | **3 godz.** | WSJF | +| Czas aktualizacji tapet | **0,75 godz.** | 18,75 godz. | SPT | + +Zagregowane priorytetowo ważone czasy realizacji są niemal identyczne +(PWCT: 10,2 vs 10,17), ponieważ agregacja ukrywa szkody dystrybucyjne. +Prawdziwa różnica tkwi w rozbiciu **na klasy priorytetowe**: serwer +pocztowy nie działa przez 18,75 godziny w ramach SPT wobec 9 godzin +w ramach WSJF. Kopie zapasowe bazy danych zawodzą przez 8,75 godziny +wobec 3. + +Metryka nieważona z pewnością raportuje SPT jako **ponad dwukrotnie +bardziej efektywne** (6,56 vs 13,63), nagradzając zespół, który +aktualizował tapety pulpitu, gdy serwer pocztowy płonął. + +### 6.4 Zalecany zestaw metryk + +Nawet priorytetowo ważone metryki zagregowane mogą nie rozróżniać dobrych +od złych harmonogramów, ponieważ agregacja ukrywa szkody dystrybucyjne. +Żadna pojedyncza metryka nie wystarcza. Kompletny system pomiarowy +powinien śledzić: + +| Metryka | Co mierzy | Formuła | +|--------|-----------------|---------| +| **Średnia realizacji według klasy priorytetowej** | Responsywność per klasa | $\bar{C}$ filtrowane według $q$ | +| **Średni czas rozwiązania P1** | Reakcja na incydenty krytyczne | $\bar{C}$ dla $q = 1$ | +| **Przepustowość** | Surowa zdolność robocza | Roboczogodziny wykonane / czas kalendarzowy | +| **Naruszenia starzenia** | Zapobieganie zagłodzeniu | Zadania przekraczające SLA według priorytetu | +| **Maks. czas realizacji (P1/P2)** | Najgorsza reakcja krytyczna | $\max(C_i)$ dla $q \le 2$ | + +Kluczowy wniosek: **metryki per klasa priorytetowa** ujawniają awarie +szeregowania, które metryki zagregowane ukrywają. + +--- + +# Część III: Dynamika organizacyjna + +## 7. Gdy metryka jest produktem + +Rozdziały 2–6 zakładają, że satysfakcja klienta jest funkcją +*doświadczonej jakości obsługi*. Istnieje jednak scenariusz, w którym +to założenie zawodzi i cała argumentacja się rozpada. + +### 7.1 Metryka autoreferencyjne + +Załóżmy, że dostawca raportuje nieważoną średnią bezpośrednio klientowi +— na pulpicie nawigacyjnym, w raporcie SLA, na stronie marketingowej — +a satysfakcja klienta wynika głównie z *tej liczby*: + +$$U_{\text{client}} = f\!\left(\bar{C}(\sigma)\right), \quad f' < 0$$ + +W tym modelu SPT rzeczywiście maksymalizuje satysfakcję klienta +(Twierdzenie 1). Przepustowość pozostaje niezmieniona (Twierdzenie 6). +Wynik biznesowy się poprawia: ta sama praca wykonana, zadowolony klient. + +**Wszystkie twierdzenia w tej pracy pozostają matematycznie poprawne. +Ale wniosek się odwraca.** Metryka nie jest już przybliżeniem, które +można manipulować — *jest* jakością obsługi, ponieważ klient zgodził się +oceniać jakość na podstawie zagregowanej liczby. + +### 7.2 Ekonomia + +Tworzy to spójną, stabilną równowagę: + +| Aktor | Zachowanie | Wynik | +|-------|----------|---------| +| Dostawca | Optymalizuje nieważoną średnią (SPT) | Metryka się poprawia, brak dodatkowej pracy | +| Klient | Czyta pulpit nawigacyjny, widzi niską średnią | Raportuje satysfakcję | +| Zarząd | Widzi zadowolonego klienta + dobrą metrykę | Nagradza zespół | + +Dostawca uzyskuje satysfakcję przy zerowym koszcie krańcowym, +optymalizując liczbę, którą klient zaakceptował jako przybliżenie jakości. + +### 7.3 Kruchość + +Ta równowaga jest stabilna tylko tak długo, jak klient nigdy nie zbada +własnego doświadczenia. Rozpada się, gdy: + +1. **Klient sprawdza własne zgłoszenie.** Dyrektor techniczny, którego + serwer pocztowy nie działał przez 18,75 godziny, nie zostanie + uspokojony informacją „Średni czas rozwiązania: 6,56 godziny". + Klienci najbardziej skłonni do weryfikacji to dokładnie ci, którzy + otrzymują najgorszą obsługę (Twierdzenie 4). + +2. **Konkurent oferuje SLA per zgłoszenie.** „P1 rozwiązane w ciągu + 4 godzin" pokonuje „średnie rozwiązanie poniżej 7 godzin" dla + każdego klienta z krytycznymi potrzebami. + +3. **Zespół internalizuje metrykę.** Jeśli zespół wierzy, że metryka + odzwierciedla rzeczywistą wydajność, traci zdolność rozpoznawania, + kiedy praca krytyczna jest zaniedbywana. Metryka staje się zagrożeniem + epistemicznym. + +### 7.4 Ogólny wzorzec + +Ten wzorzec — przybliżenie zastępuje jakość, przybliżenie jest +optymalizowane, jakość odchodzi, system jest stabilny do momentu +zderzenia z rzeczywistością — powtarza się w wielu dziedzinach. +Muller [19] dokumentuje go obszernie jako „fiksację na metrykach"; +Campbell [24] sformalizował korumpujący wpływ używania wskaźników +jako celów. + +| Dziedzina | Metryka zastępcza | Rzeczywista jakość | Rozbieżność | +|--------|-------------|-------------------|------------| +| Wsparcie IT | Śr. czas rozwiązania | Czas pracy systemów krytycznych | Serwer niedostępny 19 godz., średnia mówi 6,5 | +| Edukacja | Wyniki testów | Faktyczne uczenie się | Nauczanie pod test | +| Ochrona zdrowia | Przepustowość pacjentów | Wyniki leczenia pacjentów | Szybsze wypisy, wyższa readmisja | +| Finanse | Zyski kwartalne | Wartość długoterminowa | Cięcia kosztów pompują EPS, erodują zdolności | +| Oprogramowanie | Velocity (story points) | Jakość produktu | Inflacja punktów, funkcje wykonane w połowie | + +### 7.5 Asymetria informacji + +Modeluj system jako grę między dostawcą (D) a klientem (K). D obserwuje +indywidualne $\{C_i\}$ i wybiera $\sigma$; K obserwuje jedynie +$\bar{C}(\sigma)$. Jest to problem **pokusy nadużycia** [10]: optymalną +strategią D jest minimalizacja obserwowalnego sygnału niezależnie od +nieobserwowalnego rozkładu. + +Równowaga jest **równowagą łączącą** [9]: raportowana metryka D wygląda +identycznie niezależnie od bazowej wydajności ważonej priorytetowo. Jest +stabilna, dopóki K nie uzyska dostępu do indywidualnych wartości $C_i$ +— poprzez portal klienta, transparentność konkurenta lub dostatecznie +bolesny incydent. + +### 7.6 Niewygodna konkluzja + +Uczciwa odpowiedź na pytanie „czy optymalizacja nieważonej średniej +szkodzi biznesowi?" brzmi: **niekoniecznie, o ile klient nigdy nie zajrzy +za liczbę**. Uczciwa odpowiedź na pytanie „czy to jest zrównoważone?" +brzmi: jest to dokładnie tak zrównoważone jak każdy system, w którym +sprzedający wie więcej niż kupujący — stabilny przez dłuższy czas, +a potem gwałtowny upadek, gdy asymetria zostaje przebita. + +--- + +## 8. Psychologiczny koszt wiedzy + +Rozdział 7 modelował dostawcę jako jednolity podmiot. Ale zespoły +składają się z jednostek. Gdy członek zespołu rozumie dowód — gdy *wie*, +że metryka jest syntetyczna, że pulpit nawigacyjny jest teatrem, że +serwer pocztowy wciąż nie działa, podczas gdy on zamyka zgłoszenia +dotyczące tapet — pojawia się nowy koszt, który model równowagi pominął. + +### 8.1 Ukryta zmienna: świadomość zespołu + +| Aktor | Obserwuje indywidualne $C_i$ | Obserwuje $\bar{C}$ | Rozumie dowód | +|-------|--------------------------|--------------------|-----------------------| +| Zarząd | Być może | Tak | Różnie | +| Członek zespołu | **Tak** | Tak | **Tak** (w tym scenariuszu) | +| Klient | Nie | Tak | Nie | + +Członek zespołu ma pełną informację. Widzi kolejkę zgłoszeń. Wie, że +serwer pocztowy nie działa od 7 rano. Wie, że zamyka zgłoszenie dotyczące +tapety, bo to poprawia liczbę. I wie *dlaczego*. + +### 8.2 Dysonans poznawczy przy pełnej informacji + +Dysonans poznawczy [11] powstaje, gdy jednostka utrzymuje sprzeczne +przekonania. Bez zrozumienia *dlaczego*, sprzeczność można +zracjonalizować: „zarząd wie lepiej". Zrozumienie dowodu usuwa +dwuznaczność. Członek zespołu utrzymuje teraz: + +- **Przekonanie A:** „Jestem kompetentnym profesjonalistą. Moim zadaniem + jest rozwiązywanie ważnych problemów." +- **Przekonanie B:** „Zamykam zgłoszenie dotyczące tapety, podczas gdy + serwer pocztowy nie działa, ponieważ metryka jest matematycznie + obciążona (Twierdzenie 1), zmiana kolejności nie daje żadnej + przepustowości (Twierdzenie 6), a jedynym beneficjentem jest pulpit + nawigacyjny (Rozdział 7). Mogę to udowodnić." + +Dysonans jest teraz *nośny*. Dostępne rozwiązania — porzucenie tożsamości +zawodowej, odrzucenie dowodu, walka o zmianę lub odejście — każde niesie +ze sobą koszty, które wcześniej nie istniały. + +### 8.3 Teoria autodeterminacji: trzy naruszone potrzeby + +Teoria autodeterminacji Deciego i Ryana [12, 13] identyfikuje trzy +potrzeby predykujące motywację wewnętrzną: + +**Autonomia.** Metryka ogranicza wybory w sposób, który członek zespołu +wie, że jest matematycznie suboptymalny. Pracownik, który rozumie, że +proces jest dowodliwie kontraproduktywny, nie może czuć się autonomiczny, +podążając za nim. + +**Kompetencja.** Metryka nagradza *pozorną* efektywność (niskie $\bar{C}$), +będąc jednocześnie niezmienna wobec *faktycznej* efektywności +(Twierdzenie 6). Autentyczna kompetencja — naprawienie serwera pocztowego +najpierw — jest *karana* przez metrykę. + +**Relacyjność.** Członek zespołu wie, że serwer pocztowy klienta nie +działa. Mógłby pomóc. Zamiast tego aktualizuje tapety — nie dlatego, że +to komukolwiek pomaga, ale dlatego, że pomaga to liczbie. Połączenie +między pracą a ludzkim wpływem zostało zerwane, a członek zespołu widzi +zerwane końce. + +### 8.4 Uraz moralny + +Uraz moralny [16, 17] to trwała szkoda spowodowana „popełnianiem, +niezapobieżeniem, byciem świadkiem lub dowiedzeniem się o czynach, +które naruszają głęboko zakorzenione przekonania moralne" [17]. Pojęcie +to zostało od tego czasu rozszerzone na konteksty biznesowe [25]. Kluczowe +rozróżnienie od wypalenia: **wypalenie to wyczerpanie z robienia zbyt +wiele. Uraz moralny to szkoda z robienia złej rzeczy.** + +Członek zespołu, który wie, że serwer pocztowy nie działa, wie, że +powinien go naprawić, zamiast tego zamyka zgłoszenie dotyczące tapety +i robi to, ponieważ metryka tego wymaga, doświadcza strukturalnych +warunków urazu moralnego. + +### 8.5 Wyuczona bezradność i fatalizm metryczny + +Wyuczona bezradność Seligmana [14, 15] opisuje, jak ekspozycja na +niekontrolowalne negatywne wyniki prowadzi do pasywności. Sekwencja: + +1. Metryka jest wadliwa (dowód zrozumiany). +2. Postulowanie zmiany. +3. Odrzucenie („liczby są dobre, nie kołysz łódką"). +4. Powtórzenie z malejącym przekonaniem. +5. Stan terminalny: „Metryka jest, jaka jest. Będę po prostu zamykał + zgłoszenia." + +To nie jest lenistwo. To racjonalna odpowiedź na system, który karze +poprawne zachowanie i nagradza niepoprawne, gdy jednostka nie ma władzy, +by zmienić system. + +### 8.6 Spirala selekcji adwersarycznej + +Łącząc równowagę z Rozdziału 7 z dynamiką rotacji: + +1. Organizacja przyjmuje nieważoną średnią. Metryka wygląda dobrze (SPT). +2. Świadomi, kompetentni członkowie zespołu doświadczają kosztów + psychologicznych (8.2–8.5). +3. Ci członkowie odchodzą. Zastępowani są przez osoby, które nie rozumieją + wad metryki lub nie dbają o to. +4. Metryka nadal wygląda dobrze — zawsze tak jest w ramach SPT, + niezależnie od kompetencji zespołu (Wniosek 6.1). +5. Rzeczywista jakość obsługi spada, ale metryka nie jest w stanie tego + wykryć (Wniosek 9.1). +6. Powrót do kroku 1. + +Metryka selekcjonuje *przeciwko* osobom, które ulepszyłyby system, +i *na rzecz* osób, które nie będą go kwestionować. System stabilizuje +się na niższym poziomie kompetencji, niewidocznym dla własnego aparatu +pomiarowego. + +### 8.7 Pełny model kosztów + +| Rozdział 7 (widoczne) | Rozdział 8 (ukryte) | +|---------------------|---------------------| +| Klient zadowolony (dobra liczba) | Zespół niezadowolony (zła rzeczywistość) | +| Przepustowość bez zmian | Wysiłek uznaniowy wycofany | +| Metryka się poprawia | Kompetentni członkowie odchodzą | +| Ekonomia biznesowa stabilna | Kompetencje instytucjonalne degradują się | + +Działają one w różnych skalach czasowych: równowaga jest widoczna +kwartalnie; degradacja kompetencji jest widoczna w skali lat. Pełny +model brzmi: **metryka działa i jest destrukcyjna, a destrukcja jest +niewidoczna dla metryki.** Metryka to świeża farba na skorodowanym +zbrojeniu. + +--- + +## 9. Internalizacja menedżerska: rozwiązanie operacyjne + +Rozdziały 2–6 mówią: odrzuć metrykę. Rozdział 7 mówi: metryka działa +(dla biznesu). Rozdział 8 mówi: niszczy zespół. W praktyce większość +menedżerów nie może jednostronnie zmienić metryki. Najlepszym +rozwiązaniem jest reforma metryki w całej firmie. *Operacyjnym* +rozwiązaniem jest to, co pojedynczy świadomy menedżer może zrobić +już teraz. + +### 9.1 Strategia + +Menedżer, który rozumie dowód, może **zinternalizować ograniczenia +metryki bez propagowania ich na zespół**: + +1. **Szereguj głównie według priorytetu.** Zespół pracuje nad zadaniami + krytycznymi w pierwszej kolejności. +2. **Taktycznie przeplataj małe zadania.** Gdy małe zadanie o niskim + priorytecie może być zrealizowane bez istotnego opóźniania pracy + o wysokim priorytecie, wykonaj je. Nie dlatego, że metryka tego + wymaga, ale dlatego, że też musi być wykonane i kosztuje niemal nic. +3. **Nigdy nie ujawniaj metryki jako motywacji.** „Załatw to szybkie + zadanie, czekając na odpowiedź zwrotną od dostawcy w sprawie P1" — + a nie „musimy obniżyć naszą średnią". Wewnętrzna motywacja zespołu + pozostaje nienaruszona (Rozdział 8). Menedżer bierze na siebie + ciężar zarządzania metryką. + +### 9.2 Formalizacja + +Problem menedżera to optymalizacja z ograniczeniami: + +$$\min_{\sigma} \sum_{i=1}^{n} w(q_i) \cdot C_i \quad \text{pod warunkiem} \quad \bar{C}(\sigma) \le \bar{C}_{\text{target}}$$ + +**Twierdzenie 12 (Ograniczony koszt metryczny szeregowania +priorytetowego).** Menedżer, który stosuje SPT *w ramach* każdej klasy +priorytetowej i kolejność priorytetową *między* klasami, uzyska metrykę +zbliżoną do wartości optymalnej SPT — luka wynika wyłącznie z inwersji +międzyklasowych. + +**Szkic dowodu.** W ramach każdej klasy priorytetowej SPT jest bezkosztowe +(wszystkie zadania mają równy priorytet). Jedynym odchyleniem od +globalnego SPT jest kolejność międzyklasowa. Każda inwersja międzyklasowa +kosztuje co najwyżej $p_{\text{large}} - p_{\text{small}}$ w sumie +nieważonej, a te inwersje są ograniczone liczbą klas. W praktyce luka +wynosi typowo 10–20% wartości optymalnej SPT. $\blacksquare$ + +### 9.3 Menedżer jako bariera informacyjna + +| Warstwa | Widzi metrykę | Widzi priorytety | Widzi dowód | +|-------|-----------|----------------|------------| +| Organizacja | Tak | Nominalnie | Nie | +| Menedżer | Tak | Tak | **Tak** | +| Zespół | Nie (osłonięty) | Tak | Nieistotne | +| Klient | Tak (pulpit nawigacyjny) | Przez SLA | Nie | + +Menedżer jest jedynym aktorem posiadającym wszystkie trzy elementy +informacji. Nie jest to manipulacja — wykonuje właściwą pracę we +właściwej kolejności, a metryka okazuje się akceptowalna, ponieważ +SPT wewnątrzklasowe jest bezkosztowe. + +### 9.4 Rozpad w warunkach konkurencji + +Strategia ta zawodzi, gdy metryka staje się **konkurencyjna między +zespołami**. + +**Przypadek 1: Kooperacyjny** — Zespoły mierzone pod kątem parytetowości, +nie rankingu. Każdy menedżer niezależnie stosuje strategię internalizacji. +Metryka jest dekoracyjna, ale nieszkodliwa. Jest to **gra koordynacyjna** +ze stabilną równowagą kooperacyjną. + +**Przypadek 2: Konkurencyjny** — Zespoły rankingowane według $\bar{C}$. +Jest to **dylemat więźnia**: + +| | Zespół B: Priorytet | Zespół B: SPT | +|---|---|---| +| **Zespół A: Priorytet** | (Dobra praca, Dobra praca) | (A wygląda źle, B wygląda dobrze) | +| **Zespół A: SPT** | (A wygląda dobrze, B wygląda źle) | (Oba wyglądają dobrze, oba robią złą pracę) | + +Równowaga Nasha to (SPT, SPT). Strategia internalizacji jest równowagą +kooperacyjną, która **nie jest stabilna w warunkach konkurencji**. + +### 9.5 Zakres stosowania + +| Warunek | Wykonalność | +|-----------|-----------| +| Metryka używana do kontroli stanu / parytetowości | **Wykonalne** | +| Metryka widoczna, ale nierangowana | **Wykonalne** | +| Metryka rangowana między zespołami | **Kruche** — wymaga współpracy wszystkich menedżerów | +| Metryka powiązana z wynagrodzeniem / zasobami | **Niewykonalne** — dominuje dylemat więźnia | +| Reforma metryki możliwa na poziomie organizacji | **Zbędne** — napraw metrykę bezpośrednio | + +**Najlepszym rozwiązaniem jest reforma w skali całej firmy. Operacyjnym +rozwiązaniem jest menedżer, który rozumie ten dowód, osłania swój zespół +przed metryką, szereguje według priorytetu i stosuje SPT wyłącznie +w ramach klas priorytetowych, aby utrzymać liczbę na rozsądnym poziomie.** + +--- + +# Część IV: Ocena + +## 10. Adwokat diabła + +Uczciwość intelektualna wymaga uznania, gdzie argumentacja ma swoje +ograniczenia. + +### 10.1 Prostota ma rzeczywistą wartość + +**Argument.** Nieważona średnia nie wymaga wag priorytetowych, estymacji +rozmiaru zadania ani kalibracji. + +**Ocena: Prawda.** Ale metryka nieważona nie unika założeń — *ukrywa* je, +niejawnie ustawiając wszystkie wagi na 1 i wszystkie rozmiary na 1. +Znana-niedokładna estymacja rozmiaru zadania jest wciąż bardziej +informatywna niż niejawne założenie, że wszystkie rozmiary są równe. + +### 10.2 Minimalizacja liczby osób czekających + +**Argument.** SPT minimalizuje łączną liczbę osobogodzin oczekiwania. +Jeśli każde zadanie reprezentuje jednego klienta, jest to optymalne. + +**Ocena: Matematycznie poprawne.** Jeśli prowadzisz biuro obsługi +i czas każdej osoby jest jednakowo cenny, SPT jest właściwą polityką. +Przestaje działać, gdy zadania nie odpowiadają klientom w stosunku 1:1, +koszt oczekiwania nie jest jednolity lub metryka jest używana do +oceny zespołów, a nie obsługi dosłownej kolejki. + +### 10.3 SPT jako heurystyka triażowa + +**Argument.** Gdy rozmiary zadań skupiają się ciasno, SPT zbliża się +do FIFO, a nieważona średnia zbliża się do średniej ważonej. + +**Ocena: Poprawne.** Współczynnik zmienności $CV = \sigma_p / \bar{p}$ determinuje nasilenie zniekształcenia: + +| $CV$ | Rozkład rozmiarów zadań | Zniekształcenie | +|------|----------------------|------------| +| < 0,3 | Ciasny (centrum telefoniczne) | Pomijalne | +| 0,3 – 1,0 | Umiarkowany (mieszane IT) | Umiarkowane | +| > 1,0 | Szeroki (typowa kolejka IT) | Znaczne | + +Typowy dział IT obejmuje zakres od 15 minut do 40+ godzin ($CV > 2$). +Zniekształcenie nie jest przypadkiem brzegowym — jest stanem domyślnym. + +### 10.4 Manipulacja wymaga złej woli + +**Argument.** Twierdzenia pokazują, że metryka *może* być manipulowana, +nie że *będzie* manipulowana. + +**Ocena: To jest najsilniejszy kontrargument.** Jeśli metryka jest czysto +informacyjna i nigdy nie wpływa na zachowanie, zachęta do manipulacji +jest nieobecna. Jednak każda metryka raportowana zarządowi, powiązana +z OKR-ami lub omawiana na retrospektywach będzie wpływać na zachowanie. +Jest to prawo Goodharta [6, 7] — i stosuje się do zespołów o dobrych +intencjach równie niezawodnie jak do cyniczych. Dryf następuje +organicznie: zamknięcie trzech łatwych zgłoszeń „czuje się produktywne", +a metryka potwierdza to odczucie. + +### 10.5 Kiedy nieważona średnia jest uzasadniona + +Metryka jest uzasadniona **tylko gdy wszystkie cztery warunki są +spełnione jednocześnie**: + +1. Rozmiary zadań są w przybliżeniu jednorodne ($CV < 0{,}3$) +2. Brak różnicowania priorytetów (wszystkie zadania jednakowo ważne) +3. Każde zadanie reprezentuje dokładnie jednego klienta +4. Metryka nie jest używana do oceniania, nagradzania ani kierowania + zachowaniem + +Te warunki są rzadko spełniane w systemach, w których metryka jest +najczęściej stosowana. + +--- + +## 11. Praca pokrewna + +Niniejsza praca znajduje się na przecięciu kilku nurtów literaturowych, +które dotychczas nie były ze sobą powiązane. + +### 11.1 Teoria szeregowania i sprawiedliwość + +Smith [1] ustanowił wynik optymalności SPT i regułę WSJF w 1956 roku. +Conway, Maxwell i Miller [2] opracowali kompleksowy podręcznik. +Sprawiedliwość polityk szeregowania opartych na rozmiarze była +przedmiotem debaty w planowaniu systemów komputerowych: Bansal +i Harchol-Balter [22] zbadali niesprawiedliwość SRPT; Wierman +i Harchol-Balter [23] sformalizowali klasyfikacje sprawiedliwości +w porównaniu z Processor-Sharing; Angel, Bampis i Pascual [21] +zmierzyli jakość harmonogramów SPT w odniesieniu do kryteriów +sprawiedliwej optymalności. + +Ta wcześniejsza praca analizuje sprawiedliwość w szeregowaniu CPU +i serwerów. Niniejsza praca stosuje te same wyniki matematyczne do +*zarządzania zadaniami organizacyjnymi*, gdzie „planiścią" jest +ludzki zespół, „zadaniami" są żądania klientów z priorytetami +o wpływie biznesowym, a „funkcją celu" jest metryka zarządcza. +Mechanizm jest identyczny; konsekwencje różnią się, ponieważ +szeregowanie organizacyjne posiada systemy priorytetów, relacje +z klientami i koszty psychologiczne, których szeregowanie CPU nie ma. + +### 11.2 Dysfunkcja pomiarowa + +Austin [18] dowiódł, że niekompletny pomiar — mierzenie tylko podzbioru +istotnych wymiarów — tworzy zachęty do optymalizacji mierzonych wymiarów +kosztem niemierzonych, oraz że efekt ten jest nie tylko możliwy, ale +*nieunikniony*, gdy pomiar jest powiązany z nagrodami. Jego ramowanie +asymetrii informacyjnej ściśle koresponduje z Rozdziałem 7. Niniejsza +praca dostarcza konkretny mechanizm matematyczny (Twierdzenia 1–2) dla +przypadku szeregowania zadań i rozszerza argumentację przez psychologię +(Rozdział 8), aby prześledzić pełny łańcuch szkód organizacyjnych. + +Muller [19] udokumentował „fiksację na metrykach" w edukacji, ochronie +zdrowia, policji i finansach, dostarczając obszernych dowodów empirycznych +dla wzorców teoretyzowanych w Rozdziale 7.4. Campbell [24] sformalizował +korumpujący wpływ używania wskaźników jako celów, uzupełniając +oryginalną obserwację Goodharta [6] i uogólnienie Strathern [7]. + +Bevan i Hood [26] empirycznie udokumentowali zachowania manipulacyjne +w angielskim publicznym systemie ochrony zdrowia — w tym dokładne wzorce +„trafienia w cel i chybienia sensu" opisane w naszym Rozdziale 5.2. + +### 11.3 Psychologiczne koszty dysfunkcji metrycznej + +Zastosowanie urazu moralnego (Shay [16], Litz i in. [17]) do kontekstów +biznesowych ma niedawny precedens: badanie z 2024 roku opublikowane +w *Journal of Business Ethics* [25] wprost rozszerzyło ten konstrukt na +miejsca pracy nastawione na zysk, znajdując warunki strukturalne podobne +do opisanych w Rozdziale 8.4. Moore [27] przeanalizował moralne +*odłączenie* — restrukturyzację poznawczą umożliwiającą nieetyczne +zachowanie pod presją organizacyjną. Niniejsza praca zajmuje się +komplementarnym zjawiskiem: szkodą dla jednostek, które *odmawiają* +odłączenia. + +### 11.4 Co jest nowe + +Poszczególne składniki — optymalność SPT, prawo Goodharta, dysfunkcja +pomiarowa, uraz moralny — wszystkie mają precedens. Wkłady niniejszej +pracy to: + +1. **Prawo zachowania (Twierdzenie 2) użyte preskryptywnie** — jako + konstruktywny argument, że czas realizacji ważony pracą *nie może* + być manipulowany, a nie jako teoretyczny wynik z teorii szeregowania. + +2. **Konkretny dowód, że klasy priorytetowe czynią metrykę algebraicznie + adwersaryczną** (Twierdzenia 8–9) — nie jedynie empirycznie złą, ale + strukturalnie sprzeczną, z zerową informacją wzajemną między + harmonogramem a systemem priorytetów. + +3. **Zintegrowany łańcuch** od dowodu matematycznego przez asymetrię + informacyjną przez szkodę psychologiczną po spiralę selekcji + adwersarycznej — śledzący pojedynczą metrykę od Smitha (1956) do + wydrążenia organizacyjnego. + +4. **Strategia internalizacji menedżerskiej** (Rozdział 9) z formalną + analizą teoriogrową jej stabilności i warunków rozpadu w warunkach + konkurencji międzyzespołowej. + +5. **Zastosowanie teorii szeregowania do krytyki zarządzania + organizacyjnego** — dowodzące, że powszechnie stosowana metryka + zespołowa posiada konkretne, wymierne patologie, zamiast argumentować + na podstawie anegdot lub ogólnych zasad. + +--- + +## 12. Wnioski + +Nieważony średni czas realizacji jest **obciążoną statystyką**, która: + +1. **Może być manipulowana** przez politykę szeregowania (Twierdzenie 1), + w przeciwieństwie do czasu realizacji ważonego pracą, który jest + niezmienny względem harmonogramu (Twierdzenie 2). +2. **Zachęca do zagłodzenia** dużych zadań (Twierdzenie 3). +3. **Degraduje satysfakcję klienta** przy zerowym kompensującym zysku + produktywności (Twierdzenie 7). +4. **Aktywnie przeczy systemom priorytetów**, niosąc zerową informację + o klasyfikacji wpływu biznesowego (Twierdzenie 9). +5. **Całkowicie ignoruje priorytet** w swojej rekomendacji szeregowania, + wytwarzając suboptymalny koszt opóźnienia ważony priorytetem, ilekroć + priorytet i rozmiar nie są doskonale odwrotnie skorelowane + (Twierdzenie 10). + +Metryka, którą można poprawić przez zmianę kolejności pracy — bez +wykonywania jakiejkolwiek dodatkowej pracy — mierzy politykę +szeregowania, nie zdolność systemu. W połączeniu z systemem priorytetów +rekomenduje harmonogram, który wyrządza największą szkodę pracy +o najwyższym priorytecie. + +Gdy metryka jest raportowana klientom, tworzy asymetrię informacyjną +(Rozdział 7), której równowaga biznesowa jest rentowna, ale krucha. +Gdy członkowie zespołu rozumieją jej wady, narusza ich motywację +wewnętrzną i selekcjonuje na rzecz odejścia najkompetentniejszych +osób (Rozdział 8). Pojedynczy świadomy menedżer może częściowo +łagodzić te efekty poprzez optymalizację z ograniczeniami (Rozdział 9), +ale ta strategia kooperacyjna nie jest stabilna w warunkach konkurencji +międzyzespołowej. + +Nieważona średnia jest uzasadniona jedynie w wąskich warunkach +(Rozdział 10.5): jednorodne rozmiary zadań, brak priorytetów, +jednoznaczne odwzorowanie klient–zadanie i brak wpływu behawioralnego. +Te warunki są rzadko spełniane. + +**Nieważony średni czas realizacji nie jest sprawiedliwą ani trafną miarą +wydajności realizacji zadań. Jego przyjęcie jako metryki zespołowej +w sposób racjonalny doprowadzi do zagłodzenia złożonej pracy, naruszenia +deklarowanych priorytetów, nierównych wyników dla klientów oraz iluzji +produktywności tam, gdzie jej nie ma.** + +Najlepszym rozwiązaniem jest reforma metryki organizacyjnej. Operacyjnym +rozwiązaniem jest menedżer, który rozumie ten dowód. + +--- + +## Literatura + +### Teoria szeregowania + +[1] Smith, W. E. (1956). Various optimizers for single-stage production. +*Naval Research Logistics Quarterly*, 3(1–2), 59–66. +doi:[10.1002/nav.3800030106](https://doi.org/10.1002/nav.3800030106) + +> Źródło wyniku optymalności SPT (Twierdzenie 1), reguły ważonego czasu +> realizacji $w_i/p_i$ malejąco (WSJF, Twierdzenie 11) oraz techniki +> dowodu opartej na zamianie sąsiednich zadań (argument wymiany) +> stosowanej w całej pracy. + +[2] Conway, R. W., Maxwell, W. L., & Miller, L. W. (1967). *Theory of +Scheduling*. Addison-Wesley. + +> Standardowe podręcznikowe opracowanie teorii szeregowania +> jednoprocesorowego, rozszerzające wyniki Smitha. + +[3] Little, J. D. C. (1961). A proof for the queuing formula: L = λW. +*Operations Research*, 9(3), 383–387. +doi:[10.1287/opre.9.3.383](https://doi.org/10.1287/opre.9.3.383) + +> Pierwszy rygorystyczny dowód prawa Little'a. Przywołany w Rozdziale 3.2 +> w kontekście teorii kolejek. + +[4] Little, J. D. C. (2011). Little's Law as viewed on its 50th +anniversary. *Operations Research*, 59(3), 536–549. +doi:[10.1287/opre.1110.0941](https://doi.org/10.1287/opre.1110.0941) + +> Retrospektywa omawiająca zakres, ograniczenia i typowe błędy +> stosowania. + +[5] Reinertsen, D. G. (2009). *The Principles of Product Development +Flow: Second Generation Lean Product Development*. Celeritas Publishing. +ISBN: 978-0-9844512-0-8. + +> Spopularyzował WSJF i „Koszt opóźnienia / Czas trwania" w kontekstach +> agile/lean. Fundament matematyczny to Smith (1956) [1]. + +### Pomiar i zachęty + +[6] Goodhart, C. A. E. (1984). Problems of monetary management: The U.K. +experience. In *Monetary Theory and Practice* (pp. 91–121). Macmillan. + +> Źródło prawa Goodharta: „Każda zaobserwowana regularność statystyczna +> będzie miała tendencję do rozpadu, gdy tylko zostanie na nią wywarta +> presja w celach kontrolnych." + +[7] Strathern, M. (1997). 'Improving ratings': Audit in the British +university system. *European Review*, 5(3), 305–321. +doi:[10.1002/(SICI)1234-981X(199707)5:3<305::AID-EURO184>3.0.CO;2-4](https://doi.org/10.1002/(SICI)1234-981X(199707)5:3%3C305::AID-EURO184%3E3.0.CO;2-4) + +> Uogólnienie prawa Goodharta: „Gdy miara staje się celem, przestaje +> być dobrą miarą." + +### Ekonomia behawioralna + +[8] Kahneman, D., & Tversky, A. (1979). Prospect theory: An analysis of +decision under risk. *Econometrica*, 47(2), 263–292. +doi:[10.2307/1914185](https://doi.org/10.2307/1914185) + +> Ustanowiła awersję do strat. Przywołana w Rozdziale 4.5. + +### Teoria gier i teoria kontraktów + +[9] Akerlof, G. A. (1970). The market for "lemons": Quality uncertainty +and the market mechanism. *The Quarterly Journal of Economics*, 84(3), +488–500. doi:[10.2307/1879431](https://doi.org/10.2307/1879431) + +> Asymetria informacji i selekcja negatywna. Równowaga łącząca +> z Rozdziału 7.5 jest strukturalnie analogiczna. + +[10] Hölmstrom, B. (1979). Moral hazard and observability. *The Bell +Journal of Economics*, 10(1), 74–91. +doi:[10.2307/3003320](https://doi.org/10.2307/3003320) + +> Formalne opracowanie pokusy nadużycia. Scenariusz raportowania metryki +> w Rozdziale 7.5 jest problemem pokusy nadużycia. + +### Psychologia + +[11] Festinger, L. (1957). *A Theory of Cognitive Dissonance*. Stanford +University Press. ISBN: 978-0-8047-0131-0. + +> Teoria fundamentalna. Przywołana w Rozdziale 8.2. + +[12] Deci, E. L., & Ryan, R. M. (1985). *Intrinsic Motivation and +Self-Determination in Human Behavior*. Plenum Press. +ISBN: 978-0-306-42022-1. + +> Oryginalne opracowanie teorii autodeterminacji. Przywołana +> w Rozdziale 8.3. + +[13] Ryan, R. M., & Deci, E. L. (2000). Self-determination theory and +the facilitation of intrinsic motivation, social development, and +well-being. *American Psychologist*, 55(1), 68–78. +doi:[10.1037/0003-066X.55.1.68](https://doi.org/10.1037/0003-066X.55.1.68) + +> Przegląd teorii autodeterminacji łączący zaspokojenie potrzeb +> z motywacją wewnętrzną i dobrostanem. + +[14] Seligman, M. E. P., & Maier, S. F. (1967). Failure to escape +traumatic shock. *Journal of Experimental Psychology*, 74(1), 1–9. +doi:[10.1037/h0024514](https://doi.org/10.1037/h0024514) + +> Oryginalna demonstracja wyuczonej bezradności. Przywołana +> w Rozdziale 8.5. + +[15] Seligman, M. E. P. (1975). *Helplessness: On Depression, +Development, and Death*. W. H. Freeman. ISBN: 978-0-7167-0752-3. + +> Rozszerzone opracowanie łączące wyuczoną bezradność z depresją +> u ludzi i zachowaniami instytucjonalnymi. + +[16] Shay, J. (1994). *Achilles in Vietnam: Combat Trauma and the Undoing +of Character*. Atheneum / Simon & Schuster. ISBN: 978-0-689-12182-3. + +> Wprowadził pojęcie urazu moralnego. Przywołana w Rozdziale 8.4. + +[17] Litz, B. T., Stein, N., Delaney, E., Lebowitz, L., Nash, W. P., +Silva, C., & Maguen, S. (2009). Moral injury and moral repair in war +veterans: A preliminary model and intervention strategy. *Clinical +Psychology Review*, 29(8), 695–706. +doi:[10.1016/j.cpr.2009.07.003](https://doi.org/10.1016/j.cpr.2009.07.003) + +> Sformalizowała uraz moralny jako konstrukt kliniczny. Definicja +> cytowana w Rozdziale 8.4. + +### Pomiar organizacyjny + +[18] Austin, R. D. (1996). *Measuring and Managing Performance in +Organizations*. Dorset House. ISBN: 978-0-932633-36-1. + +> Dowiódł, że niekompletny pomiar tworzy nieuniknione zachęty do +> optymalizacji mierzonych wymiarów kosztem niemierzonych. Ramowanie +> asymetrii informacyjnej ściśle koresponduje z Rozdziałem 7. +> Najważniejszy poprzednik argumentacji niniejszej pracy. + +[19] Muller, J. Z. (2018). *The Tyranny of Metrics*. Princeton University +Press. ISBN: 978-0-691-17495-2. + +> Kompleksowe opracowanie „fiksacji na metrykach" w edukacji, ochronie +> zdrowia, policji i finansach. Obszerne dowody empiryczne dla wzorców +> teoretyzowanych w Rozdziale 7.4. + +### Sprawiedliwość szeregowania + +[20] Coffman, E. G., Shanthikumar, J. G., & Yao, D. D. (1992). +Multiclass queueing systems: Polymatroid structure and optimal scheduling +control. *Operations Research*, 40(S2), S293–S299. + +> Prawa zachowania w szeregowaniu. Niezmienniczość czasu realizacji +> ważonego pracą (Twierdzenie 2) jest przykładem tych praw zachowania. + +[21] Angel, E., Bampis, E., & Pascual, F. (2008). How good are SPT +schedules for fair optimality criteria? *Annals of Operations Research*, +159(1), 53–64. doi:[10.1007/s10479-007-0267-0](https://doi.org/10.1007/s10479-007-0267-0) + +> Bezpośrednio mierzy jakość harmonogramów SPT wobec kryteriów +> sprawiedliwości. Najbliższy poprzednik w teorii szeregowania +> dla analizy sprawiedliwości z Rozdziału 4. + +[22] Bansal, N., & Harchol-Balter, M. (2001). Analysis of SRPT +scheduling: Investigating unfairness. *ACM SIGMETRICS Performance +Evaluation Review*, 29(1), 279–290. +doi:[10.1145/384268.378792](https://doi.org/10.1145/384268.378792) + +> Bada przekonanie, że SRPT niesprawiedliwie karze duże zadania +> w szeregowaniu komputerowym. Argumentuje, że niesprawiedliwość jest +> mniejsza niż sądzono, ale uznaje zasadnicze napięcie. + +[23] Wierman, A., & Harchol-Balter, M. (2003). Classifying scheduling +policies with respect to unfairness in an M/GI/1. *ACM SIGMETRICS +Performance Evaluation Review*, 31(1), 238–249. + +> Formalizuje definicje sprawiedliwości dla polityk szeregowania +> przez porównanie z Processor-Sharing. + +### Dodatkowe źródła + +[24] Campbell, D. T. (1979). Assessing the impact of planned social +change. *Evaluation and Program Planning*, 2(1), 67–90. +doi:[10.1016/0149-7189(79)90048-X](https://doi.org/10.1016/0149-7189(79)90048-X) + +> Prawo Campbella: „Im bardziej jakikolwiek ilościowy wskaźnik +> społeczny jest używany do podejmowania decyzji społecznych, tym +> bardziej podlega presji korupcyjnej i tym bardziej jest skłonny +> zniekształcać i korumpować procesy społeczne, które ma monitorować." +> Uzupełnia prawo Goodharta [6]. + +[25] Ferreira, C. M., et al. (2024). It's business: A qualitative study +of moral injury in business settings. *Journal of Business Ethics*. +doi:[10.1007/s10551-024-05615-0](https://doi.org/10.1007/s10551-024-05615-0) + +> Rozszerza uraz moralny na miejsca pracy nastawione na zysk. Waliduje +> zastosowanie z Rozdziału 8.4 koncepcji Shaya/Litza poza kontekstami +> wojskowymi i medycznymi. + +[26] Bevan, G., & Hood, C. (2006). What's measured is what matters: +Targets and gaming in the English public health care system. *Public +Administration*, 84(3), 517–538. +doi:[10.1111/j.1467-9299.2006.00600.x](https://doi.org/10.1111/j.1467-9299.2006.00600.x) + +> Empirycznie dokumentuje zachowania manipulacyjne, w tym „trafienie +> w cel i chybienie sensu". Dostarcza dowodów z rzeczywistości dla +> sprzeczności priorytet–metryka z Rozdziału 5.2. + +[27] Moore, C. (2012). Why employees do bad things: Moral disengagement +and unethical organizational behavior. *Personnel Psychology*, 65(1), +1–48. doi:[10.1111/j.1744-6570.2011.01237.x](https://doi.org/10.1111/j.1744-6570.2011.01237.x) + +> Analizuje moralne *odłączenie* — restrukturyzację poznawczą +> umożliwiającą nieetyczne zachowanie. Rozdział 8 zajmuje się +> komplementarnym zjawiskiem: szkodą dla jednostek, które *odmawiają* +> odłączenia. + +--- + +*Niniejszy dowód został opracowany konwersacyjnie i sformalizowany 28 marca 2026 roku.* diff --git a/README.pt.md b/README.pt.md new file mode 100644 index 0000000..604ba7e --- /dev/null +++ b/README.pt.md @@ -0,0 +1,853 @@ +# O Tempo Medio de Conclusao Nao Ponderado Nao e uma Metrica Justa para Escalonamento de Tarefas + +Uma prova matematica de que o tempo medio de conclusao de tarefas nao ponderado e uma estatistica enviesada que incentiva a selecao preferencial de trabalhos faceis, e que qualquer vantagem de escalonamento que ele aparenta revelar e um artefato da metrica — nao um reflexo de produtividade ou qualidade de servico genuinas. + +--- + +## 1. Introducao + +Muitas organizacoes medem o desempenho de execucao de tarefas pelo **tempo medio de conclusao nao ponderado**: o numero medio de horas (ou dias) entre a submissao e a resolucao de uma tarefa, contando cada tarefa igualmente, independentemente de tamanho ou prioridade. + +Este artigo prova que essa metrica nao e meramente imprecisa, mas estruturalmente enviesada. Ela pode ser melhorada reordenando o trabalho sem realizar qualquer trabalho adicional (Teorema 1), enquanto uma alternativa devidamente ponderada e completamente imune a manipulacao de escalonamento (Teorema 2). Quando combinada com um sistema de prioridades, a metrica contradiz ativamente as proprias classificacoes de prioridade da organizacao (Teorema 9). + +O argumento se desenvolve em quatro partes: + +- **Parte I** (Secoes 2–4) estabelece a fundamentacao matematica: a media nao ponderada e manipulavel pelo escalonamento Shortest Processing Time (SPT), a media ponderada por trabalho e invariante ao escalonamento, e as consequencias resultantes para a qualidade do servico sao comprovadamente negativas. + +- **Parte II** (Secoes 5–6) estende o modelo para tarefas com classificacao de prioridade, prova que a metrica se torna adversarial ao sistema de prioridades e propoe alternativas ponderadas com um exemplo pratico de service desk de TI. + +- **Parte III** (Secoes 7–9) examina as dinamicas organizacionais: o que acontece quando a metrica e reportada aos clientes (assimetria de informacao), o que acontece com os membros da equipe que entendem suas falhas (dano psicologico) e o que um unico gestor informado pode fazer a respeito (otimizacao restrita com analise de estabilidade em teoria dos jogos). + +- **Parte IV** (Secoes 10–12) apresenta contra-argumentos honestos, situa o trabalho na literatura existente e conclui. + +Os resultados centrais se baseiam na teoria fundacional de escalonamento de Smith (1956) [1], estendida por meio de teoria dos jogos [9, 10], teoria de medicao organizacional [18, 19] e psicologia [11–17] para tracar uma cadeia completa desde uma prova matematica sobre uma metrica especifica ate resultados organizacionais. + +--- + +# Parte I: Fundamentacao Matematica + +## 2. Definicoes + +Sejam **n** tarefas com tempos de processamento $p_1, p_2, \ldots, p_n$. + +Um **escalonamento** $\sigma$ e uma permutacao de $\{1, 2, \ldots, n\}$ atribuindo tarefas a uma ordem de execucao em um unico executor. + +O **tempo de conclusao** da tarefa $\sigma(k)$ sob o escalonamento $\sigma$ e: + +$$C_{\sigma(k)} = \sum_{j=1}^{k} p_{\sigma(j)}$$ + +O **tempo medio de conclusao nao ponderado** e: + +$$\bar{C}(\sigma) = \frac{1}{n} \sum_{k=1}^{n} C_{\sigma(k)}$$ + +O **tempo medio de conclusao ponderado por trabalho** e: + +$$\bar{C}_w(\sigma) = \frac{\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)}}{\sum_{k=1}^{n} p_{\sigma(k)}}$$ + +--- + +## 3. Resultados Centrais + +### 3.1 A Media Nao Ponderada e Manipulavel + +**Teorema 1** (Smith, 1956 [1])**.** O escalonamento que minimiza $\bar{C}(\sigma)$ e o Shortest Processing Time first (SPT): ordenar as tarefas de modo que $p_{\sigma(1)} \le p_{\sigma(2)} \le \cdots \le p_{\sigma(n)}$. + +**Prova (argumento de troca [1, 2]).** + +Considere qualquer escalonamento $\sigma$ no qual duas tarefas adjacentes $i, j$ satisfazem $p_i > p_j$, com a tarefa $i$ escalonada imediatamente antes da tarefa $j$. Seja $t$ o tempo de inicio da tarefa $i$. + +| | Tarefa $i$ termina | Tarefa $j$ termina | Soma | +|---|---|---|---| +| **Antes da troca** ($i$ depois $j$) | $t + p_i$ | $t + p_i + p_j$ | $2t + 2p_i + p_j$ | +| **Apos a troca** ($j$ depois $i$) | $t + p_j$ | $t + p_j + p_i$ | $2t + p_i + 2p_j$ | + +A mudanca na soma dos tempos de conclusao e: + +$$(2p_i + p_j) - (p_i + 2p_j) = p_i - p_j > 0$$ + +Cada troca de um par adjacente mais-longo-antes-do-mais-curto reduz estritamente o total. Qualquer escalonamento nao-SPT contem tal par. Trocas repetidas convergem para SPT. Portanto, SPT minimiza de forma unica $\bar{C}(\sigma)$. $\blacksquare$ + +### 3.2 A Media Ponderada por Trabalho e Invariante ao Escalonamento + +**Teorema 2.** O tempo medio de conclusao ponderado por trabalho $\bar{C}_w(\sigma)$ e o mesmo para todo escalonamento $\sigma$. + +**Prova.** + +Expanda o numerador: + +$$\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)} = \sum_{k=1}^{n} p_{\sigma(k)} \sum_{j=1}^{k} p_{\sigma(j)}$$ + +Reindexe fazendo $a = \sigma(k)$ e $b = \sigma(j)$. A soma dupla conta cada par ordenado $(a, b)$ onde $b$ e escalonado nao depois de $a$: + +$$= \sum_{\substack{a, b \\ b \preceq_\sigma a}} p_a \, p_b$$ + +Para qualquer par $(a, b)$ com $a \ne b$, exatamente uma das condicoes $\{b \preceq_\sigma a\}$ ou $\{a \prec_\sigma b\}$ vale. Os termos diagonais ($a = b$) contribuem $p_a^2$ independentemente da ordem. Portanto: + +$$\sum_{\substack{a, b \\ b \preceq_\sigma a}} p_a \, p_b = \sum_{a} p_a^2 + \sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b$$ + +Juntamente com a soma complementar, as duas somas fora da diagonal cobrem todos os pares nao ordenados: + +$$\sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b + \sum_{\substack{a \ne b \\ a \prec_\sigma b}} p_a \, p_b = \sum_{a \ne b} p_a \, p_b$$ + +O lado direito e independente do escalonamento. Por simetria de $p_a p_b$, ambas as somas fora da diagonal sao iguais: + +$$\sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b = \frac{1}{2} \sum_{a \ne b} p_a \, p_b$$ + +Portanto: + +$$\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)} = \sum_a p_a^2 + \frac{1}{2} \sum_{a \ne b} p_a \, p_b = \frac{1}{2}\left(\sum_a p_a\right)^2 + \frac{1}{2}\sum_a p_a^2$$ + +Esta expressao nao contem referencia a $\sigma$. Como o denominador $\sum p_a$ tambem e independente do escalonamento: + +$$\bar{C}_w(\sigma) = \frac{\frac{1}{2}\left(\sum p_a\right)^2 + \frac{1}{2}\sum p_a^2}{\sum p_a}$$ + +e **constante para todos os escalonamentos**. $\blacksquare$ + +Este e um caso das leis de conservacao em escalonamento identificadas por Coffman, Shanthikumar e Yao [20]. A invariancia corresponde a medir quanto tempo uma unidade de *trabalho* espera, em vez de quanto tempo uma *tarefa* espera — a estatistica nao ponderada conta conclusoes em vez de trabalho, razao pela qual e manipulavel. (Veja tambem Little [3, 4] para o contexto de teoria de filas, com a ressalva de que a Lei de Little se aplica diretamente apenas a sistemas em regime estacionario, nao ao caso em lote analisado aqui.) + +### 3.3 Exemplo Ilustrativo + +Duas tarefas: $A$ com $p_A = 1$ hora, $B$ com $p_B = 10$ horas. + +| Escalonamento | $C_A$ | $C_B$ | Media nao ponderada | Media ponderada por trabalho | +|----------|-------|-------|-----------------|-------------------| +| SPT (A primeiro) | 1 | 11 | 6,0 | 111/11 ≈ 10,09 | +| Inverso (B primeiro) | 11 | 10 | 10,5 | 111/11 ≈ 10,09 | + +SPT parece **4,5 horas melhor** na metrica nao ponderada, mas fornece **zero melhoria** na metrica ponderada por trabalho. A vantagem aparente existe apenas porque a estatistica nao ponderada permite que uma tarefa de 1 hora "vote" igualmente com uma tarefa de 10 horas. + +--- + +## 4. Consequencias para a Qualidade do Servico + +### 4.1 Inanicao de Tarefas Grandes + +**Teorema 3 (Vies da Metrica).** Qualquer politica de escalonamento que minimize o tempo medio de conclusao nao ponderado necessariamente maximiza o tempo de conclusao da maior tarefa. + +**Prova.** SPT coloca a maior tarefa por ultimo. Seu tempo de conclusao e igual ao tempo total de processamento $\sum p_i$, que e o tempo de conclusao maximo possivel para qualquer tarefa individual. Sob qualquer escalonamento que nao coloque a maior tarefa por ultimo, essa tarefa e concluida estritamente mais cedo. $\blacksquare$ + +Isso cria um **incentivo a inanicao**: agentes racionais otimizando a estatistica nao ponderada adiarao indefinidamente tarefas grandes em favor de tarefas pequenas. Austin [18] identificou esse padrao geral — de que a medicao incompleta cria incentivos para otimizar a dimensao medida em detrimento das dimensoes nao medidas — no contexto de gestao de desempenho organizacional. O Teorema 3 fornece o mecanismo especifico para escalonamento de tarefas. + +### 4.2 Tempo de Conclusao Maximo para a Maior Tarefa + +**Teorema 4 (SPT Maximiza de Forma Unica o Tempo de Conclusao da Maior Tarefa).** Entre todos os escalonamentos, SPT e a unica politica que atribui o tempo de conclusao maximo possivel ($\sum p_i$) a maior tarefa. + +**Prova.** SPT ordena as tarefas em ordem crescente de $p_i$, colocando a maior tarefa $p_{\max}$ na ultima posicao. A ultima tarefa em qualquer escalonamento tem tempo de conclusao $\sum_{i=1}^{n} p_i$, que e o maximo que qualquer tarefa individual pode receber. Sob qualquer escalonamento que nao coloque $p_{\max}$ por ultimo, ela e concluida estritamente antes de $\sum p_i$. $\blacksquare$ + +**Corolario 4.1.** Uma equipe que otimiza o tempo medio de conclusao nao ponderado sistematicamente entregara a pior experiencia aos clientes com as necessidades mais complexas. Isso nao e um efeito colateral — e o *mecanismo* pelo qual a metrica melhora. + +**Nota sobre razoes de desaceleracao.** SPT na verdade *comprime* as razoes de desaceleracao ($S_i = C_i / p_i$) porque tarefas maiores em posicoes posteriores possuem denominadores grandes que absorvem a soma acumulada. Por exemplo, com tarefas $[1, 5, 10]$: SPT produz desaceleracoes $[1, 1{,}2, 1{,}6]$ (baixa variancia) enquanto LPT produz $[1, 3, 16]$ (alta variancia). O dano que SPT causa aos clientes de tarefas grandes nao e visivel na razao de desaceleracao — e visivel no **tempo de conclusao absoluto**. Essa distincao e importante: a literatura sobre equidade em escalonamento [21, 22, 23] debateu a injustica de SPT/SRPT principalmente por meio de medidas baseadas em desaceleracao, que podem obscurecer a carga de atraso absoluto provada a seguir. + +### 4.3 Concentracao de Atraso + +**Teorema 5 (SPT Concentra o Atraso na Maior Tarefa).** Sob SPT, a maior tarefa sofre mais atraso absoluto do que sob qualquer outro escalonamento. + +**Prova.** Defina atraso absoluto como $\Delta_i = C_i - p_i$ (tempo gasto esperando, independente do proprio tamanho). Sob SPT, a maior tarefa esta na posicao $n$ com: + +$$\Delta_{\max\text{-task}}^{\text{SPT}} = C_n - p_n = \sum_{i=1}^{n-1} p_i$$ + +Esta e a soma dos tempos de processamento de todas as outras tarefas — o atraso maximo possivel para qualquer tarefa individual. Sob qualquer escalonamento onde a maior tarefa nao esteja por ultimo, seu atraso e estritamente menor. Enquanto isso, SPT da a menor tarefa atraso zero ($\Delta_1^{\text{SPT}} = 0$). Todo o onus de espera e transferido das tarefas pequenas para as tarefas grandes. $\blacksquare$ + +SPT minimiza o atraso *total* (bom para eficiencia agregada) concentrando o atraso nas tarefas mais capazes de absorve-lo em termos de razao de desaceleracao. Mas em termos absolutos — horas gastas esperando — a maior tarefa carrega todo o peso. + +### 4.4 Invariancia de Throughput + +**Teorema 6 (Invariancia de Throughput).** O trabalho total concluido em qualquer horizonte de tempo $T$ e identico sob todas as politicas de escalonamento. + +**Prova.** O executor processa trabalho a uma taxa fixa. Em qualquer horizonte $T \ge \sum p_i$, o trabalho total realizado e exatamente $\sum p_i$ independentemente da ordem. Para o caso em regime estacionario com chegadas continuas, o throughput de longo prazo e determinado pela taxa de servico $\mu$ e e completamente independente do escalonamento: + +$$\lim_{T \to \infty} \frac{W(T)}{T} = \mu \quad \text{para todos os escalonamentos } \sigma$$ + +$\blacksquare$ + +**Corolario 6.1.** Uma equipe que muda de qualquer politica de escalonamento para SPT observara uma melhoria no tempo medio de conclusao nao ponderado com **zero mudanca no throughput real**. A metrica melhora. A producao nao. + +### 4.5 O Efeito Combinado + +Combinando os Teoremas 4, 5 e 6: + +| Medida | Efeito de otimizar a media nao ponderada | +|---------|--------------------------------------| +| Throughput (trabalho/tempo) | Sem mudanca (Teorema 6) | +| Atraso para tarefas pequenas | Minimizado — aproxima-se de zero (SPT) | +| Atraso para tarefas grandes | **Maximizado** — carrega todo o onus de espera (Teorema 5) | +| Tempo de conclusao da maior tarefa | **Maximo possivel**: $\sum p_i$ (Teorema 4) | + +O efeito liquido sobre a qualidade percebida e negativo porque: + +1. **A aversao a perda e assimetrica** [8]. Um cliente cuja tarefa de 100 horas e despriorizada experimenta um impacto negativo grande e saliente. Um cliente cuja tarefa de 1 hora e acelerada experimenta um impacto positivo pequeno, frequentemente imperceptivel. + +2. **Tarefas de alto esforco correlacionam-se com clientes de alto valor.** Tarefas grandes sao desproporcionalmente provaveis de vir de clientes importantes, contratos complexos ou necessidades criticas de negocio. + +3. **A inanicao se acumula.** Em um sistema continuo (Teorema 3), tarefas grandes podem ser **indefinidamente adiadas** a medida que novas tarefas pequenas continuam chegando. + +**Teorema 7 (O Resultado Central).** Para uma equipe processando tarefas de tamanho nao uniforme, adotar o tempo medio de conclusao nao ponderado como metrica de desempenho: + +(a) Fornece **zero ganho de produtividade** (Teorema 6), enquanto +(b) **Atribui o tempo de conclusao maximo possivel** a maior tarefa (Teorema 4), e +(c) **Concentra todo o atraso de fila** nas maiores tarefas enquanto elimina o atraso para as menores (Teorema 5). + +Isso nao e um tradeoff. A metrica cria uma transferencia pura de qualidade de servico dos clientes de alto esforco para os clientes de baixo esforco, sem nenhum trabalho liquido ganho. $\blacksquare$ + +--- + +# Parte II: Sistemas de Prioridade + +## 5. Colapso Sob Classificacao de Prioridade + +As secoes anteriores provaram que o tempo medio de conclusao nao ponderado e enviesado quando as tarefas variam em tamanho. Agora mostramos que a introducao de um **sistema de prioridades** — como virtualmente todas as equipes reais utilizam — faz com que a metrica se torne nao meramente enviesada, mas **ativamente adversarial** aos objetivos declarados da organizacao. + +### 5.1 Modelo Estendido: Tarefas Com Prioridade + +Seja cada tarefa $i$ com tempo de processamento $p_i$ e uma classe de prioridade $q_i \in \{1, 2, 3, 4\}$ onde 1 e a prioridade mais alta (critica) e 4 e a mais baixa (cosmetica/melhoria). Atribua pesos de prioridade: + +$$w(q) = \begin{cases} 8 & q = 1 \text{ (Critica)} \\ 4 & q = 2 \text{ (Alta)} \\ 2 & q = 3 \text{ (Media)} \\ 1 & q = 4 \text{ (Baixa)} \end{cases}$$ + +Os pesos especificos sao ilustrativos; os resultados valem para qualquer funcao de peso estritamente decrescente. A propriedade-chave e que a prioridade e atribuida por **impacto no negocio**, nao pelo tamanho da tarefa. + +### 5.2 A Metrica Contradiz o Sistema de Prioridades + +**Teorema 8 (Inversao Prioridade-Tamanho).** Quando a prioridade e independente do tamanho da tarefa, o escalonamento que minimiza o tempo medio de conclusao nao ponderado (SPT), em expectativa, concluira tarefas de baixa prioridade antes de tarefas de alta prioridade de maior tamanho. + +**Prova.** SPT ordena tarefas por $p_i$ crescente, independentemente de $q_i$. Considere duas tarefas: + +- Tarefa A: $p_A = 40$ horas, $q_A = 1$ (Critica — ex.: queda do servidor) +- Tarefa B: $p_B = 0{,}5$ hora, $q_B = 4$ (Baixa — ex.: correcao cosmetica de interface) + +SPT escalona B antes de A. A media nao ponderada para este par: + +$$\bar{C}^{\text{SPT}} = \frac{0.5 + 40.5}{2} = 20.5 \qquad \bar{C}^{\text{priority}} = \frac{40 + 40.5}{2} = 40.25$$ + +A metrica declara SPT quase **duas vezes melhor** — apesar de concluir uma correcao cosmetica enquanto uma queda de servidor se prolonga. + +Em geral, quando $q_i$ e estatisticamente independente de $p_i$, a ordenacao SPT tem **zero correlacao** com a prioridade. Na pratica, tarefas Criticas (quedas, incidentes de seguranca, perda de dados) frequentemente exigem mais trabalho do que tarefas Baixas, de modo que a metrica e plausivelmente **anti-correlacionada** com o sistema de prioridades. $\blacksquare$ + +### 5.3 Destruicao de Informacao + +A media nao ponderada reduz uma tarefa tridimensional $(p_i, q_i, C_i)$ a um sinal unidimensional ($C_i$), e entao calcula a media uniformemente. Isso descarta a prioridade inteiramente e implicitamente inverte o tamanho. + +**Teorema 9 (Destruicao de Informacao).** Seja $I(\sigma)$ a informacao mutua entre o ranking implicito de prioridade do escalonamento (posicao) e a atribuicao real de prioridade $q_i$. Para SPT: + +$$I(\sigma_{\text{SPT}}) = 0 \quad \text{quando } p_i \perp q_i$$ + +**Prova.** SPT atribui posicoes baseando-se exclusivamente em $p_i$. Quando $p_i$ e $q_i$ sao independentes, saber a posicao de uma tarefa no escalonamento SPT fornece zero informacao sobre sua prioridade. $\blacksquare$ + +**Corolario 9.1.** Uma equipe que otimiza o tempo medio de conclusao nao ponderado esta operando um sistema de escalonamento que carrega zero informacao sobre sua propria classificacao de prioridade. O campo de prioridade no sistema de chamados e, com respeito a ordem de execucao, decorativo. + +Este e um caso do que Austin [18] chama de problema fundamental da medicao incompleta: quando o sistema de medicao captura apenas um subconjunto das dimensoes relevantes, otimizar a medicao sistematicamente degrada as dimensoes nao medidas. + +### 5.4 Custo de Atraso Ponderado por Prioridade + +Defina o **custo de atraso ponderado por prioridade** de um escalonamento: + +$$D(\sigma) = \sum_{i=1}^{n} w(q_i) \cdot C_i$$ + +**Teorema 10 (SPT e Custo de Atraso Ponderado por Prioridade).** O escalonamento otimo para minimizar $D(\sigma)$ e WSJF: ordenar por $w(q_i)/p_i$ decrescente [1, 5]. A ordenacao de SPT — por $1/p_i$ decrescente — ignora a prioridade inteiramente e produz maior $D$ do que alternativas que respeitam a prioridade quando a prioridade e correlacionada com o tamanho da tarefa. + +**Prova.** Pelo argumento de troca, trocar tarefas adjacentes $i, j$ altera $D$ em: + +$$\Delta D = w(q_j) \cdot p_i - w(q_i) \cdot p_j$$ + +A troca melhora $D$ quando $w(q_j)/p_j > w(q_i)/p_i$ mas $j$ esta escalonado apos $i$. Portanto, a ordem otima e $w(q_i)/p_i$ decrescente — a regra WSJF. SPT corresponde a WSJF apenas quando $w(q_i) = \text{const}$ (todas as tarefas tem prioridade igual). + +**Exemplo.** Critica ($w = 8$, $p = 3$) e Baixa ($w = 1$, $p = 2$): + +- SPT (Baixa primeiro): $D = 1 \cdot 2 + 8 \cdot 5 = 42$ +- WSJF (Critica primeiro): $D = 8 \cdot 3 + 1 \cdot 5 = 29$ + +SPT incorre em 45% mais atraso ponderado por prioridade. Na pratica, tarefas Criticas tendem a ser maiores (quedas, incidentes de seguranca), tornando a divergencia sistematica. $\blacksquare$ + +--- + +## 6. Solucoes Propostas + +### 6.1 Metricas Ponderadas por Prioridade + +Substitua o tempo medio de conclusao nao ponderado pelo **Priority-Weighted Completion Score (PWCS)**: + +$$\text{PWCS}(\sigma) = \frac{\sum_{i=1}^{n} w(q_i) \cdot \frac{C_i}{p_i}}{\sum_{i=1}^{n} w(q_i)}$$ + +Esta e a media ponderada por prioridade da razao de desaceleracao. Ela mede quanto tempo cada tarefa esperou em relacao ao seu tamanho, ponderada por quao importante aquela tarefa era. Menor e melhor. + +**Propriedades:** + +1. **Respeita a prioridade.** Atrasos em tarefas Criticas custam 8x mais do que atrasos em tarefas Baixas. +2. **Justa quanto ao tamanho.** Usa a razao de desaceleracao $C_i / p_i$, de modo que tarefas grandes nao sao penalizadas por serem grandes. +3. **Nao manipulavel por SPT.** Reordenar por tempo de processamento nao melhora sistematicamente a pontuacao. +4. **Reduz-se a media nao ponderada quando as tarefas sao uniformes.** Uma generalizacao estrita. + +### 6.2 Politica Otima: WSJF + +**Teorema 11.** O escalonamento que minimiza o tempo de conclusao ponderado por prioridade $\text{PWCT}(\sigma) = \sum w(q_i) \cdot C_i / \sum w(q_i)$ processa tarefas em ordem decrescente de $w(q_i)/p_i$ — a regra **Weighted Shortest Job First (WSJF)** [1, 5]. + +**Prova.** Pelo argumento de troca (como no Teorema 10), a troca de tarefas adjacentes $i, j$ melhora PWCT quando $w(q_j)/p_j > w(q_i)/p_i$ mas $j$ esta escalonado apos $i$. A ordem otima e, portanto, $w(q_i)/p_i$ decrescente. $\blacksquare$ + +Dentro de uma classe de prioridade, isso se reduz a SPT (mais curta primeiro). Entre classes, uma tarefa Critica de 4 horas ($w/p = 2{,}0$) vence uma tarefa Baixa de 1 hora ($w/p = 1{,}0$). + +**Ressalva pratica.** WSJF puro pode colocar tarefas minusculas de Baixa prioridade a frente de tarefas grandes Criticas (uma tarefa Baixa de 15 minutos tem $w/p = 1/0.25 = 4{,}0$, vencendo uma Critica de 6 horas com $w/p = 8/6 = 1{,}33$). Na pratica, isso e mitigado impondo **ordenacao estrita por classe de prioridade** e aplicando WSJF apenas *dentro* de cada classe. + +### 6.3 Exemplo Aplicado: Service Desk de TI + +Considere uma equipe de TI com a seguinte fila de chamados: + +| Chamado | Prioridade | Tipo | Horas Est. | +|--------|----------|------|-----------| +| T1 | P1 (Critica) | Servidor de e-mail fora do ar | 6 | +| T2 | P2 (Alta) | VPN falhando para equipe remota | 4 | +| T3 | P3 (Media) | Configuracao de laptop de novo funcionario | 2 | +| T4 | P4 (Baixa) | Atualizar politica de papel de parede do desktop | 0,5 | +| T5 | P3 (Media) | Instalar licenca de software | 1 | +| T6 | P1 (Critica) | Backup de banco de dados falhando | 3 | +| T7 | P2 (Alta) | Frota de impressoras offline | 2 | +| T8 | P4 (Baixa) | Arquivar pasta antiga de drive compartilhado | 0,25 | + +**Ordem SPT** (otimizando a media nao ponderada): T8, T4, T5, T3, T7, T6, T2, T1 + +| Pos | Chamado | Prioridade | Horas | Conclusao | Desaceleracao | +|-----|--------|----------|-------|------------|----------| +| 1 | T8 (arquivar pasta) | P4 Baixa | 0,25 | 0,25 | 1,0 | +| 2 | T4 (papel de parede) | P4 Baixa | 0,5 | 0,75 | 1,5 | +| 3 | T5 (software) | P3 Media | 1 | 1,75 | 1,75 | +| 4 | T3 (laptop) | P3 Media | 2 | 3,75 | 1,875 | +| 5 | T7 (impressoras) | P2 Alta | 2 | 5,75 | 2,875 | +| 6 | T6 (backups) | P1 Crit | 3 | 8,75 | 2,917 | +| 7 | T2 (VPN) | P2 Alta | 4 | 12,75 | 3,188 | +| 8 | T1 (e-mail) | P1 Crit | 6 | 18,75 | 3,125 | + +**WSJF Pratico** (prioridade-classe-primeiro, SPT dentro da classe): + +| Pos | Chamado | Prioridade | Horas | Conclusao | +|-----|--------|----------|-------|------------| +| 1 | T6 (backups) | P1 Crit | 3 | 3 | +| 2 | T1 (e-mail) | P1 Crit | 6 | 9 | +| 3 | T7 (impressoras) | P2 Alta | 2 | 11 | +| 4 | T2 (VPN) | P2 Alta | 4 | 15 | +| 5 | T5 (software) | P3 Media | 1 | 16 | +| 6 | T3 (laptop) | P3 Media | 2 | 18 | +| 7 | T8 (arquivar) | P4 Baixa | 0,25 | 18,25 | +| 8 | T4 (papel de parede) | P4 Baixa | 0,5 | 18,75 | + +**Comparacao:** + +| Metrica | SPT | WSJF Pratico | Vencedor | +|--------|-----|----------------|--------| +| Media de conclusao nao ponderada | **6,56 hrs** | 13,63 hrs | SPT | +| Tempo medio de resolucao P1 | 13,75 hrs | **6 hrs** | WSJF | +| Tempo medio de resolucao P2 | 9,25 hrs | **13 hrs** | SPT | +| Tempo para corrigir servidor de e-mail | 18,75 hrs | **9 hrs** | WSJF | +| Tempo para corrigir backups do banco | 8,75 hrs | **3 hrs** | WSJF | +| Tempo para atualizar papel de parede | **0,75 hrs** | 18,75 hrs | SPT | + +Os tempos de conclusao ponderados por prioridade agregados sao quase identicos (PWCT: 10,2 vs 10,17) porque a agregacao esconde danos distribucionais. A diferenca real esta no detalhamento **por classe de prioridade**: o servidor de e-mail fica fora do ar por 18,75 horas sob SPT versus 9 horas sob WSJF. Os backups do banco de dados falham por 8,75 horas versus 3. + +A metrica nao ponderada confiantemente reporta SPT como **mais que duas vezes mais eficiente** (6,56 vs 13,63), recompensando a equipe que atualizou o papel de parede do desktop enquanto o servidor de e-mail estava pegando fogo. + +### 6.4 Conjunto de Metricas Recomendado + +Mesmo metricas agregadas ponderadas por prioridade podem falhar em distinguir bons de maus escalonamentos, porque a agregacao esconde danos distribucionais. Nenhuma metrica unica e suficiente. Um sistema de medicao completo deve acompanhar: + +| Metrica | O que mede | Formula | +|--------|-----------------|---------| +| **Media de conclusao por classe de prioridade** | Responsividade por classe | $\bar{C}$ filtrado por $q$ | +| **Tempo medio de resolucao P1** | Resposta a incidentes criticos | $\bar{C}$ para $q = 1$ | +| **Throughput** | Capacidade bruta de trabalho | Horas-trabalho concluidas / tempo calendario | +| **Violacoes de envelhecimento** | Prevencao de inanicao | Tarefas excedendo SLA por prioridade | +| **Tempo maximo de conclusao (P1/P2)** | Pior caso de resposta critica | $\max(C_i)$ para $q \le 2$ | + +A percepcao-chave: **metricas por classe de prioridade** expoem falhas de escalonamento que metricas agregadas escondem. + +--- + +# Parte III: Dinamicas Organizacionais + +## 7. Quando a Metrica e o Produto + +As Secoes 2–6 assumem que a satisfacao do cliente e uma funcao da *qualidade de servico experimentada*. Mas existe um cenario no qual essa premissa falha e todo o argumento desmorona. + +### 7.1 A Metrica Autorreferencial + +Suponha que o provedor reporte a media nao ponderada diretamente ao cliente — em um painel, em um relatorio de SLA, em uma pagina de marketing — e que a satisfacao do cliente seja derivada primariamente *daquele numero*: + +$$U_{\text{client}} = f\!\left(\bar{C}(\sigma)\right), \quad f' < 0$$ + +Sob esse modelo, SPT genuinamente maximiza a satisfacao do cliente (Teorema 1). O throughput nao muda (Teorema 6). O resultado de negocio melhora: mesmo trabalho realizado, cliente mais satisfeito. + +**Todos os teoremas neste artigo permanecem matematicamente corretos. Mas a conclusao se inverte.** A metrica nao e mais um proxy que pode ser manipulado — ela *e* a qualidade do servico, porque o cliente concordou em avaliar a qualidade pelo numero agregado. + +### 7.2 A Economia + +Isso cria um equilibrio coerente e estavel: + +| Ator | Comportamento | Resultado | +|-------|----------|---------| +| Provedor | Otimiza a media nao ponderada (SPT) | Metrica melhora, sem trabalho extra | +| Cliente | Le o painel, ve media baixa | Reporta satisfacao | +| Gestao | Ve cliente satisfeito + boa metrica | Recompensa a equipe | + +O provedor extrai satisfacao a custo marginal zero, otimizando um numero que o cliente aceitou como proxy de qualidade. + +### 7.3 A Fragilidade + +Esse equilibrio e estavel apenas enquanto o cliente nunca inspeciona sua propria experiencia. Ele se rompe quando: + +1. **O cliente verifica seu proprio chamado.** Um CTO cujo servidor de e-mail ficou fora do ar por 18,75 horas nao sera tranquilizado por "Resolucao media: 6,56 horas." Os clientes mais propensos a inspecionar sao exatamente os que recebem o pior servico (Teorema 4). + +2. **Um concorrente oferece SLAs por chamado.** "P1 resolvido em 4 horas" supera "resolucao media abaixo de 7 horas" para qualquer cliente com necessidades criticas. + +3. **A equipe internaliza a metrica.** Se a equipe acredita que a metrica reflete desempenho real, ela perde a capacidade de reconhecer quando trabalho critico e negligenciado. A metrica se torna um risco epistemico. + +### 7.4 O Padrao Geral + +Esse padrao — proxy substitui qualidade, proxy e otimizado, qualidade diverge, sistema e estavel ate ser testado pela realidade — recorre em diversos dominios. Muller [19] o documenta extensivamente como "fixacao por metricas"; Campbell [24] formalizou o efeito corruptor de usar indicadores como metas. + +| Dominio | Metrica proxy | Qualidade subjacente | Divergencia | +|--------|-------------|-------------------|------------| +| Suporte de TI | Tempo medio de resolucao | Tempo de atividade de sistemas criticos | Servidor fora do ar 19 hrs, media diz 6,5 | +| Educacao | Notas em provas | Aprendizado real | Ensinar para a prova | +| Saude | Throughput de pacientes | Resultados para os pacientes | Altas mais rapidas, mais reinternacoes | +| Financas | Lucros trimestrais | Valor de longo prazo | Corte de custos infla LPA, corroi capacidade | +| Software | Velocidade (story points) | Qualidade do produto | Inflacao de pontos, funcionalidades mal acabadas | + +### 7.5 Assimetria de Informacao + +Modele o sistema como um jogo entre provedor (P) e cliente (C). P observa os $\{C_i\}$ individuais e escolhe $\sigma$; C observa apenas $\bar{C}(\sigma)$. Este e um problema de **risco moral** [10]: a estrategia otima de P e minimizar o sinal observavel independentemente da distribuicao nao observavel. + +O equilibrio e um **equilibrio de agrupamento** [9]: a metrica reportada por P parece identica independentemente do desempenho ponderado por prioridade subjacente. E estavel ate que C obtenha acesso aos valores individuais de $C_i$ — via um portal do cliente, pela transparencia de um concorrente ou por um incidente suficientemente doloroso. + +### 7.6 A Conclusao Desconfortavel + +A resposta honesta para "otimizar a media nao ponderada prejudica o negocio?" e: **nao necessariamente, contanto que o cliente nunca olhe por tras do numero**. A resposta honesta para "isso e sustentavel?" e: e tao sustentavel quanto qualquer sistema no qual o vendedor sabe mais do que o comprador — estavel por periodos prolongados, depois colapso rapido quando a assimetria e perfurada. + +--- + +## 8. O Custo Psicologico de Saber + +A Secao 7 modelou o provedor como um ator unitario. Mas equipes sao compostas de individuos. Quando um membro da equipe entende a prova — quando ele *sabe* que a metrica e sintetica, que o painel e teatro, que o servidor de e-mail ainda esta fora do ar enquanto ele fecha chamados de papel de parede — um novo custo aparece que o modelo de equilibrio omitiu. + +### 8.1 A Variavel Oculta: Consciencia da Equipe + +| Ator | Observa $C_i$ individual | Observa $\bar{C}$ | Entende a prova | +|-------|--------------------------|--------------------|-----------------------| +| Gestao | Possivelmente | Sim | Varia | +| Membro da equipe | **Sim** | Sim | **Sim** (neste cenario) | +| Cliente | Nao | Sim | Nao | + +O membro da equipe tem informacao completa. Ele ve a fila de chamados. Ele sabe que o servidor de e-mail esta fora do ar desde as 7h. Ele sabe que esta fechando um chamado de papel de parede porque isso melhora o numero. E ele sabe *por que*. + +### 8.2 Dissonancia Cognitiva Sob Informacao Completa + +A dissonancia cognitiva [11] surge quando um individuo sustenta cognicoes contraditorias. Sem entender *por que*, a contradicao pode ser racionalizada: "a gestao sabe o que faz." Entender a prova remove a ambiguidade. O membro da equipe agora sustenta: + +- **Cognicao A:** "Sou um profissional competente. Meu trabalho e resolver problemas importantes." +- **Cognicao B:** "Estou fechando um chamado de papel de parede enquanto o servidor de e-mail esta fora do ar, porque a metrica e matematicamente enviesada (Teorema 1), a reordenacao produz zero throughput (Teorema 6), e o unico beneficiario e o painel (Secao 7). Posso provar isso." + +A dissonancia e agora *estrutural*. As resolucoes disponiveis — abandonar a identidade profissional, rejeitar a prova, advogar por mudanca ou sair — cada uma impoe custos que nao existiam antes. + +### 8.3 Teoria da Autodeterminacao: Tres Necessidades Violadas + +A Teoria da Autodeterminacao de Deci e Ryan [12, 13] identifica tres necessidades que predizem a motivacao intrinseca: + +**Autonomia.** A metrica restringe escolhas de uma maneira que o membro da equipe sabe ser matematicamente subotima. Um trabalhador que entende que o processo e comprovadamente contraproducente nao pode se sentir autonomo ao segui-lo. + +**Competencia.** A metrica recompensa eficacia *aparente* (baixo $\bar{C}$) enquanto e invariante a eficacia *real* (Teorema 6). Competencia genuina — corrigir o servidor de e-mail primeiro — e *punida* pela metrica. + +**Relacionamento.** O membro da equipe sabe que o servidor de e-mail do cliente esta fora do ar. Ele poderia ajudar. Em vez disso, esta atualizando papel de parede — nao porque isso ajude alguem, mas porque ajuda um numero. A conexao entre trabalho e impacto humano foi cortada, e o membro da equipe pode ver as pontas cortadas. + +### 8.4 Dano Moral + +O dano moral [16, 17] e o prejuizo duradouro causado por "perpetrar, falhar em prevenir, testemunhar ou aprender sobre atos que transgridem crencas morais profundamente arraigadas" [17]. Desde entao, foi estendido a contextos empresariais [25]. A distincao-chave do burnout: **burnout e exaustao por fazer demais. Dano moral e o prejuizo de fazer a coisa errada.** + +Um membro da equipe que sabe que o servidor de e-mail esta fora do ar, sabe que deveria corrigi-lo, fecha um chamado de papel de parede em vez disso, e o faz porque a metrica exige, esta vivenciando as condicoes estruturais para dano moral. + +### 8.5 Desamparo Aprendido e Fatalismo Metrico + +O desamparo aprendido de Seligman [14, 15] descreve como a exposicao a resultados negativos incontrolaveis leva a passividade. A sequencia: + +1. A metrica e falha (prova compreendida). +2. Advogar por mudanca. +3. Rejeitado ("os numeros estao bons, nao balance o barco"). +4. Repetir com conviccao decrescente. +5. Estado terminal: "A metrica e o que e. Vou apenas fechar chamados." + +Isso nao e preguica. E a resposta racional a um sistema que pune o comportamento correto e recompensa o comportamento incorreto, quando o individuo nao tem poder para mudar o sistema. + +### 8.6 A Espiral de Selecao Adversa + +Combinando o equilibrio da Secao 7 com a dinamica de rotatividade: + +1. Organizacao adota a media nao ponderada. Metrica parece boa (SPT). +2. Membros competentes e conscientes da equipe experimentam custos psicologicos (8.2–8.5). +3. Esses membros saem. Substituidos por membros que nao entendem as falhas da metrica ou nao se importam. +4. A metrica continua parecendo boa — sempre parece sob SPT, independentemente da competencia da equipe (Corolario 6.1). +5. A qualidade real do servico degrada, mas a metrica nao consegue detectar isso (Corolario 9.1). +6. Retornar ao passo 1. + +A metrica seleciona *contra* as pessoas que melhorariam o sistema e *a favor* das pessoas que nao o desafiarao. O sistema se estabiliza em um nivel inferior de competencia, invisivel ao seu proprio aparato de medicao. + +### 8.7 O Modelo Completo de Custos + +| Secao 7 (visivel) | Secao 8 (oculto) | +|---------------------|---------------------| +| Cliente satisfeito (bom numero) | Equipe insatisfeita (realidade ruim) | +| Throughput inalterado | Esforco discricionario retirado | +| Metrica melhora | Membros competentes saem | +| Economia do negocio estavel | Competencia institucional degrada | + +Estes operam em escalas temporais diferentes: o equilibrio e visivel trimestralmente; a degradacao de competencia e visivel ao longo de anos. O modelo completo e: **a metrica funciona, e e destrutiva, e a destruicao e invisivel para a metrica.** A metrica e tinta fresca sobre vergalhao corroido. + +--- + +## 9. Internalizacao pelo Gestor: A Solucao Acionavel + +As Secoes 2–6 dizem para rejeitar a metrica. A Secao 7 diz que a metrica funciona (para o negocio). A Secao 8 diz que ela destroi a equipe. Na pratica, a maioria dos gestores nao pode mudar unilateralmente a metrica. A melhor solucao e a reforma metrica em toda a empresa. A solucao *acionavel* e o que um unico gestor informado pode fazer agora. + +### 9.1 A Estrategia + +Um gestor que entende a prova pode **internalizar as limitacoes da metrica sem propaga-las para a equipe**: + +1. **Escalonar primariamente por prioridade.** A equipe trabalha nas tarefas criticas primeiro. +2. **Intercalar tarefas pequenas taticamente.** Quando uma tarefa pequena de baixa prioridade pode ser concluida sem atrasar materialmente o trabalho de alta prioridade, faze-la. Nao porque a metrica exige, mas porque tambem precisa ser feita e custa quase nada. +3. **Nunca revelar a metrica como motivacao.** "Resolva esse rapido enquanto esperamos o callback do fornecedor no P1" — nao "precisamos baixar nossa media." A motivacao intrinseca da equipe permanece intacta (Secao 8). O gestor absorve o onus de gerenciar a metrica. + +### 9.2 Formalizacao + +O problema do gestor e uma otimizacao restrita: + +$$\min_{\sigma} \sum_{i=1}^{n} w(q_i) \cdot C_i \quad \text{subject to} \quad \bar{C}(\sigma) \le \bar{C}_{\text{target}}$$ + +**Teorema 12 (Custo Metrico Limitado do Escalonamento por Prioridade).** Um gestor que usa SPT *dentro* de cada classe de prioridade e ordenacao por prioridade *entre* classes produzira uma metrica proxima do valor otimo de SPT — a diferenca surge apenas de inversoes entre classes. + +**Esboco de prova.** Dentro de cada classe de prioridade, SPT e gratuito (todas as tarefas tem prioridade igual). O unico desvio do SPT global e a ordenacao entre classes. Cada inversao entre classes custa no maximo $p_{\text{large}} - p_{\text{small}}$ na soma nao ponderada, e essas inversoes sao limitadas pelo numero de classes. Na pratica, a diferenca tipicamente fica dentro de 10–20% do otimo SPT. $\blacksquare$ + +### 9.3 O Gestor como Barreira de Informacao + +| Camada | Ve a metrica | Ve as prioridades | Ve a prova | +|-------|-----------|----------------|------------| +| Organizacao | Sim | Nominalmente | Nao | +| Gestor | Sim | Sim | **Sim** | +| Equipe | Nao (protegida) | Sim | Irrelevante | +| Cliente | Sim (painel) | Via SLA | Nao | + +O gestor e o unico ator que detem as tres pecas de informacao. Isso nao e manipulacao — ele esta fazendo o trabalho certo na ordem certa, e a metrica acontece de ser aceitavel porque SPT dentro da classe e gratuito. + +### 9.4 O Colapso Competitivo + +Essa estrategia falha quando a metrica se torna **competitiva entre equipes**. + +**Caso 1: Cooperativo** — Equipes medidas por paridade, nao por ranking. Cada gestor independentemente usa a estrategia de internalizacao. A metrica e decorativa, mas inofensiva. Este e um **jogo de coordenacao** com um equilibrio cooperativo estavel. + +**Caso 2: Competitivo** — Equipes ranqueadas por $\bar{C}$. Este e um **dilema do prisioneiro**: + +| | Equipe B: Prioridade-primeiro | Equipe B: SPT | +|---|---|---| +| **Equipe A: Prioridade-primeiro** | (Bom trabalho, Bom trabalho) | (A parece mal, B parece bem) | +| **Equipe A: SPT** | (A parece bem, B parece mal) | (Ambas parecem bem, ambas fazem trabalho errado) | + +O equilibrio de Nash e (SPT, SPT). A estrategia de internalizacao e um equilibrio cooperativo que **nao e estavel sob competicao**. + +### 9.5 Escopo + +| Condicao | Viabilidade | +|-----------|-----------| +| Metrica usada para verificacao de saude / paridade | **Viavel** | +| Metrica visivel mas nao ranqueada | **Viavel** | +| Metrica ranqueada entre equipes | **Fragil** — requer que todos os gestores cooperem | +| Metrica vinculada a compensacao / recursos | **Nao viavel** — o dilema do prisioneiro domina | +| Reforma metrica possivel no nivel organizacional | **Desnecessario** — corrija a metrica em vez disso | + +**A melhor solucao e em toda a empresa. A solucao acionavel e um gestor que entende esta prova, protege sua equipe da metrica, escalona por prioridade e usa SPT apenas dentro das classes de prioridade para manter o numero razoavel.** + +--- + +# Parte IV: Avaliacao + +## 10. Advogado do Diabo + +A honestidade intelectual exige reconhecer onde o argumento tem limites. + +### 10.1 A Simplicidade Tem Valor Real + +**Argumento.** A media nao ponderada nao requer pesos de prioridade, estimativas de tamanho de tarefa nem calibracao. + +**Avaliacao: Verdadeiro.** Mas a metrica nao ponderada nao evita premissas — ela as *esconde* ao implicitamente definir todos os pesos como 1 e todos os tamanhos como 1. Uma estimativa reconhecidamente imprecisa do tamanho da tarefa e ainda mais informativa do que a premissa implicita de que todos os tamanhos sao iguais. + +### 10.2 Minimizar o Numero de Pessoas Esperando + +**Argumento.** SPT minimiza o total de pessoas-hora gastas esperando. Se cada tarefa representa um cliente, isso e otimo. + +**Avaliacao: Matematicamente correto.** Se voce administra um Detran e o tempo de cada pessoa e igualmente valioso, SPT e a politica correta. Isso falha quando tarefas nao sao 1:1 com clientes, o custo de espera nao e uniforme ou a metrica e usada para avaliar equipes em vez de servir uma fila literal. + +### 10.3 SPT como Heuristica de Triagem + +**Argumento.** Quando os tamanhos das tarefas se agrupam de forma estreita, SPT aproxima FIFO e a media nao ponderada aproxima a media ponderada. + +**Avaliacao: Correto.** O coeficiente de variacao $CV = \sigma_p / \bar{p}$ determina a severidade da distorcao: + +| $CV$ | Distribuicao de tamanho de tarefa | Distorcao | +|------|----------------------|------------| +| < 0,3 | Estreita (call center) | Desprezivel | +| 0,3 – 1,0 | Moderada (TI mista) | Moderada | +| > 1,0 | Ampla (fila de TI tipica) | Severa | + +Um service desk de TI tipico abrange de 15 minutos a mais de 40 horas ($CV > 2$). A distorcao nao e um caso extremo — e o padrao. + +### 10.4 Manipulacao Requer Malicia + +**Argumento.** Os teoremas mostram que a metrica *pode* ser manipulada, nao que *sera* manipulada. + +**Avaliacao: Este e o contra-argumento mais forte.** Se a metrica e puramente informativa e nunca influencia comportamento, o incentivo a manipulacao esta ausente. Contudo, qualquer metrica reportada a gestao, vinculada a OKRs ou discutida em retrospectivas influenciara comportamento. Esta e a Lei de Goodhart [6, 7] — e se aplica a equipes bem-intencionadas tao confiavelmente quanto a equipes cinicas. A deriva acontece organicamente: concluir tres chamados faceis "parece produtivo" enquanto a metrica valida a sensacao. + +### 10.5 Quando a Media Nao Ponderada e Defensavel + +A metrica e defensavel **apenas quando todas as quatro condicoes valem**: + +1. Tamanhos de tarefa sao aproximadamente uniformes ($CV < 0{,}3$) +2. Sem diferenciacao de prioridade (todas as tarefas igualmente importantes) +3. Cada tarefa representa exatamente um cliente +4. A metrica nao e usada para avaliar, recompensar ou direcionar comportamento + +Essas condicoes raramente sao atendidas nos sistemas onde a metrica e mais comumente usada. + +--- + +## 11. Trabalhos Relacionados + +Este artigo se situa na interseccao de varias literaturas que nao haviam sido previamente conectadas. + +### 11.1 Teoria de Escalonamento e Equidade + +Smith [1] estabeleceu o resultado de otimalidade de SPT e a regra WSJF em 1956. Conway, Maxwell e Miller [2] forneceram o tratamento abrangente em livro-texto. A equidade de politicas de escalonamento baseadas em tamanho tem sido debatida no escalonamento de sistemas computacionais: Bansal e Harchol-Balter [22] investigaram a injustica de SRPT; Wierman e Harchol-Balter [23] formalizaram classificacoes de equidade contra Processor-Sharing; Angel, Bampis e Pascual [21] mediram a qualidade do escalonamento SPT contra criterios de otimalidade justa. + +Esse trabalho anterior analisa equidade em escalonamento de CPU e servidores. O presente artigo aplica os mesmos resultados matematicos ao *gerenciamento de tarefas organizacionais*, onde o "escalonador" e uma equipe humana, os "jobs" sao solicitacoes de clientes com prioridades de impacto no negocio, e a "funcao objetivo" e uma metrica gerencial. O mecanismo e identico; as consequencias diferem porque o escalonamento organizacional possui sistemas de prioridade, relacionamentos com clientes e custos psicologicos que o escalonamento de CPU nao possui. + +### 11.2 Disfuncao de Medicao + +Austin [18] provou que a medicao incompleta — medir apenas um subconjunto das dimensoes relevantes — cria incentivos para otimizar as dimensoes medidas em detrimento das nao medidas, e que esse efeito nao e meramente possivel, mas *inevitavel* quando a medicao esta vinculada a recompensas. Seu enquadramento de assimetria de informacao e estreitamente paralelo a Secao 7. O presente artigo fornece o mecanismo matematico especifico (Teoremas 1–2) para o caso de escalonamento de tarefas, e estende o argumento pela psicologia (Secao 8) para tracar a cadeia completa de dano organizacional. + +Muller [19] documentou "fixacao por metricas" em educacao, saude, policiamento e financas, fornecendo extensa evidencia empirica para os padroes teorizados na Secao 7.4. Campbell [24] formalizou o efeito corruptor de usar indicadores como metas, complementando a observacao original de Goodhart [6] e a generalizacao de Strathern [7]. + +Bevan e Hood [26] documentaram empiricamente comportamentos de manipulacao no sistema de saude publica ingles — incluindo os exatos padroes de "acertar a meta e errar o objetivo" descritos em nossa Secao 5.2. + +### 11.3 Custos Psicologicos da Disfuncao Metrica + +A aplicacao de dano moral (Shay [16], Litz et al. [17]) a contextos empresariais tem precedente recente: um estudo de 2024 no *Journal of Business Ethics* [25] estendeu explicitamente o construto a locais de trabalho com fins lucrativos, encontrando condicoes estruturais semelhantes as descritas na Secao 8.4. Moore [27] analisou o *desengajamento* moral — a reestruturacao cognitiva que permite comportamento antiético sob pressao organizacional. O presente artigo aborda o fenomeno complementar: o dano a individuos que *se recusam* a se desengajar. + +### 11.4 O que e Novo + +Os componentes individuais — otimalidade de SPT, Lei de Goodhart, disfuncao de medicao, dano moral — todos tem precedentes. As contribuicoes deste artigo sao: + +1. **A lei de conservacao (Teorema 2) usada prescritivamente** — como um argumento construtivo de que o tempo de conclusao ponderado por trabalho *nao pode* ser manipulado, em vez de como um resultado teorico de escalonamento. + +2. **A prova especifica de que classes de prioridade tornam a metrica algebricamente adversarial** (Teoremas 8–9) — nao meramente empiricamente ruim, mas estruturalmente contraditoria, com zero informacao mutua entre o escalonamento e o sistema de prioridades. + +3. **A cadeia integrada** da prova matematica passando por assimetria de informacao, dano psicologico e espiral de selecao adversa — tracando uma unica metrica desde Smith (1956) ate o esvaziamento organizacional. + +4. **A estrategia de internalizacao pelo gestor** (Secao 9) com analise formal em teoria dos jogos de sua estabilidade e condicoes de colapso sob competicao entre equipes. + +5. **A aplicacao da teoria de escalonamento a critica de gestao organizacional** — provando que uma metrica de equipe comumente usada possui patologias especificas e quantificaveis, em vez de argumentar a partir de anedotas ou principios gerais. + +--- + +## 12. Conclusao + +O tempo medio de conclusao nao ponderado e uma **estatistica enviesada** que: + +1. **Pode ser manipulado** por politica de escalonamento (Teorema 1), diferentemente do tempo de conclusao ponderado por trabalho que e invariante ao escalonamento (Teorema 2). +2. **Incentiva a inanicao** de tarefas grandes (Teorema 3). +3. **Degrada a satisfacao do cliente** com zero ganho compensatorio de produtividade (Teorema 7). +4. **Contradiz ativamente sistemas de prioridade** ao carregar zero informacao sobre classificacao de impacto no negocio (Teorema 9). +5. **Ignora a prioridade inteiramente** em sua recomendacao de escalonamento, produzindo atraso ponderado por prioridade subotimo sempre que prioridade e tamanho nao sao perfeitamente inversamente correlacionados (Teorema 10). + +Uma metrica que pode ser melhorada reordenando trabalho — sem fazer qualquer trabalho adicional — esta medindo a politica de escalonamento, nao a capacidade do sistema. Quando combinada com um sistema de prioridades, ela recomenda o escalonamento que inflige o maior dano ao trabalho de maior prioridade. + +Quando a metrica e reportada a clientes, ela cria uma assimetria de informacao (Secao 7) cujo equilibrio de negocio e lucrativo, mas fragil. Quando membros da equipe entendem suas falhas, ela viola sua motivacao intrinseca e seleciona pela saida das pessoas mais competentes (Secao 8). Um unico gestor informado pode mitigar parcialmente esses efeitos por meio de otimizacao restrita (Secao 9), mas essa estrategia cooperativa nao e estavel sob competicao entre equipes. + +A media nao ponderada e defensavel apenas sob condicoes restritas (Secao 10.5): tamanhos de tarefa uniformes, sem prioridades, mapeamento um-para-um entre cliente e tarefa, e nenhuma influencia comportamental. Essas condicoes raramente sao atendidas. + +**O tempo medio de conclusao nao ponderado nao e uma medida justa ou precisa do desempenho de execucao de tarefas. Sua adocao como metrica de equipe racionalmente produzira inanicao de trabalho complexo, violacao de prioridades declaradas, resultados desiguais para clientes e a ilusao de produtividade onde nenhuma existe.** + +A melhor solucao e a reforma metrica organizacional. A solucao acionavel e um gestor que entende esta prova. + +--- + +## Referencias + +### Scheduling Theory + +[1] Smith, W. E. (1956). Various optimizers for single-stage production. +*Naval Research Logistics Quarterly*, 3(1–2), 59–66. +doi:[10.1002/nav.3800030106](https://doi.org/10.1002/nav.3800030106) + +> Origem do resultado de otimalidade de SPT (Teorema 1), da regra de tempo de conclusao ponderado $w_i/p_i$ decrescente (WSJF, Teorema 11) e da tecnica de prova por troca de pares adjacentes (argumento de troca) usada ao longo do artigo. + +[2] Conway, R. W., Maxwell, W. L., & Miller, L. W. (1967). *Theory of +Scheduling*. Addison-Wesley. + +> Tratamento padrao em livro-texto da teoria de escalonamento de maquina unica, estendendo os resultados de Smith. + +[3] Little, J. D. C. (1961). A proof for the queuing formula: L = λW. +*Operations Research*, 9(3), 383–387. +doi:[10.1287/opre.9.3.383](https://doi.org/10.1287/opre.9.3.383) + +> Primeira prova rigorosa da Lei de Little. Referenciada na Secao 3.2 para contexto de teoria de filas. + +[4] Little, J. D. C. (2011). Little's Law as viewed on its 50th +anniversary. *Operations Research*, 59(3), 536–549. +doi:[10.1287/opre.1110.0941](https://doi.org/10.1287/opre.1110.0941) + +> Retrospectiva discutindo escopo, limitacoes e mal-aplicacoes comuns. + +[5] Reinertsen, D. G. (2009). *The Principles of Product Development +Flow: Second Generation Lean Product Development*. Celeritas Publishing. +ISBN: 978-0-9844512-0-8. + +> Popularizou WSJF e "Custo do Atraso / Duracao" em contextos ageis/lean. A fundamentacao matematica e Smith (1956) [1]. + +### Measurement and Incentives + +[6] Goodhart, C. A. E. (1984). Problems of monetary management: The U.K. +experience. In *Monetary Theory and Practice* (pp. 91–121). Macmillan. + +> Fonte da Lei de Goodhart: "Qualquer regularidade estatistica observada tendera a entrar em colapso uma vez que pressao seja exercida sobre ela para fins de controle." + +[7] Strathern, M. (1997). 'Improving ratings': Audit in the British +university system. *European Review*, 5(3), 305–321. +doi:[10.1002/(SICI)1234-981X(199707)5:3<305::AID-EURO184>3.0.CO;2-4](https://doi.org/10.1002/(SICI)1234-981X(199707)5:3%3C305::AID-EURO184%3E3.0.CO;2-4) + +> Generalizou a Lei de Goodhart: "Quando uma medida se torna uma meta, ela deixa de ser uma boa medida." + +### Behavioral Economics + +[8] Kahneman, D., & Tversky, A. (1979). Prospect theory: An analysis of +decision under risk. *Econometrica*, 47(2), 263–292. +doi:[10.2307/1914185](https://doi.org/10.2307/1914185) + +> Estabeleceu a aversao a perda. Referenciado na Secao 4.5. + +### Game Theory and Contract Theory + +[9] Akerlof, G. A. (1970). The market for "lemons": Quality uncertainty +and the market mechanism. *The Quarterly Journal of Economics*, 84(3), +488–500. doi:[10.2307/1879431](https://doi.org/10.2307/1879431) + +> Assimetria de informacao e selecao adversa. O equilibrio de agrupamento na Secao 7.5 e estruturalmente analogo. + +[10] Hölmstrom, B. (1979). Moral hazard and observability. *The Bell +Journal of Economics*, 10(1), 74–91. +doi:[10.2307/3003320](https://doi.org/10.2307/3003320) + +> Tratamento formal de risco moral. O cenario de relatorio de metricas na Secao 7.5 e um problema de risco moral. + +### Psychology + +[11] Festinger, L. (1957). *A Theory of Cognitive Dissonance*. Stanford +University Press. ISBN: 978-0-8047-0131-0. + +> Teoria fundacional. Referenciada na Secao 8.2. + +[12] Deci, E. L., & Ryan, R. M. (1985). *Intrinsic Motivation and +Self-Determination in Human Behavior*. Plenum Press. +ISBN: 978-0-306-42022-1. + +> Tratamento original da Teoria da Autodeterminacao. Referenciada na Secao 8.3. + +[13] Ryan, R. M., & Deci, E. L. (2000). Self-determination theory and +the facilitation of intrinsic motivation, social development, and +well-being. *American Psychologist*, 55(1), 68–78. +doi:[10.1037/0003-066X.55.1.68](https://doi.org/10.1037/0003-066X.55.1.68) + +> Visao geral da Teoria da Autodeterminacao vinculando satisfacao de necessidades a motivacao intrinseca e bem-estar. + +[14] Seligman, M. E. P., & Maier, S. F. (1967). Failure to escape +traumatic shock. *Journal of Experimental Psychology*, 74(1), 1–9. +doi:[10.1037/h0024514](https://doi.org/10.1037/h0024514) + +> Demonstracao original do desamparo aprendido. Referenciada na Secao 8.5. + +[15] Seligman, M. E. P. (1975). *Helplessness: On Depression, +Development, and Death*. W. H. Freeman. ISBN: 978-0-7167-0752-3. + +> Tratamento estendido conectando desamparo aprendido a depressao humana e comportamento institucional. + +[16] Shay, J. (1994). *Achilles in Vietnam: Combat Trauma and the Undoing +of Character*. Atheneum / Simon & Schuster. ISBN: 978-0-689-12182-3. + +> Introduziu o conceito de dano moral. Referenciado na Secao 8.4. + +[17] Litz, B. T., Stein, N., Delaney, E., Lebowitz, L., Nash, W. P., +Silva, C., & Maguen, S. (2009). Moral injury and moral repair in war +veterans: A preliminary model and intervention strategy. *Clinical +Psychology Review*, 29(8), 695–706. +doi:[10.1016/j.cpr.2009.07.003](https://doi.org/10.1016/j.cpr.2009.07.003) + +> Formalizou o dano moral como construto clinico. Definicao citada na Secao 8.4. + +### Organizational Measurement + +[18] Austin, R. D. (1996). *Measuring and Managing Performance in +Organizations*. Dorset House. ISBN: 978-0-932633-36-1. + +> Provou que a medicao incompleta cria incentivos inevitaveis para otimizar dimensoes medidas em detrimento das nao medidas. O enquadramento de assimetria de informacao e estreitamente paralelo a Secao 7. O predecessor mais importante do argumento deste artigo. + +[19] Muller, J. Z. (2018). *The Tyranny of Metrics*. Princeton University +Press. ISBN: 978-0-691-17495-2. + +> Tratamento abrangente de "fixacao por metricas" em educacao, saude, policiamento e financas. Extensa evidencia empirica para os padroes teorizados na Secao 7.4. + +### Scheduling Fairness + +[20] Coffman, E. G., Shanthikumar, J. G., & Yao, D. D. (1992). +Multiclass queueing systems: Polymatroid structure and optimal scheduling +control. *Operations Research*, 40(S2), S293–S299. + +> Leis de conservacao em escalonamento. A invariancia ao escalonamento do tempo de conclusao ponderado por trabalho (Teorema 2) e um caso dessas leis de conservacao. + +[21] Angel, E., Bampis, E., & Pascual, F. (2008). How good are SPT +schedules for fair optimality criteria? *Annals of Operations Research*, +159(1), 53–64. doi:[10.1007/s10479-007-0267-0](https://doi.org/10.1007/s10479-007-0267-0) + +> Mede diretamente a qualidade do escalonamento SPT contra criterios de equidade. Predecessor mais proximo na teoria de escalonamento a analise de equidade da Secao 4. + +[22] Bansal, N., & Harchol-Balter, M. (2001). Analysis of SRPT +scheduling: Investigating unfairness. *ACM SIGMETRICS Performance +Evaluation Review*, 29(1), 279–290. +doi:[10.1145/384268.378792](https://doi.org/10.1145/384268.378792) + +> Investiga a crenca de que SRPT penaliza injustamente tarefas grandes em escalonamento computacional. Argumenta que a injustica e menor do que se acreditava, mas reconhece a tensao central. + +[23] Wierman, A., & Harchol-Balter, M. (2003). Classifying scheduling +policies with respect to unfairness in an M/GI/1. *ACM SIGMETRICS +Performance Evaluation Review*, 31(1), 238–249. + +> Formaliza definicoes de equidade para politicas de escalonamento por comparacao com Processor-Sharing. + +### Additional References + +[24] Campbell, D. T. (1979). Assessing the impact of planned social +change. *Evaluation and Program Planning*, 2(1), 67–90. +doi:[10.1016/0149-7189(79)90048-X](https://doi.org/10.1016/0149-7189(79)90048-X) + +> Lei de Campbell: "Quanto mais qualquer indicador social quantitativo for usado para tomada de decisao social, mais sujeito estara a pressoes de corrupcao e mais apto estara a distorcer e corromper os processos sociais que pretende monitorar." Complementa a Lei de Goodhart [6]. + +[25] Ferreira, C. M., et al. (2024). It's business: A qualitative study +of moral injury in business settings. *Journal of Business Ethics*. +doi:[10.1007/s10551-024-05615-0](https://doi.org/10.1007/s10551-024-05615-0) + +> Estende o dano moral a locais de trabalho com fins lucrativos. Valida a aplicacao da Secao 8.4 de Shay/Litz para alem de contextos militares e de saude. + +[26] Bevan, G., & Hood, C. (2006). What's measured is what matters: +Targets and gaming in the English public health care system. *Public +Administration*, 84(3), 517–538. +doi:[10.1111/j.1467-9299.2006.00600.x](https://doi.org/10.1111/j.1467-9299.2006.00600.x) + +> Documenta empiricamente comportamentos de manipulacao incluindo "acertar a meta e errar o objetivo." Fornece evidencia do mundo real para a contradicao metrica-prioridade da Secao 5.2. + +[27] Moore, C. (2012). Why employees do bad things: Moral disengagement +and unethical organizational behavior. *Personnel Psychology*, 65(1), +1–48. doi:[10.1111/j.1744-6570.2011.01237.x](https://doi.org/10.1111/j.1744-6570.2011.01237.x) + +> Analisa o *desengajamento* moral — a reestruturacao cognitiva que permite comportamento antietico. A Secao 8 aborda o fenomeno complementar: o dano a individuos que *se recusam* a se desengajar. + +--- + +*Esta prova foi desenvolvida conversacionalmente e formalizada em 28/03/2026.* diff --git a/README.th.md b/README.th.md new file mode 100644 index 0000000..4ed5193 --- /dev/null +++ b/README.th.md @@ -0,0 +1,1253 @@ +# ค่าเฉลี่ยเวลาดำเนินการแบบไม่ถ่วงน้ำหนักไม่ใช่มาตรวัดที่ยุติธรรมสำหรับการจัดลำดับงาน + +การพิสูจน์ทางคณิตศาสตร์ว่าค่าเฉลี่ยเวลาดำเนินการแบบไม่ถ่วงน้ำหนักเป็น +สถิติที่มีอคติ ซึ่งสร้างแรงจูงใจให้เลือกทำเฉพาะงานง่ายๆ และว่าข้อได้เปรียบ +ในการจัดลำดับงานที่มาตรวัดนี้ดูเหมือนจะเผยให้เห็นนั้นเป็นเพียงสิ่งประดิษฐ์ +ของมาตรวัด ไม่ใช่ภาพสะท้อนของปริมาณงานจริงหรือคุณภาพการบริการ + +--- + +## 1. บทนำ + +องค์กรจำนวนมากวัดผลการปฏิบัติงานด้านการดำเนินการโดยใช้**ค่าเฉลี่ยเวลา +ดำเนินการแบบไม่ถ่วงน้ำหนัก**: จำนวนชั่วโมง (หรือวัน) เฉลี่ยระหว่างการส่งงาน +และการแก้ไขงานเสร็จสิ้น โดยนับแต่ละงานเท่าเทียมกันไม่ว่าจะมีขนาดหรือ +ลำดับความสำคัญเท่าใด + +บทความนี้พิสูจน์ว่ามาตรวัดนี้ไม่เพียงแต่ไม่แม่นยำ แต่มีอคติเชิงโครงสร้าง +สามารถปรับปรุงได้ด้วยการเรียงลำดับงานใหม่โดยไม่ต้องทำงานเพิ่มเติมใดๆ +(ทฤษฎีบท 1) ในขณะที่ทางเลือกแบบถ่วงน้ำหนักอย่างเหมาะสมนั้นไม่สามารถ +ถูกบิดเบือนด้วยการจัดลำดับได้เลย (ทฤษฎีบท 2) เมื่อรวมกับระบบลำดับ +ความสำคัญ มาตรวัดนี้จะขัดแย้งกับการจำแนกลำดับความสำคัญขององค์กรเอง +โดยตรง (ทฤษฎีบท 9) + +การอภิปรายดำเนินไปเป็นสี่ส่วน: + +- **ส่วนที่ I** (บทที่ 2–4) สร้างรากฐานทางคณิตศาสตร์: + ค่าเฉลี่ยแบบไม่ถ่วงน้ำหนักสามารถถูกบิดเบือนได้ด้วยการจัดลำดับแบบ + Shortest Processing Time (SPT หรือ งานสั้นก่อน) ค่าเฉลี่ยแบบถ่วง + น้ำหนักตามปริมาณงานไม่แปรผันตามลำดับการจัดตาราง และผลกระทบต่อ + คุณภาพการบริการที่ตามมาเป็นลบอย่างพิสูจน์ได้ + +- **ส่วนที่ II** (บทที่ 5–6) ขยายแบบจำลองไปสู่งานที่มีการจำแนกลำดับ + ความสำคัญ พิสูจน์ว่ามาตรวัดกลายเป็นปฏิปักษ์ต่อระบบลำดับความสำคัญ + และเสนอทางเลือกแบบถ่วงน้ำหนักพร้อมตัวอย่างการคำนวณจากโต๊ะบริการ + ไอที + +- **ส่วนที่ III** (บทที่ 7–9) ตรวจสอบพลวัตขององค์กร: สิ่งที่เกิดขึ้นเมื่อ + มาตรวัดถูกรายงานต่อลูกค้า (ความไม่สมมาตรของข้อมูล) สิ่งที่เกิดขึ้นกับ + สมาชิกทีมที่เข้าใจข้อบกพร่องของมาตรวัด (ความเสียหายทางจิตใจ) และสิ่งที่ + ผู้จัดการคนเดียวที่มีความรู้สามารถทำได้ (การเพิ่มประสิทธิภาพภายใต้ข้อจำกัด + พร้อมการวิเคราะห์เสถียรภาพเชิงทฤษฎีเกม) + +- **ส่วนที่ IV** (บทที่ 10–12) นำเสนอข้อโต้แย้งที่ซื่อสัตย์ จัดวางงานนี้ใน + วรรณกรรมที่มีอยู่ และสรุป + +ผลลัพธ์หลักสร้างขึ้นบนทฤษฎีการจัดลำดับงานพื้นฐานของ Smith (1956) [1] +ขยายผ่านทฤษฎีเกม [9, 10] ทฤษฎีการวัดผลองค์กร [18, 19] และจิตวิทยา +[11–17] เพื่อติดตามห่วงโซ่ที่สมบูรณ์จากการพิสูจน์ทางคณิตศาสตร์เกี่ยวกับ +มาตรวัดเฉพาะไปจนถึงผลลัพธ์ขององค์กร + +--- + +# ส่วนที่ I: รากฐานทางคณิตศาสตร์ + +## 2. นิยาม + +กำหนดให้มี **n** งาน โดยมีเวลาประมวลผล $p_1, p_2, \ldots, p_n$ + +**ตารางงาน** $\sigma$ คือการเรียงสับเปลี่ยนของ $\{1, 2, \ldots, n\}$ ที่กำหนด +งานให้กับลำดับการดำเนินการบนผู้ปฏิบัติงานคนเดียว + +**เวลาดำเนินการ**ของงาน $\sigma(k)$ ภายใต้ตารางงาน $\sigma$ คือ: + +$$C_{\sigma(k)} = \sum_{j=1}^{k} p_{\sigma(j)}$$ + +**ค่าเฉลี่ยเวลาดำเนินการแบบไม่ถ่วงน้ำหนัก**คือ: + +$$\bar{C}(\sigma) = \frac{1}{n} \sum_{k=1}^{n} C_{\sigma(k)}$$ + +**ค่าเฉลี่ยเวลาดำเนินการแบบถ่วงน้ำหนักตามปริมาณงาน**คือ: + +$$\bar{C}_w(\sigma) = \frac{\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)}}{\sum_{k=1}^{n} p_{\sigma(k)}}$$ + +--- + +## 3. ผลลัพธ์หลัก + +### 3.1 ค่าเฉลี่ยแบบไม่ถ่วงน้ำหนักสามารถถูกบิดเบือนได้ + +**ทฤษฎีบท 1** (Smith, 1956 [1])**.** ตารางงานที่ทำให้ +$\bar{C}(\sigma)$ มีค่าน้อยที่สุดคือการจัดลำดับแบบ Shortest Processing Time +first (SPT หรือ งานสั้นก่อน): เรียงลำดับงานให้ +$p_{\sigma(1)} \le p_{\sigma(2)} \le \cdots \le p_{\sigma(n)}$ + +**การพิสูจน์ (อาร์กิวเมนต์การแลกเปลี่ยน [1, 2])** + +พิจารณาตารางงาน $\sigma$ ใดๆ ที่งานสองงานที่อยู่ติดกัน $i, j$ มีคุณสมบัติ +$p_i > p_j$ โดยที่งาน $i$ ถูกจัดก่อนงาน $j$ ทันที ให้ $t$ +เป็นเวลาเริ่มต้นของงาน $i$ + +| | งาน $i$ เสร็จ | งาน $j$ เสร็จ | ผลรวม | +|---|---|---|---| +| **ก่อนสลับ** ($i$ แล้ว $j$) | $t + p_i$ | $t + p_i + p_j$ | $2t + 2p_i + p_j$ | +| **หลังสลับ** ($j$ แล้ว $i$) | $t + p_j$ | $t + p_j + p_i$ | $2t + p_i + 2p_j$ | + +การเปลี่ยนแปลงในผลรวมของเวลาดำเนินการคือ: + +$$(2p_i + p_j) - (p_i + 2p_j) = p_i - p_j > 0$$ + +การสลับคู่ที่งานยาวอยู่ก่อนงานสั้นทุกครั้งจะลดผลรวมรวมอย่างเข้มงวด +ตารางงานที่ไม่ใช่ SPT ทุกตารางจะมีคู่ดังกล่าวอยู่ การสลับซ้ำๆ จะลู่เข้าสู่ SPT +ดังนั้น SPT จึงทำให้ $\bar{C}(\sigma)$ มีค่าน้อยที่สุดอย่างเป็นเอกลักษณ์ $\blacksquare$ + +### 3.2 ค่าเฉลี่ยแบบถ่วงน้ำหนักตามปริมาณงานไม่แปรผันตามตารางงาน + +**ทฤษฎีบท 2.** ค่าเฉลี่ยเวลาดำเนินการแบบถ่วงน้ำหนักตามปริมาณงาน +$\bar{C}_w(\sigma)$ มีค่าเท่ากันสำหรับทุกตารางงาน $\sigma$ + +**การพิสูจน์** + +กระจายตัวเศษ: + +$$\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)} = \sum_{k=1}^{n} p_{\sigma(k)} \sum_{j=1}^{k} p_{\sigma(j)}$$ + +เปลี่ยนดัชนีโดยให้ $a = \sigma(k)$ และ $b = \sigma(j)$ ผลรวมซ้อนนับทุกคู่ +อันดับ $(a, b)$ ที่ $b$ ถูกจัดไม่ช้ากว่า $a$: + +$$= \sum_{\substack{a, b \\ b \preceq_\sigma a}} p_a \, p_b$$ + +สำหรับคู่ $(a, b)$ ใดๆ ที่ $a \ne b$ จะมีเพียงหนึ่งในสอง +$\{b \preceq_\sigma a\}$ หรือ $\{a \prec_\sigma b\}$ ที่เป็นจริง พจน์บน +เส้นทแยงมุม ($a = b$) มีส่วนร่วม $p_a^2$ ไม่ว่าลำดับจะเป็นอย่างไร ดังนั้น: + +$$\sum_{\substack{a, b \\ b \preceq_\sigma a}} p_a \, p_b = \sum_{a} p_a^2 + \sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b$$ + +เมื่อรวมกับผลรวมส่วนเติมเต็ม ผลรวมนอกเส้นทแยงมุมทั้งสองครอบคลุม +คู่ไม่เรียงลำดับทั้งหมด: + +$$\sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b + \sum_{\substack{a \ne b \\ a \prec_\sigma b}} p_a \, p_b = \sum_{a \ne b} p_a \, p_b$$ + +ด้านขวามือไม่ขึ้นอยู่กับตารางงาน โดยสมมาตรของ $p_a p_b$ +ผลรวมนอกเส้นทแยงมุมทั้งสองมีค่าเท่ากัน: + +$$\sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b = \frac{1}{2} \sum_{a \ne b} p_a \, p_b$$ + +ดังนั้น: + +$$\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)} = \sum_a p_a^2 + \frac{1}{2} \sum_{a \ne b} p_a \, p_b = \frac{1}{2}\left(\sum_a p_a\right)^2 + \frac{1}{2}\sum_a p_a^2$$ + +นิพจน์นี้ไม่มีการอ้างอิงถึง $\sigma$ เนื่องจากตัวส่วน +$\sum p_a$ ก็ไม่ขึ้นกับตารางงานเช่นกัน: + +$$\bar{C}_w(\sigma) = \frac{\frac{1}{2}\left(\sum p_a\right)^2 + \frac{1}{2}\sum p_a^2}{\sum p_a}$$ + +จึง**คงที่สำหรับทุกตารางงาน** $\blacksquare$ + +นี่เป็นตัวอย่างหนึ่งของกฎการอนุรักษ์ในการจัดลำดับงานที่ระบุโดย +Coffman, Shanthikumar, และ Yao [20] ความไม่แปรผันนี้สอดคล้องกับ +การวัดว่าหน่วย*งาน*ต้องรอนานเพียงใด แทนที่จะวัดว่า*งาน*หนึ่งๆ ต้องรอ +นานเพียงใด สถิติแบบไม่ถ่วงน้ำหนักนับจำนวนงานที่เสร็จสิ้นแทนที่จะนับ +ปริมาณงาน ซึ่งเป็นสาเหตุที่ทำให้สามารถถูกบิดเบือนได้ (ดูเพิ่มเติม +Little [3, 4] สำหรับบริบทเชิงทฤษฎีแถวคอย โดยมีข้อควรระวังว่ากฎของ +Little ใช้ได้โดยตรงเฉพาะกับระบบสถานะคงตัว ไม่ใช่กรณีแบบกลุ่มที่ +วิเคราะห์ในที่นี้) + +### 3.3 ตัวอย่างประกอบ + +งานสองงาน: $A$ มี $p_A = 1$ ชั่วโมง, $B$ มี $p_B = 10$ ชั่วโมง + +| ตารางงาน | $C_A$ | $C_B$ | ค่าเฉลี่ยไม่ถ่วงน้ำหนัก | ค่าเฉลี่ยถ่วงน้ำหนักตามปริมาณงาน | +|----------|-------|-------|-----------------|-------------------| +| SPT (A ก่อน) | 1 | 11 | 6.0 | 111/11 ≈ 10.09 | +| ลำดับกลับ (B ก่อน) | 11 | 10 | 10.5 | 111/11 ≈ 10.09 | + +SPT ดู**ดีกว่า 4.5 ชั่วโมง**ในมาตรวัดแบบไม่ถ่วงน้ำหนัก แต่ให้การ +**ปรับปรุงเป็นศูนย์**ในมาตรวัดแบบถ่วงน้ำหนักตามปริมาณงาน ข้อได้เปรียบ +ที่ปรากฏนั้นมีอยู่เพียงเพราะสถิติแบบไม่ถ่วงน้ำหนักอนุญาตให้งาน 1 ชั่วโมง +"ลงคะแนน" เท่ากับงาน 10 ชั่วโมง + +--- + +## 4. ผลกระทบต่อคุณภาพการบริการ + +### 4.1 การอดอาหารของงานขนาดใหญ่ + +**ทฤษฎีบท 3 (อคติของมาตรวัด)** นโยบายการจัดลำดับใดๆ ที่ทำให้ค่าเฉลี่ย +เวลาดำเนินการแบบไม่ถ่วงน้ำหนักมีค่าน้อยที่สุด จะทำให้เวลาดำเนินการ +ของงานที่ใหญ่ที่สุดมีค่ามากที่สุดอย่างหลีกเลี่ยงไม่ได้ + +**การพิสูจน์** SPT วางงานที่ใหญ่ที่สุดไว้ลำดับสุดท้าย เวลาดำเนินการของ +งานนั้นเท่ากับเวลาประมวลผลรวม $\sum p_i$ ซึ่งเป็นเวลาดำเนินการสูงสุด +ที่เป็นไปได้สำหรับงานใดๆ ภายใต้ตารางงานใดๆ ที่ไม่ได้วางงานที่ใหญ่ที่สุด +ไว้สุดท้าย งานนั้นจะเสร็จเร็วกว่าอย่างเข้มงวด $\blacksquare$ + +สิ่งนี้สร้าง**แรงจูงใจให้เกิดการอดอาหาร**: ตัวแทนที่มีเหตุผลซึ่งเพิ่ม +ประสิทธิภาพสถิติแบบไม่ถ่วงน้ำหนักจะเลื่อนงานขนาดใหญ่ออกไปอย่าง +ไม่มีกำหนดเพื่อทำงานขนาดเล็กแทน Austin [18] ระบุรูปแบบทั่วไปนี้ ว่า +การวัดผลที่ไม่สมบูรณ์สร้างแรงจูงใจให้เพิ่มประสิทธิภาพมิติที่ถูกวัดโดยเสียสละ +มิติที่ไม่ได้ถูกวัด ในบริบทของการจัดการผลการปฏิบัติงานขององค์กร ทฤษฎีบท 3 +ให้กลไกเฉพาะสำหรับการจัดลำดับงาน + +### 4.2 เวลาดำเนินการสูงสุดสำหรับงานที่ใหญ่ที่สุด + +**ทฤษฎีบท 4 (SPT ทำให้เวลาดำเนินการของงานที่ใหญ่ที่สุดมีค่ามากที่สุดอย่างเป็นเอกลักษณ์)** +ในบรรดาตารางงานทั้งหมด SPT เป็นนโยบายเดียวที่กำหนดเวลาดำเนินการ +สูงสุดที่เป็นไปได้ ($\sum p_i$) ให้กับงานที่ใหญ่ที่สุด + +**การพิสูจน์** SPT เรียงลำดับงานจากน้อยไปมากตาม $p_i$ โดยวางงาน +ที่ใหญ่ที่สุด $p_{\max}$ ไว้ตำแหน่งสุดท้าย งานสุดท้ายในตารางงานใดๆ มีเวลา +ดำเนินการ $\sum_{i=1}^{n} p_i$ ซึ่งเป็นค่าสูงสุดที่งานใดๆ จะได้รับ ภายใต้ +ตารางงานใดๆ ที่ไม่ได้วาง $p_{\max}$ ไว้สุดท้าย งานนั้นจะเสร็จก่อน +$\sum p_i$ อย่างเข้มงวด $\blacksquare$ + +**ผลสืบเนื่อง 4.1** ทีมที่เพิ่มประสิทธิภาพค่าเฉลี่ยเวลาดำเนินการแบบไม่ถ่วง +น้ำหนักจะส่งมอบประสบการณ์ที่แย่ที่สุดอย่างเป็นระบบให้กับลูกค้าที่มีความ +ต้องการซับซ้อนที่สุด นี่ไม่ใช่ผลข้างเคียง แต่เป็น*กลไก*ที่ทำให้มาตรวัดดีขึ้น + +**หมายเหตุเกี่ยวกับอัตราส่วนความช้า** SPT จริงๆ แล้ว*บีบอัด*อัตราส่วน +ความช้า ($S_i = C_i / p_i$) เพราะงานขนาดใหญ่ในตำแหน่งหลังๆ มีตัวส่วน +ขนาดใหญ่ที่ดูดซับผลรวมสะสม ตัวอย่างเช่น งาน $[1, 5, 10]$: SPT ให้ +อัตราส่วนความช้า $[1, 1.2, 1.6]$ (ความแปรปรวนต่ำ) ในขณะที่ LPT ให้ +$[1, 3, 16]$ (ความแปรปรวนสูง) ความเสียหายของ SPT ต่อลูกค้าที่มีงาน +ขนาดใหญ่ไม่ปรากฏในอัตราส่วนความช้า แต่ปรากฏใน**เวลาดำเนินการ +สัมบูรณ์** ความแตกต่างนี้สำคัญ: วรรณกรรมเรื่องความยุติธรรมในการจัด +ลำดับงาน [21, 22, 23] ได้ถกเถียงเรื่องความไม่ยุติธรรมของ SPT/SRPT ผ่าน +มาตรวัดที่อิงอัตราส่วนความช้าเป็นหลัก ซึ่งสามารถปิดบังภาระความล่าช้า +สัมบูรณ์ที่พิสูจน์ด้านล่างได้ + +### 4.3 การกระจุกตัวของความล่าช้า + +**ทฤษฎีบท 5 (SPT กระจุกความล่าช้าไปที่งานที่ใหญ่ที่สุด)** ภายใต้ SPT +งานที่ใหญ่ที่สุดแบกรับความล่าช้าสัมบูรณ์มากกว่าตารางงานอื่นใด + +**การพิสูจน์** กำหนดความล่าช้าสัมบูรณ์เป็น $\Delta_i = C_i - p_i$ (เวลาที่ +ใช้ในการรอ โดยไม่ขึ้นกับขนาดของงานเอง) ภายใต้ SPT งานที่ใหญ่ที่สุดอยู่ +ในตำแหน่ง $n$ โดยมี: + +$$\Delta_{\max\text{-task}}^{\text{SPT}} = C_n - p_n = \sum_{i=1}^{n-1} p_i$$ + +นี่คือผลรวมของเวลาประมวลผลของงานอื่นทั้งหมด ซึ่งเป็นความล่าช้าสูงสุด +ที่เป็นไปได้สำหรับงานเดียว ภายใต้ตารางงานใดๆ ที่งานที่ใหญ่ที่สุดไม่ได้ +อยู่ลำดับสุดท้าย ความล่าช้าของงานนั้นจะน้อยกว่าอย่างเข้มงวด ในขณะ +เดียวกัน SPT ให้ความล่าช้าเป็นศูนย์แก่งานที่เล็กที่สุด +($\Delta_1^{\text{SPT}} = 0$) ภาระการรอคิวทั้งหมดถูกเปลี่ยนจากงานเล็ก +ไปยังงานใหญ่ $\blacksquare$ + +SPT ทำให้ความล่าช้า*รวม*มีค่าน้อยที่สุด (ดีสำหรับประสิทธิภาพโดยรวม) โดย +กระจุกความล่าช้าไปที่งานที่สามารถรับได้ดีที่สุดในแง่ของอัตราส่วนความช้า +แต่ในแง่สัมบูรณ์ คือจำนวนชั่วโมงที่ใช้ในการรอ งานที่ใหญ่ที่สุดแบกรับ +น้ำหนักทั้งหมด + +### 4.4 ความไม่แปรผันของปริมาณงาน + +**ทฤษฎีบท 6 (ความไม่แปรผันของปริมาณงาน)** ปริมาณงานรวมที่เสร็จสิ้น +ในช่วงเวลา $T$ ใดๆ จะเท่ากันภายใต้ทุกนโยบายการจัดลำดับ + +**การพิสูจน์** ผู้ปฏิบัติงานประมวลผลงานด้วยอัตราคงที่ ในช่วงเวลา +$T \ge \sum p_i$ ปริมาณงานรวมที่ทำได้คือ $\sum p_i$ ไม่ว่าจะเรียงลำดับ +อย่างไร สำหรับกรณีสถานะคงตัวที่มีงานเข้ามาอย่างต่อเนื่อง ปริมาณงานใน +ระยะยาวถูกกำหนดโดยอัตราการบริการ $\mu$ และไม่ขึ้นกับการจัดลำดับงาน +โดยสิ้นเชิง: + +$$\lim_{T \to \infty} \frac{W(T)}{T} = \mu \quad \text{for all schedules } \sigma$$ + +$\blacksquare$ + +**ผลสืบเนื่อง 6.1** ทีมที่เปลี่ยนจากนโยบายการจัดลำดับใดๆ มาเป็น SPT จะ +สังเกตเห็นการปรับปรุงในค่าเฉลี่ยเวลาดำเนินการแบบไม่ถ่วงน้ำหนักโดย +**ไม่มีการเปลี่ยนแปลงปริมาณงานจริงเลย** มาตรวัดดีขึ้น ผลผลิตไม่ +เปลี่ยนแปลง + +### 4.5 ผลกระทบแบบรวม + +เมื่อรวมทฤษฎีบท 4, 5, และ 6: + +| มาตรวัด | ผลของการเพิ่มประสิทธิภาพค่าเฉลี่ยแบบไม่ถ่วงน้ำหนัก | +|---------|--------------------------------------| +| ปริมาณงาน (งาน/เวลา) | ไม่เปลี่ยนแปลง (ทฤษฎีบท 6) | +| ความล่าช้าสำหรับงานเล็ก | ลดลงมากที่สุด เข้าใกล้ศูนย์ (SPT) | +| ความล่าช้าสำหรับงานใหญ่ | **มากที่สุด** แบกรับภาระการรอคิวทั้งหมด (ทฤษฎีบท 5) | +| เวลาดำเนินการของงานที่ใหญ่ที่สุด | **สูงสุดเท่าที่เป็นไปได้**: $\sum p_i$ (ทฤษฎีบท 4) | + +ผลกระทบสุทธิต่อคุณภาพที่รับรู้เป็นลบ เพราะ: + +1. **การเกลียดการสูญเสียเป็นแบบไม่สมมาตร** [8] ลูกค้าที่งาน 100 ชั่วโมง + ถูกลดลำดับความสำคัญจะประสบกับประสบการณ์เชิงลบที่ใหญ่และเด่นชัด + ลูกค้าที่งาน 1 ชั่วโมงได้รับการเร่งรัดจะประสบกับประสบการณ์เชิงบวก + ที่เล็กน้อยและมักไม่สังเกต + +2. **งานที่ต้องใช้ความพยายามสูงสัมพันธ์กับลูกค้าที่มีมูลค่าสูง** งานขนาดใหญ่ + มีความเป็นไปได้สูงที่จะมาจากลูกค้ารายใหญ่ สัญญาที่ซับซ้อน หรือความ + ต้องการทางธุรกิจที่สำคัญ + +3. **การอดอาหารทวีความรุนแรง** ในระบบต่อเนื่อง (ทฤษฎีบท 3) งานขนาด + ใหญ่อาจถูก**เลื่อนออกไปอย่างไม่มีกำหนด**เมื่องานขนาดเล็กใหม่เข้ามา + เรื่อยๆ + +**ทฤษฎีบท 7 (ผลลัพธ์หลัก)** สำหรับทีมที่ประมวลผลงานที่มีขนาดไม่ +สม่ำเสมอ การใช้ค่าเฉลี่ยเวลาดำเนินการแบบไม่ถ่วงน้ำหนักเป็นมาตรวัดผล +การปฏิบัติงาน: + +(a) ให้**ผลผลิตเพิ่มขึ้นเป็นศูนย์** (ทฤษฎีบท 6) ในขณะที่ +(b) **กำหนดเวลาดำเนินการสูงสุดที่เป็นไปได้**ให้กับงานที่ใหญ่ที่สุด + (ทฤษฎีบท 4) และ +(c) **กระจุกความล่าช้าในการรอคิวทั้งหมด**ไปที่งานที่ใหญ่ที่สุด ในขณะที่ + กำจัดความล่าช้าสำหรับงานที่เล็กที่สุด (ทฤษฎีบท 5) + +นี่ไม่ใช่การแลกเปลี่ยน มาตรวัดสร้างการโอนคุณภาพบริการจากลูกค้าที่มี +งานต้องใช้ความพยายามสูงไปยังลูกค้าที่มีงานต้องใช้ความพยายามต่ำ โดย +ไม่ได้งานสุทธิเพิ่มขึ้นเลย $\blacksquare$ + +--- + +# ส่วนที่ II: ระบบลำดับความสำคัญ + +## 5. การล่มสลายภายใต้การจำแนกลำดับความสำคัญ + +บทก่อนหน้าพิสูจน์ว่าค่าเฉลี่ยเวลาดำเนินการแบบไม่ถ่วงน้ำหนักมีอคติเมื่อ +งานมีขนาดแตกต่างกัน ต่อไปนี้เราจะแสดงว่าการนำ**ระบบลำดับความสำคัญ** +เข้ามาใช้ ซึ่งทีมจริงแทบทุกทีมใช้ จะทำให้มาตรวัดกลายเป็นไม่เพียงแค่มี +อคติ แต่**เป็นปฏิปักษ์โดยตรง**ต่อเป้าหมายที่ระบุไว้ขององค์กร + +### 5.1 แบบจำลองขยาย: งานที่มีลำดับความสำคัญ + +ให้แต่ละงาน $i$ มีเวลาประมวลผล $p_i$ และระดับลำดับความสำคัญ +$q_i \in \{1, 2, 3, 4\}$ โดย 1 คือลำดับสูงสุด (วิกฤต) และ 4 คือต่ำสุด +(ปรับปรุงเสริม/เครื่องสำอาง) กำหนดน้ำหนักลำดับความสำคัญ: + +$$w(q) = \begin{cases} 8 & q = 1 \text{ (Critical)} \\ 4 & q = 2 \text{ (High)} \\ 2 & q = 3 \text{ (Medium)} \\ 1 & q = 4 \text{ (Low)} \end{cases}$$ + +น้ำหนักเฉพาะเหล่านี้เป็นเพียงตัวอย่าง ผลลัพธ์ใช้ได้กับฟังก์ชันน้ำหนักที่ +ลดลงอย่างเข้มงวดใดๆ คุณสมบัติสำคัญคือลำดับความสำคัญถูกกำหนดโดย +**ผลกระทบทางธุรกิจ** ไม่ใช่โดยขนาดของงาน + +### 5.2 มาตรวัดขัดแย้งกับระบบลำดับความสำคัญ + +**ทฤษฎีบท 8 (การกลับหัวของลำดับความสำคัญ-ขนาด)** เมื่อลำดับ +ความสำคัญเป็นอิสระจากขนาดงาน ตารางงานที่ทำให้ค่าเฉลี่ยเวลาดำเนินการ +แบบไม่ถ่วงน้ำหนัก (SPT) มีค่าน้อยที่สุด จะทำให้งานที่มีลำดับความสำคัญต่ำ +เสร็จก่อนงานที่มีลำดับความสำคัญสูงที่มีขนาดใหญ่กว่า โดยค่าคาดหวัง + +**การพิสูจน์** SPT เรียงลำดับงานตาม $p_i$ จากน้อยไปมาก โดยไม่คำนึงถึง +$q_i$ พิจารณาสองงาน: + +- งาน A: $p_A = 40$ ชั่วโมง, $q_A = 1$ (วิกฤต เช่น เซิร์ฟเวอร์ล่ม) +- งาน B: $p_B = 0.5$ ชั่วโมง, $q_B = 4$ (ต่ำ เช่น แก้ไขหน้าตา UI เล็กน้อย) + +SPT จัดลำดับ B ก่อน A ค่าเฉลี่ยแบบไม่ถ่วงน้ำหนักสำหรับคู่นี้: + +$$\bar{C}^{\text{SPT}} = \frac{0.5 + 40.5}{2} = 20.5 \qquad \bar{C}^{\text{priority}} = \frac{40 + 40.5}{2} = 40.25$$ + +มาตรวัดประกาศว่า SPT **ดีกว่าเกือบสองเท่า** ทั้งที่ทำการแก้ไขเครื่อง +สำอางในขณะที่เซิร์ฟเวอร์กำลังล่ม + +โดยทั่วไป เมื่อ $q_i$ เป็นอิสระทางสถิติจาก $p_i$ การเรียงลำดับของ SPT มี +**สหสัมพันธ์เป็นศูนย์**กับลำดับความสำคัญ ในทางปฏิบัติ งานวิกฤต (การล่ม +ของระบบ เหตุการณ์ด้านความปลอดภัย การสูญเสียข้อมูล) มักต้องการงาน +มากกว่างานระดับต่ำ ดังนั้นมาตรวัดจึงมีแนวโน้มที่จะ**สัมพันธ์ผกผัน**กับ +ระบบลำดับความสำคัญ $\blacksquare$ + +### 5.3 การทำลายข้อมูล + +ค่าเฉลี่ยแบบไม่ถ่วงน้ำหนักลดทอนงานสามมิติ $(p_i, q_i, C_i)$ ให้เหลือ +สัญญาณหนึ่งมิติ ($C_i$) แล้วหาค่าเฉลี่ยอย่างสม่ำเสมอ สิ่งนี้ทิ้งลำดับ +ความสำคัญทั้งหมดและกลับขนาดโดยปริยาย + +**ทฤษฎีบท 9 (การทำลายข้อมูล)** ให้ $I(\sigma)$ เป็นข้อมูลร่วม +(mutual information) ระหว่างการจัดอันดับลำดับความสำคัญโดยปริยายของ +ตารางงาน (ตำแหน่ง) กับการกำหนดลำดับความสำคัญจริง $q_i$ สำหรับ SPT: + +$$I(\sigma_{\text{SPT}}) = 0 \quad \text{when } p_i \perp q_i$$ + +**การพิสูจน์** SPT กำหนดตำแหน่งตาม $p_i$ เพียงอย่างเดียว เมื่อ $p_i$ และ +$q_i$ เป็นอิสระต่อกัน การรู้ตำแหน่งของงานในตารางงาน SPT ไม่ให้ข้อมูล +ใดๆ เกี่ยวกับลำดับความสำคัญของงานนั้น $\blacksquare$ + +**ผลสืบเนื่อง 9.1** ทีมที่เพิ่มประสิทธิภาพค่าเฉลี่ยเวลาดำเนินการแบบไม่ถ่วง +น้ำหนักกำลังดำเนินการระบบจัดลำดับที่ไม่มีข้อมูลใดๆ เกี่ยวกับการจำแนก +ลำดับความสำคัญของตัวเอง ฟิลด์ลำดับความสำคัญในระบบจัดการตั๋วของพวกเขา +เป็นเพียงเครื่องประดับเมื่อพิจารณาในแง่ของลำดับการดำเนินการ + +นี่เป็นตัวอย่างของสิ่งที่ Austin [18] เรียกว่าปัญหาพื้นฐานของการวัดผลที่ไม่ +สมบูรณ์: เมื่อระบบการวัดจับเพียงส่วนย่อยของมิติที่เกี่ยวข้อง การเพิ่ม +ประสิทธิภาพการวัดจะลดทอนมิติที่ไม่ได้วัดอย่างเป็นระบบ + +### 5.4 ต้นทุนความล่าช้าแบบถ่วงน้ำหนักตามลำดับความสำคัญ + +กำหนด**ต้นทุนความล่าช้าแบบถ่วงน้ำหนักตามลำดับความสำคัญ**ของตาราง +งาน: + +$$D(\sigma) = \sum_{i=1}^{n} w(q_i) \cdot C_i$$ + +**ทฤษฎีบท 10 (SPT และต้นทุนความล่าช้าแบบถ่วงน้ำหนักตามลำดับ +ความสำคัญ)** ตารางงานที่เหมาะสมที่สุดสำหรับการลด $D(\sigma)$ ให้ +น้อยที่สุดคือ WSJF (Weighted Shortest Job First หรือ งานสั้นที่มีน้ำหนักมาก +ก่อน): เรียงลำดับตาม $w(q_i)/p_i$ จากมากไปน้อย [1, 5] การเรียงลำดับของ +SPT ตาม $1/p_i$ จากมากไปน้อย ไม่สนใจลำดับความสำคัญเลย และให้ค่า +$D$ สูงกว่าทางเลือกที่คำนึงถึงลำดับความสำคัญ เมื่อลำดับความสำคัญ +สัมพันธ์กับขนาดงาน + +**การพิสูจน์** โดยอาร์กิวเมนต์การแลกเปลี่ยน การสลับงานที่อยู่ติดกัน $i, j$ +เปลี่ยน $D$ โดย: + +$$\Delta D = w(q_j) \cdot p_i - w(q_i) \cdot p_j$$ + +การสลับปรับปรุง $D$ เมื่อ $w(q_j)/p_j > w(q_i)/p_i$ แต่ $j$ ถูกจัดหลัง $i$ +ดังนั้นลำดับที่เหมาะสมที่สุดคือ $w(q_i)/p_i$ จากมากไปน้อย ซึ่งก็คือกฎ +WSJF นั่นเอง SPT สอดคล้องกับ WSJF เมื่อ $w(q_i) = \text{const}$ +(งานทุกงานมีลำดับความสำคัญเท่ากัน) เท่านั้น + +**ตัวอย่าง** งานวิกฤต ($w = 8$, $p = 3$) และงานต่ำ ($w = 1$, $p = 2$): + +- SPT (งานต่ำก่อน): $D = 1 \cdot 2 + 8 \cdot 5 = 42$ +- WSJF (งานวิกฤตก่อน): $D = 8 \cdot 3 + 1 \cdot 5 = 29$ + +SPT ก่อให้เกิดต้นทุนความล่าช้าแบบถ่วงน้ำหนักตามลำดับความสำคัญมากกว่า +45% ในทางปฏิบัติ งานวิกฤตมักมีขนาดใหญ่กว่า (การล่มของระบบ เหตุการณ์ +ด้านความปลอดภัย) ทำให้ความแตกต่างนี้เป็นไปอย่างเป็นระบบ $\blacksquare$ + +--- + +## 6. แนวทางแก้ไขที่เสนอ + +### 6.1 มาตรวัดแบบถ่วงน้ำหนักตามลำดับความสำคัญ + +แทนที่ค่าเฉลี่ยเวลาดำเนินการแบบไม่ถ่วงน้ำหนักด้วย**คะแนนเวลาดำเนินการ +แบบถ่วงน้ำหนักตามลำดับความสำคัญ (PWCS -- Priority-Weighted +Completion Score)**: + +$$\text{PWCS}(\sigma) = \frac{\sum_{i=1}^{n} w(q_i) \cdot \frac{C_i}{p_i}}{\sum_{i=1}^{n} w(q_i)}$$ + +นี่คือค่าเฉลี่ยอัตราส่วนความช้าแบบถ่วงน้ำหนักตามลำดับความสำคัญ วัดว่า +แต่ละงานต้องรอนานเท่าใดเมื่อเทียบกับขนาดของงาน ถ่วงน้ำหนักตามความ +สำคัญของงานนั้น ค่าต่ำกว่าดีกว่า + +**คุณสมบัติ:** + +1. **คำนึงถึงลำดับความสำคัญ** ความล่าช้าของงานวิกฤตมีต้นทุนสูงกว่างาน + ระดับต่ำ 8 เท่า +2. **ยุติธรรมต่อขนาด** ใช้อัตราส่วนความช้า $C_i / p_i$ ดังนั้นงานขนาดใหญ่ + จะไม่ถูกลงโทษเพียงเพราะมีขนาดใหญ่ +3. **ไม่สามารถถูกบิดเบือนด้วย SPT** การเรียงลำดับตามเวลาประมวลผลไม่ + ปรับปรุงคะแนนอย่างเป็นระบบ +4. **ลดรูปเป็นค่าเฉลี่ยไม่ถ่วงน้ำหนักเมื่องานสม่ำเสมอ** เป็นการวางนัยทั่วไป + อย่างเข้มงวด + +### 6.2 นโยบายที่เหมาะสมที่สุด: WSJF + +**ทฤษฎีบท 11** ตารางงานที่ทำให้เวลาดำเนินการแบบถ่วงน้ำหนักตามลำดับ +ความสำคัญ $\text{PWCT}(\sigma) = \sum w(q_i) \cdot C_i / \sum w(q_i)$ มีค่า +น้อยที่สุด จะประมวลผลงานในลำดับ $w(q_i)/p_i$ จากมากไปน้อย ซึ่งก็คือ +กฎ **Weighted Shortest Job First (WSJF)** [1, 5] + +**การพิสูจน์** โดยอาร์กิวเมนต์การแลกเปลี่ยน (เช่นเดียวกับทฤษฎีบท 10) +การสลับงานที่อยู่ติดกัน $i, j$ ปรับปรุง PWCT เมื่อ $w(q_j)/p_j > w(q_i)/p_i$ +แต่ $j$ ถูกจัดหลัง $i$ ดังนั้นลำดับที่เหมาะสมที่สุดจึงเป็น $w(q_i)/p_i$ +จากมากไปน้อย $\blacksquare$ + +ภายในระดับลำดับความสำคัญเดียวกัน สิ่งนี้ลดรูปเป็น SPT (งานสั้นก่อน) +ข้ามระดับ งานวิกฤต 4 ชั่วโมง ($w/p = 2.0$) ชนะงานระดับต่ำ 1 ชั่วโมง +($w/p = 1.0$) + +**ข้อควรระวังในทางปฏิบัติ** WSJF บริสุทธิ์สามารถวางงานเล็กระดับต่ำ +ไว้ก่อนงานใหญ่ระดับวิกฤต (งานระดับต่ำ 15 นาทีมี $w/p = 1/0.25 = 4.0$ +ชนะงานวิกฤต 6 ชั่วโมงที่ $w/p = 8/6 = 1.33$) ในทางปฏิบัติ สิ่งนี้ถูก +บรรเทาโดยการบังคับ**การเรียงลำดับตามระดับลำดับความสำคัญอย่างเข้มงวด** +และใช้ WSJF เฉพาะ*ภายใน*แต่ละระดับเท่านั้น + +### 6.3 ตัวอย่างประยุกต์: โต๊ะบริการไอที + +พิจารณาทีมไอทีที่มีคิวตั๋วต่อไปนี้: + +| ตั๋ว | ลำดับความสำคัญ | ประเภท | ชั่วโมงโดยประมาณ | +|--------|----------|------|-----------| +| T1 | P1 (วิกฤต) | เซิร์ฟเวอร์อีเมลล่ม | 6 | +| T2 | P2 (สูง) | VPN ขัดข้องสำหรับทีมระยะไกล | 4 | +| T3 | P3 (ปานกลาง) | ตั้งค่าแล็ปท็อปพนักงานใหม่ | 2 | +| T4 | P4 (ต่ำ) | อัปเดตนโยบายภาพพื้นหลังเดสก์ท็อป | 0.5 | +| T5 | P3 (ปานกลาง) | ติดตั้งใบอนุญาตซอฟต์แวร์ | 1 | +| T6 | P1 (วิกฤต) | การสำรองข้อมูลฐานข้อมูลล้มเหลว | 3 | +| T7 | P2 (สูง) | เครื่องพิมพ์ทั้งกลุ่มออฟไลน์ | 2 | +| T8 | P4 (ต่ำ) | จัดเก็บโฟลเดอร์ไดรฟ์ร่วมเก่า | 0.25 | + +**ลำดับ SPT** (เพิ่มประสิทธิภาพค่าเฉลี่ยแบบไม่ถ่วงน้ำหนัก): T8, T4, T5, T3, T7, T6, T2, T1 + +| ลำดับ | ตั๋ว | ลำดับความสำคัญ | ชั่วโมง | เวลาดำเนินการ | อัตราส่วนความช้า | +|-----|--------|----------|-------|------------|----------| +| 1 | T8 (จัดเก็บโฟลเดอร์) | P4 ต่ำ | 0.25 | 0.25 | 1.0 | +| 2 | T4 (ภาพพื้นหลัง) | P4 ต่ำ | 0.5 | 0.75 | 1.5 | +| 3 | T5 (ซอฟต์แวร์) | P3 ปานกลาง | 1 | 1.75 | 1.75 | +| 4 | T3 (แล็ปท็อป) | P3 ปานกลาง | 2 | 3.75 | 1.875 | +| 5 | T7 (เครื่องพิมพ์) | P2 สูง | 2 | 5.75 | 2.875 | +| 6 | T6 (สำรองข้อมูล) | P1 วิกฤต | 3 | 8.75 | 2.917 | +| 7 | T2 (VPN) | P2 สูง | 4 | 12.75 | 3.188 | +| 8 | T1 (อีเมล) | P1 วิกฤต | 6 | 18.75 | 3.125 | + +**WSJF เชิงปฏิบัติ** (ลำดับความสำคัญก่อน, SPT ภายในระดับ): + +| ลำดับ | ตั๋ว | ลำดับความสำคัญ | ชั่วโมง | เวลาดำเนินการ | +|-----|--------|----------|-------|------------| +| 1 | T6 (สำรองข้อมูล) | P1 วิกฤต | 3 | 3 | +| 2 | T1 (อีเมล) | P1 วิกฤต | 6 | 9 | +| 3 | T7 (เครื่องพิมพ์) | P2 สูง | 2 | 11 | +| 4 | T2 (VPN) | P2 สูง | 4 | 15 | +| 5 | T5 (ซอฟต์แวร์) | P3 ปานกลาง | 1 | 16 | +| 6 | T3 (แล็ปท็อป) | P3 ปานกลาง | 2 | 18 | +| 7 | T8 (จัดเก็บ) | P4 ต่ำ | 0.25 | 18.25 | +| 8 | T4 (ภาพพื้นหลัง) | P4 ต่ำ | 0.5 | 18.75 | + +**การเปรียบเทียบ:** + +| มาตรวัด | SPT | WSJF เชิงปฏิบัติ | ผู้ชนะ | +|--------|-----|----------------|--------| +| ค่าเฉลี่ยเวลาดำเนินการไม่ถ่วงน้ำหนัก | **6.56 ชม.** | 13.63 ชม. | SPT | +| เวลาเฉลี่ยในการแก้ไข P1 | 13.75 ชม. | **6 ชม.** | WSJF | +| เวลาเฉลี่ยในการแก้ไข P2 | 9.25 ชม. | **13 ชม.** | SPT | +| เวลาในการแก้ไขเซิร์ฟเวอร์อีเมล | 18.75 ชม. | **9 ชม.** | WSJF | +| เวลาในการแก้ไขการสำรองข้อมูล | 8.75 ชม. | **3 ชม.** | WSJF | +| เวลาในการอัปเดตภาพพื้นหลัง | **0.75 ชม.** | 18.75 ชม. | SPT | + +เวลาดำเนินการรวมแบบถ่วงน้ำหนักตามลำดับความสำคัญใกล้เคียงกัน +(PWCT: 10.2 เทียบกับ 10.17) เพราะการรวมซ่อนความเสียหายเชิงการกระจาย +ความแตกต่างที่แท้จริงอยู่ในรายละเอียด**แยกตามระดับลำดับความสำคัญ**: +เซิร์ฟเวอร์อีเมลล่มเป็นเวลา 18.75 ชั่วโมงภายใต้ SPT เทียบกับ 9 ชั่วโมง +ภายใต้ WSJF การสำรองข้อมูลฐานข้อมูลล้มเหลวเป็นเวลา 8.75 ชั่วโมง +เทียบกับ 3 ชั่วโมง + +มาตรวัดแบบไม่ถ่วงน้ำหนักรายงานอย่างมั่นใจว่า SPT มี**ประสิทธิภาพมากกว่า +สองเท่า** (6.56 เทียบกับ 13.63) โดยให้รางวัลแก่ทีมที่อัปเดตภาพพื้นหลัง +เดสก์ท็อปในขณะที่เซิร์ฟเวอร์อีเมลกำลังลุกไหม้ + +### 6.4 ชุดมาตรวัดที่แนะนำ + +แม้แต่มาตรวัดรวมที่ถ่วงน้ำหนักตามลำดับความสำคัญก็อาจไม่สามารถแยกแยะ +ตารางงานที่ดีจากที่ไม่ดีได้ เพราะการรวมซ่อนความเสียหายเชิงการกระจาย +มาตรวัดเดียวไม่เพียงพอ ระบบการวัดที่สมบูรณ์ควรติดตาม: + +| มาตรวัด | สิ่งที่วัด | สูตร | +|--------|-----------------|---------| +| **เวลาดำเนินการเฉลี่ยแยกตามระดับลำดับความสำคัญ** | การตอบสนองแยกตามระดับ | $\bar{C}$ กรองตาม $q$ | +| **เวลาเฉลี่ยในการแก้ไข P1** | การตอบสนองต่อเหตุการณ์วิกฤต | $\bar{C}$ สำหรับ $q = 1$ | +| **ปริมาณงาน** | กำลังการทำงานจริง | ชั่วโมงงานที่เสร็จสิ้น / เวลาปฏิทิน | +| **การละเมิดเวลาสะสม** | การป้องกันการอดอาหาร | งานที่เกิน SLA แยกตามลำดับความสำคัญ | +| **เวลาดำเนินการสูงสุด (P1/P2)** | การตอบสนองกรณีเลวร้ายที่สุด | $\max(C_i)$ สำหรับ $q \le 2$ | + +ข้อมูลเชิงลึกสำคัญ: **มาตรวัดแยกตามระดับลำดับความสำคัญ**เปิดเผยความ +ล้มเหลวในการจัดลำดับที่มาตรวัดรวมซ่อนไว้ + +--- + +# ส่วนที่ III: พลวัตขององค์กร + +## 7. เมื่อมาตรวัดเป็นตัวผลิตภัณฑ์ + +บทที่ 2–6 สมมติว่าความพึงพอใจของลูกค้าเป็นฟังก์ชันของ*คุณภาพ +การบริการที่ได้รับ* แต่มีสถานการณ์หนึ่งที่สมมติฐานนี้ล้มเหลวและทำให้ +ข้อโต้แย้งทั้งหมดพังทลาย + +### 7.1 มาตรวัดที่อ้างอิงตนเอง + +สมมติว่าผู้ให้บริการรายงานค่าเฉลี่ยแบบไม่ถ่วงน้ำหนักโดยตรงต่อลูกค้า +บนแดชบอร์ด ในรายงาน SLA หรือบนหน้าการตลาด และความพึงพอใจของ +ลูกค้าได้มาจาก*ตัวเลขนั้น*เป็นหลัก: + +$$U_{\text{client}} = f\!\left(\bar{C}(\sigma)\right), \quad f' < 0$$ + +ภายใต้แบบจำลองนี้ SPT ทำให้ความพึงพอใจของลูกค้าสูงสุดอย่างแท้จริง +(ทฤษฎีบท 1) ปริมาณงานไม่เปลี่ยนแปลง (ทฤษฎีบท 6) ผลลัพธ์ทาง +ธุรกิจดีขึ้น: งานเท่าเดิม ลูกค้าพอใจมากขึ้น + +**ทุกทฤษฎีบทในบทความนี้ยังคงถูกต้องทางคณิตศาสตร์ แต่ข้อสรุปกลับ +ด้าน** มาตรวัดไม่ใช่ตัวแทนที่สามารถถูกบิดเบือนอีกต่อไป มัน*คือ*คุณภาพ +การบริการ เพราะลูกค้าตกลงที่จะประเมินคุณภาพด้วยตัวเลขรวม + +### 7.2 เศรษฐศาสตร์ + +สิ่งนี้สร้างดุลยภาพที่สอดคล้องและเสถียร: + +| ผู้กระทำ | พฤติกรรม | ผลลัพธ์ | +|-------|----------|---------| +| ผู้ให้บริการ | เพิ่มประสิทธิภาพค่าเฉลี่ยไม่ถ่วงน้ำหนัก (SPT) | มาตรวัดดีขึ้น ไม่มีงานเพิ่ม | +| ลูกค้า | อ่านแดชบอร์ด เห็นค่าเฉลี่ยต่ำ | รายงานความพึงพอใจ | +| ผู้บริหาร | เห็นลูกค้าพอใจ + มาตรวัดดี | ให้รางวัลทีม | + +ผู้ให้บริการดึงความพึงพอใจโดยไม่มีต้นทุนส่วนเพิ่ม โดยเพิ่มประสิทธิภาพ +ตัวเลขที่ลูกค้ายอมรับเป็นตัวแทนของคุณภาพ + +### 7.3 ความเปราะบาง + +ดุลยภาพนี้เสถียรเฉพาะตราบเท่าที่ลูกค้าไม่เคยตรวจสอบประสบการณ์ของ +ตนเอง มันพังเมื่อ: + +1. **ลูกค้าตรวจสอบตั๋วของตนเอง** CTO ที่เซิร์ฟเวอร์อีเมลล่มเป็นเวลา + 18.75 ชั่วโมงจะไม่คลายใจเมื่อได้ยินว่า "การแก้ไขเฉลี่ย: 6.56 ชั่วโมง" + ลูกค้าที่มีแนวโน้มจะตรวจสอบมากที่สุดคือลูกค้าที่ได้รับบริการแย่ที่สุด + พอดี (ทฤษฎีบท 4) + +2. **คู่แข่งเสนอ SLA ต่อตั๋ว** "P1 แก้ไขภายใน 4 ชั่วโมง" ดีกว่า + "การแก้ไขเฉลี่ยต่ำกว่า 7 ชั่วโมง" สำหรับลูกค้าที่มีความต้องการวิกฤต + +3. **ทีมยึดถือมาตรวัด** หากทีมเชื่อว่ามาตรวัดสะท้อนผลการปฏิบัติงานจริง + พวกเขาสูญเสียความสามารถในการรับรู้เมื่องานวิกฤตถูกละเลย มาตรวัด + กลายเป็นอันตรายทางญาณวิทยา + +### 7.4 รูปแบบทั่วไป + +รูปแบบนี้ ที่ตัวแทนเข้ามาแทนที่คุณภาพ ตัวแทนถูกเพิ่มประสิทธิภาพ คุณภาพ +แยกออกจากกัน ระบบเสถียรจนกว่าจะถูกทดสอบโดยความเป็นจริง ปรากฏ +ซ้ำๆ ในหลายสาขา Muller [19] บันทึกไว้อย่างละเอียดในชื่อ "metric fixation" +(การยึดติดกับมาตรวัด) Campbell [24] ทำให้ผลกระทบการบิดเบือนจากการใช้ +ตัวชี้วัดเป็นเป้าหมายเป็นรูปแบบอย่างเป็นทางการ + +| สาขา | มาตรวัดตัวแทน | คุณภาพที่แท้จริง | ความแตกต่าง | +|--------|-------------|-------------------|------------| +| ฝ่ายสนับสนุนไอที | เวลาแก้ไขเฉลี่ย | เวลาทำงานของระบบวิกฤต | เซิร์ฟเวอร์ล่ม 19 ชม. ค่าเฉลี่ยบอก 6.5 | +| การศึกษา | คะแนนสอบ | การเรียนรู้จริง | สอนเพื่อสอบ | +| การแพทย์ | ปริมาณผู้ป่วย | ผลลัพธ์ผู้ป่วย | จำหน่ายเร็วขึ้น อัตรากลับมารักษาสูงขึ้น | +| การเงิน | กำไรรายไตรมาส | มูลค่าระยะยาว | ลดต้นทุนเพิ่ม EPS กัดกร่อนความสามารถ | +| ซอฟต์แวร์ | Velocity (story points) | คุณภาพผลิตภัณฑ์ | เงินเฟ้อคะแนน ฟีเจอร์ทำเสร็จครึ่งๆ กลางๆ | + +### 7.5 ความไม่สมมาตรของข้อมูล + +จำลองระบบเป็นเกมระหว่างผู้ให้บริการ (P) และลูกค้า (C) โดย P สังเกต +$\{C_i\}$ แต่ละรายการและเลือก $\sigma$ ในขณะที่ C สังเกตเพียง +$\bar{C}(\sigma)$ นี่คือปัญหา**ภัยทางศีลธรรม** (moral hazard) [10]: +กลยุทธ์ที่เหมาะสมที่สุดของ P คือการทำให้สัญญาณที่สังเกตได้มีค่าน้อยที่สุด +ไม่ว่าการกระจายที่สังเกตไม่ได้จะเป็นอย่างไร + +ดุลยภาพนี้เป็น**ดุลยภาพแบบรวมกลุ่ม** (pooling equilibrium) [9]: มาตรวัด +ที่ P รายงานดูเหมือนกันไม่ว่าผลการปฏิบัติงานแบบถ่วงน้ำหนักตามลำดับ +ความสำคัญจะเป็นอย่างไร ดุลยภาพจะเสถียรจนกว่า C จะเข้าถึงค่า $C_i$ +แต่ละรายการได้ ผ่านพอร์ทัลลูกค้า ความโปร่งใสของคู่แข่ง หรือเหตุการณ์ +ที่เจ็บปวดเพียงพอ + +### 7.6 บทสรุปที่ไม่สบายใจ + +คำตอบที่ซื่อสัตย์ต่อคำถาม "การเพิ่มประสิทธิภาพค่าเฉลี่ยไม่ถ่วงน้ำหนัก +ทำร้ายธุรกิจหรือไม่?" คือ: **ไม่จำเป็น ตราบเท่าที่ลูกค้าไม่เคยมองเบื้องหลัง +ตัวเลข** คำตอบที่ซื่อสัตย์ต่อคำถาม "นี่ยั่งยืนหรือไม่?" คือ: มันยั่งยืน +เท่ากับระบบใดๆ ที่ผู้ขายรู้มากกว่าผู้ซื้อ เสถียรเป็นระยะเวลานาน จากนั้น +พังทลายอย่างรวดเร็วเมื่อความไม่สมมาตรถูกเจาะ + +--- + +## 8. ต้นทุนทางจิตใจของการรู้ + +บทที่ 7 จำลองผู้ให้บริการเป็นผู้กระทำเดี่ยว แต่ทีมประกอบด้วยบุคคล เมื่อ +สมาชิกทีมเข้าใจการพิสูจน์ เมื่อพวกเขา*รู้*ว่ามาตรวัดเป็นสิ่งสังเคราะห์ ว่า +แดชบอร์ดเป็นการแสดง ว่าเซิร์ฟเวอร์อีเมลยังล่มอยู่ขณะที่พวกเขาปิดตั๋ว +ภาพพื้นหลัง ต้นทุนใหม่ปรากฏขึ้นที่แบบจำลองดุลยภาพไม่ได้รวมไว้ + +### 8.1 ตัวแปรซ่อน: ความตระหนักของทีม + +| ผู้กระทำ | สังเกต $C_i$ แต่ละรายการ | สังเกต $\bar{C}$ | เข้าใจการพิสูจน์ | +|-------|--------------------------|--------------------|-----------------------| +| ผู้บริหาร | อาจจะ | ใช่ | แตกต่างกันไป | +| สมาชิกทีม | **ใช่** | ใช่ | **ใช่** (ในสถานการณ์นี้) | +| ลูกค้า | ไม่ | ใช่ | ไม่ | + +สมาชิกทีมมีข้อมูลครบถ้วน พวกเขาเห็นคิวตั๋ว พวกเขารู้ว่าเซิร์ฟเวอร์อีเมล +ล่มตั้งแต่ 7 โมงเช้า พวกเขารู้ว่ากำลังปิดตั๋วภาพพื้นหลังเพราะมันปรับปรุง +ตัวเลข และพวกเขารู้*เหตุผล* + +### 8.2 ความขัดแย้งทางปัญญาภายใต้ข้อมูลครบถ้วน + +ความขัดแย้งทางปัญญา (cognitive dissonance) [11] เกิดขึ้นเมื่อบุคคลถือ +ความคิดที่ขัดแย้งกัน หากไม่เข้าใจ*เหตุผล* ความขัดแย้งสามารถถูกให้เหตุผล +ได้: "ผู้บริหารรู้ดีกว่า" การเข้าใจการพิสูจน์ทำลายความคลุมเครือ สมาชิก +ทีมตอนนี้ถือ: + +- **ความคิด A:** "ฉันเป็นมืออาชีพที่มีความสามารถ งานของฉันคือแก้ปัญหา + ที่สำคัญ" +- **ความคิด B:** "ฉันกำลังปิดตั๋วภาพพื้นหลังในขณะที่เซิร์ฟเวอร์อีเมลล่ม + เพราะมาตรวัดมีอคติทางคณิตศาสตร์ (ทฤษฎีบท 1) การเรียงลำดับใหม่ + ให้ปริมาณงานเป็นศูนย์ (ทฤษฎีบท 6) และผู้ได้รับประโยชน์เพียงรายเดียว + คือแดชบอร์ด (บทที่ 7) ฉันพิสูจน์สิ่งนี้ได้" + +ความขัดแย้งนี้ตอนนี้เป็น*โครงสร้างรับน้ำหนัก* ทางออกที่มี ได้แก่ ละทิ้ง +อัตลักษณ์วิชาชีพ ปฏิเสธการพิสูจน์ สนับสนุนการเปลี่ยนแปลง หรือลาออก +แต่ละทางเลือกมีต้นทุนที่ไม่เคยมีก่อนหน้านี้ + +### 8.3 ทฤษฎีการกำหนดตนเอง: สามความต้องการที่ถูกละเมิด + +ทฤษฎีการกำหนดตนเอง (Self-Determination Theory) ของ Deci และ Ryan +[12, 13] ระบุความต้องการสามประการที่ทำนายแรงจูงใจภายใน: + +**ความเป็นอิสระ** มาตรวัดจำกัดทางเลือกในลักษณะที่สมาชิกทีมรู้ว่าไม่ +เหมาะสมทางคณิตศาสตร์ ผู้ปฏิบัติงานที่เข้าใจว่ากระบวนการนั้นไม่มี +ประสิทธิผลอย่างพิสูจน์ได้ ไม่สามารถรู้สึกเป็นอิสระในการทำตามได้ + +**ความสามารถ** มาตรวัดให้รางวัลประสิทธิผล*ที่ปรากฏ* ($\bar{C}$ ต่ำ) +ในขณะที่ไม่แปรผันต่อประสิทธิผล*จริง* (ทฤษฎีบท 6) ความสามารถที่แท้จริง +การแก้ไขเซิร์ฟเวอร์อีเมลก่อน ถูก*ลงโทษ*โดยมาตรวัด + +**ความสัมพันธ์** สมาชิกทีมรู้ว่าเซิร์ฟเวอร์อีเมลของลูกค้าล่ม พวกเขา +สามารถช่วยได้ แต่กลับอัปเดตภาพพื้นหลัง ไม่ใช่เพราะมันช่วยใคร แต่เพราะ +มันช่วยตัวเลข การเชื่อมต่อระหว่างงานกับผลกระทบต่อมนุษย์ถูกตัดขาด +และสมาชิกทีมสามารถเห็นปลายที่ถูกตัดขาดทั้งสองข้าง + +### 8.4 บาดแผลทางศีลธรรม + +บาดแผลทางศีลธรรม (moral injury) [16, 17] คือความเสียหายที่คงอยู่อัน +เกิดจาก "การกระทำ ไม่สามารถป้องกัน เป็นพยาน หรือเรียนรู้เกี่ยวกับการ +กระทำที่ละเมิดความเชื่อทางศีลธรรมที่ฝังลึก" [17] ตั้งแต่นั้นมามีการขยาย +ไปสู่บริบททางธุรกิจ [25] ความแตกต่างสำคัญจากภาวะหมดไฟ: **ภาวะ +หมดไฟคือความเหนื่อยล้าจากการทำมากเกินไป บาดแผลทางศีลธรรมคือ +ความเสียหายจากการทำสิ่งที่ผิด** + +สมาชิกทีมที่รู้ว่าเซิร์ฟเวอร์อีเมลล่ม รู้ว่าควรแก้ไข ปิดตั๋วภาพพื้นหลังแทน +และทำเช่นนั้นเพราะมาตรวัดกำหนด กำลังประสบกับเงื่อนไขเชิงโครงสร้างของ +บาดแผลทางศีลธรรม + +### 8.5 ความสิ้นหวังที่เรียนรู้และความยอมจำนนต่อมาตรวัด + +ความสิ้นหวังที่เรียนรู้ (learned helplessness) ของ Seligman [14, 15] อธิบาย +ว่าการเผชิญกับผลลัพธ์เชิงลบที่ควบคุมไม่ได้นำไปสู่ความเฉื่อยอย่างไร ลำดับ: + +1. มาตรวัดมีข้อบกพร่อง (เข้าใจการพิสูจน์แล้ว) +2. สนับสนุนการเปลี่ยนแปลง +3. ถูกปฏิเสธ ("ตัวเลขดี อย่ากวนน้ำ") +4. ทำซ้ำด้วยความเชื่อมั่นที่ลดลง +5. สถานะสุดท้าย: "มาตรวัดมันก็เป็นอย่างนี้แหละ ฉันจะแค่ปิดตั๋วไป" + +นี่ไม่ใช่ความเกียจคร้าน มันเป็นการตอบสนองที่มีเหตุผลต่อระบบที่ลงโทษ +พฤติกรรมที่ถูกต้องและให้รางวัลพฤติกรรมที่ไม่ถูกต้อง เมื่อบุคคลไม่มีอำนาจ +ในการเปลี่ยนแปลงระบบ + +### 8.6 วงจรการคัดเลือกแบบปฏิปักษ์ + +เมื่อรวมดุลยภาพของบทที่ 7 กับพลวัตการลาออก: + +1. องค์กรใช้ค่าเฉลี่ยไม่ถ่วงน้ำหนัก มาตรวัดดูดี (SPT) +2. สมาชิกทีมที่ตระหนักรู้และมีความสามารถประสบต้นทุนทางจิตใจ (8.2–8.5) +3. สมาชิกเหล่านั้นลาออก ถูกแทนที่ด้วยสมาชิกที่ไม่เข้าใจข้อบกพร่องของ + มาตรวัดหรือไม่สนใจ +4. มาตรวัดยังคงดูดี ดูดีเสมอภายใต้ SPT ไม่ว่าทีมจะมีความสามารถ + เท่าใด (ผลสืบเนื่อง 6.1) +5. คุณภาพการบริการจริงเสื่อมลง แต่มาตรวัดไม่สามารถตรวจจับสิ่งนี้ได้ + (ผลสืบเนื่อง 9.1) +6. กลับไปขั้นตอนที่ 1 + +มาตรวัดคัดเลือก*ต่อ*คนที่จะปรับปรุงระบบ และ*สำหรับ*คนที่จะไม่ท้าทาย +มัน ระบบเสถียรที่ระดับความสามารถที่ต่ำลง ซึ่งมองไม่เห็นจากเครื่องมือ +วัดผลของตัวเอง + +### 8.7 แบบจำลองต้นทุนที่สมบูรณ์ + +| บทที่ 7 (มองเห็น) | บทที่ 8 (ซ่อน) | +|---------------------|---------------------| +| ลูกค้าพอใจ (ตัวเลขดี) | ทีมไม่พอใจ (ความเป็นจริงไม่ดี) | +| ปริมาณงานไม่เปลี่ยนแปลง | ความพยายามตามดุลพินิจถูกถอน | +| มาตรวัดดีขึ้น | สมาชิกที่มีความสามารถลาออก | +| เศรษฐกิจธุรกิจเสถียร | ความสามารถของสถาบันเสื่อมลง | + +สิ่งเหล่านี้ดำเนินการในมาตราเวลาที่แตกต่างกัน: ดุลยภาพมองเห็นได้ +รายไตรมาส การเสื่อมสลายของความสามารถมองเห็นได้ในหลายปี แบบจำลอง +ที่สมบูรณ์คือ: **มาตรวัดใช้งานได้ และมันทำลาย และการทำลายนั้นมอง +ไม่เห็นจากมาตรวัด** มาตรวัดเปรียบเสมือนสีทาใหม่บนเหล็กเสริมที่ผุกร่อน + +--- + +## 9. การซึมซับของผู้จัดการ: ทางออกที่ปฏิบัติได้ + +บทที่ 2–6 บอกให้ปฏิเสธมาตรวัด บทที่ 7 บอกว่ามาตรวัดใช้งานได้ +(สำหรับธุรกิจ) บทที่ 8 บอกว่ามันทำลายทีม ในทางปฏิบัติ ผู้จัดการส่วนใหญ่ +ไม่สามารถเปลี่ยนมาตรวัดได้ฝ่ายเดียว ทางออกที่ดีที่สุดคือการปฏิรูปมาตรวัด +ทั้งบริษัท ทางออกที่*ปฏิบัติได้*คือสิ่งที่ผู้จัดการคนเดียวที่มีความรู้สามารถทำ +ได้ตอนนี้ + +### 9.1 กลยุทธ์ + +ผู้จัดการที่เข้าใจการพิสูจน์สามารถ**ซึมซับข้อจำกัดของมาตรวัดโดยไม่ +เผยแพร่ต่อทีม**: + +1. **จัดลำดับตามความสำคัญเป็นหลัก** ทีมทำงานวิกฤตก่อน +2. **สอดแทรกงานเล็กอย่างมีชั้นเชิง** เมื่องานเล็กที่มีลำดับความสำคัญต่ำ + สามารถทำเสร็จได้โดยไม่ทำให้งานที่มีลำดับความสำคัญสูงล่าช้าอย่าง + มีนัยสำคัญ ให้ทำ ไม่ใช่เพราะมาตรวัดต้องการ แต่เพราะมันก็ต้องทำ + อยู่ดีและแทบไม่มีต้นทุน +3. **อย่าเปิดเผยมาตรวัดเป็นแรงจูงใจ** "ทำงานเล็กนี้ให้เสร็จระหว่างรอ + vendor โทรกลับเรื่อง P1" ไม่ใช่ "เราต้องลดค่าเฉลี่ยลง" แรงจูงใจ + ภายในของทีมยังคงสมบูรณ์ (บทที่ 8) ผู้จัดการรับภาระการบริหาร + มาตรวัด + +### 9.2 การทำให้เป็นรูปแบบ + +ปัญหาของผู้จัดการคือการเพิ่มประสิทธิภาพภายใต้ข้อจำกัด: + +$$\min_{\sigma} \sum_{i=1}^{n} w(q_i) \cdot C_i \quad \text{subject to} \quad \bar{C}(\sigma) \le \bar{C}_{\text{target}}$$ + +**ทฤษฎีบท 12 (ต้นทุนมาตรวัดที่จำกัดของการจัดลำดับตามความสำคัญ)** +ผู้จัดการที่ใช้ SPT *ภายใน*แต่ละระดับลำดับความสำคัญและเรียงลำดับตาม +ความสำคัญ*ระหว่าง*ระดับ จะให้มาตรวัดใกล้เคียงกับค่าที่เหมาะสมที่สุดของ +SPT ช่องว่างเกิดขึ้นจากการกลับหัวระหว่างระดับเท่านั้น + +**โครงร่างการพิสูจน์** ภายในแต่ละระดับลำดับความสำคัญ SPT ไม่มีต้นทุน +(งานทุกงานมีลำดับความสำคัญเท่ากัน) ความเบี่ยงเบนจาก SPT ทั่วไปมี +เพียงการเรียงลำดับระหว่างระดับ การกลับหัวข้ามระดับแต่ละครั้งมีต้นทุนไม่เกิน +$p_{\text{large}} - p_{\text{small}}$ ในผลรวมไม่ถ่วงน้ำหนัก และการกลับหัว +เหล่านี้ถูกจำกัดด้วยจำนวนระดับ ในทางปฏิบัติ ช่องว่างมักอยู่ภายใน 10–20% +ของค่าที่เหมาะสมที่สุดของ SPT $\blacksquare$ + +### 9.3 ผู้จัดการในฐานะกำแพงข้อมูล + +| ชั้น | เห็นมาตรวัด | เห็นลำดับความสำคัญ | เห็นการพิสูจน์ | +|-------|-----------|----------------|------------| +| องค์กร | ใช่ | ในนาม | ไม่ | +| ผู้จัดการ | ใช่ | ใช่ | **ใช่** | +| ทีม | ไม่ (ถูกปกป้อง) | ใช่ | ไม่เกี่ยว | +| ลูกค้า | ใช่ (แดชบอร์ด) | ผ่าน SLA | ไม่ | + +ผู้จัดการเป็นผู้กระทำเพียงคนเดียวที่ถือข้อมูลทั้งสามชิ้น นี่ไม่ใช่การ +บิดเบือน พวกเขากำลังทำงานที่ถูกต้องในลำดับที่ถูกต้อง และมาตรวัดก็บังเอิญ +ยอมรับได้เพราะ SPT ภายในระดับไม่มีต้นทุน + +### 9.4 การล่มสลายเชิงการแข่งขัน + +กลยุทธ์นี้ล้มเหลวเมื่อมาตรวัดกลายเป็น**การแข่งขันระหว่างทีม** + +**กรณีที่ 1: ร่วมมือ** ทีมถูกวัดเพื่อความเท่าเทียม ไม่ใช่การจัดอันดับ ผู้จัดการ +แต่ละคนใช้กลยุทธ์การซึมซับอย่างเป็นอิสระ มาตรวัดเป็นเครื่องประดับแต่ไม่ +เป็นอันตราย นี่คือ**เกมประสานงาน**ที่มีดุลยภาพร่วมมือที่เสถียร + +**กรณีที่ 2: แข่งขัน** ทีมถูกจัดอันดับตาม $\bar{C}$ นี่คือ**ทวิบถนักโทษ** +(prisoner's dilemma): + +| | ทีม B: ลำดับความสำคัญก่อน | ทีม B: SPT | +|---|---|---| +| **ทีม A: ลำดับความสำคัญก่อน** | (งานดี, งานดี) | (A ดูแย่, B ดูดี) | +| **ทีม A: SPT** | (A ดูดี, B ดูแย่) | (ทั้งคู่ดูดี, ทั้งคู่ทำงานผิด) | + +ดุลยภาพ Nash คือ (SPT, SPT) กลยุทธ์การซึมซับเป็นดุลยภาพร่วมมือที่ +**ไม่เสถียรภายใต้การแข่งขัน** + +### 9.5 ขอบเขต + +| เงื่อนไข | ความเป็นไปได้ | +|-----------|-----------| +| มาตรวัดใช้สำหรับตรวจสุขภาพ / ความเท่าเทียม | **เป็นไปได้** | +| มาตรวัดมองเห็นได้แต่ไม่ถูกจัดอันดับ | **เป็นไปได้** | +| มาตรวัดถูกจัดอันดับข้ามทีม | **เปราะบาง** ต้องการให้ผู้จัดการทุกคนร่วมมือ | +| มาตรวัดผูกกับค่าตอบแทน / ทรัพยากร | **ไม่เป็นไปได้** ทวิบถนักโทษครอบงำ | +| สามารถปฏิรูปมาตรวัดในระดับองค์กร | **ไม่จำเป็น** แก้ไขมาตรวัดแทน | + +**ทางออกที่ดีที่สุดคือระดับทั้งบริษัท ทางออกที่ปฏิบัติได้คือผู้จัดการที่เข้าใจ +การพิสูจน์นี้ ปกป้องทีมจากมาตรวัด จัดลำดับตามความสำคัญ และใช้ SPT +เฉพาะภายในระดับลำดับความสำคัญเพื่อให้ตัวเลขอยู่ในระดับที่ยอมรับได้** + +--- + +# ส่วนที่ IV: การประเมิน + +## 10. ทนายฝ่ายค้าน + +ความซื่อสัตย์ทางปัญญากำหนดให้ยอมรับว่าข้อโต้แย้งมีขีดจำกัดตรงไหน + +### 10.1 ความเรียบง่ายมีคุณค่าจริง + +**ข้อโต้แย้ง** ค่าเฉลี่ยไม่ถ่วงน้ำหนักไม่ต้องการน้ำหนักลำดับความสำคัญ +ไม่ต้องการการประมาณขนาดงาน ไม่ต้องการการปรับเทียบ + +**การประเมิน: จริง** แต่มาตรวัดไม่ถ่วงน้ำหนักไม่ได้หลีกเลี่ยงสมมติฐาน +มัน*ซ่อน*สมมติฐานโดยตั้งน้ำหนักทั้งหมดเป็น 1 และขนาดทั้งหมดเป็น 1 +โดยปริยาย การประมาณขนาดงานที่รู้ว่าไม่แม่นยำยังคงให้ข้อมูลมากกว่า +สมมติฐานโดยปริยายว่าขนาดทั้งหมดเท่ากัน + +### 10.2 การลดจำนวนคนที่รอ + +**ข้อโต้แย้ง** SPT ลดชั่วโมง-คนรวมที่ใช้ในการรอ หากแต่ละงานเป็นตัวแทน +ของลูกค้าหนึ่งคน สิ่งนี้เหมาะสมที่สุด + +**การประเมิน: ถูกต้องทางคณิตศาสตร์** หากคุณบริหารสำนักงานทะเบียน +และเวลาของทุกคนมีค่าเท่ากัน SPT เป็นนโยบายที่ถูกต้อง มันล้มเหลวเมื่อ +งานไม่ใช่ 1:1 กับลูกค้า ต้นทุนการรอไม่สม่ำเสมอ หรือมาตรวัดถูกใช้เพื่อ +ประเมินทีมแทนที่จะให้บริการคิวจริง + +### 10.3 SPT ในฐานะฮิวริสติกคัดกรอง + +**ข้อโต้แย้ง** เมื่อขนาดงานกระจุกตัวอยู่ใกล้กัน SPT ประมาณ FIFO +และค่าเฉลี่ยไม่ถ่วงน้ำหนักประมาณค่าเฉลี่ยถ่วงน้ำหนัก + +**การประเมิน: ถูกต้อง** สัมประสิทธิ์การแปรผัน $CV = \sigma_p / \bar{p}$ กำหนดความรุนแรงของการบิดเบือน: + +| $CV$ | การกระจายขนาดงาน | การบิดเบือน | +|------|----------------------|------------| +| < 0.3 | แคบ (ศูนย์บริการสาย) | ไม่มีนัยสำคัญ | +| 0.3 – 1.0 | ปานกลาง (ไอทีผสม) | ปานกลาง | +| > 1.0 | กว้าง (คิวไอทีทั่วไป) | รุนแรง | + +โต๊ะบริการไอทีทั่วไปครอบคลุมตั้งแต่ 15 นาทีถึง 40+ ชั่วโมง ($CV > 2$) +การบิดเบือนไม่ใช่กรณีขอบ มันเป็นค่าเริ่มต้น + +### 10.4 การบิดเบือนต้องมีเจตนาร้าย + +**ข้อโต้แย้ง** ทฤษฎีบทแสดงว่ามาตรวัด*สามารถ*ถูกบิดเบือน ไม่ใช่ว่ามัน +*จะ*ถูกบิดเบือน + +**การประเมิน: นี่คือข้อโต้แย้งที่แข็งแกร่งที่สุด** หากมาตรวัดเป็นเพียง +ข้อมูลและไม่เคยมีอิทธิพลต่อพฤติกรรม แรงจูงใจในการบิดเบือนก็ไม่มี +อย่างไรก็ตาม มาตรวัดใดๆ ที่ถูกรายงานต่อผู้บริหาร ผูกกับ OKR หรือถูก +อภิปรายในการทบทวน จะมีอิทธิพลต่อพฤติกรรม นี่คือกฎของ Goodhart [6, 7] +และมันใช้ได้กับทีมที่มีเจตนาดีอย่างน่าเชื่อถือเท่ากับทีมที่มีเจตนาร้าย การ +เบี่ยงเบนเกิดขึ้นตามธรรมชาติ: การปิดตั๋วง่ายสามใบ "รู้สึกมีประสิทธิผล" +ในขณะที่มาตรวัดยืนยันความรู้สึกนั้น + +### 10.5 เมื่อใดที่ค่าเฉลี่ยไม่ถ่วงน้ำหนักสมเหตุสมผล + +มาตรวัดนี้สมเหตุสมผล**เฉพาะเมื่อเงื่อนไขทั้งสี่ข้อเป็นจริง**: + +1. ขนาดงานสม่ำเสมอโดยประมาณ ($CV < 0.3$) +2. ไม่มีการแยกลำดับความสำคัญ (งานทุกงานสำคัญเท่ากัน) +3. แต่ละงานเป็นตัวแทนของลูกค้าหนึ่งคนพอดี +4. มาตรวัดไม่ถูกใช้ในการประเมิน ให้รางวัล หรือกำหนดพฤติกรรม + +เงื่อนไขเหล่านี้แทบไม่เคยเป็นจริงในระบบที่มาตรวัดนี้ถูกใช้บ่อยที่สุด + +--- + +## 11. งานวิจัยที่เกี่ยวข้อง + +บทความนี้อยู่ที่จุดตัดของวรรณกรรมหลายสาขาที่ไม่เคยถูกเชื่อมโยงกัน +มาก่อน + +### 11.1 ทฤษฎีการจัดลำดับงานและความยุติธรรม + +Smith [1] สร้างผลลัพธ์ความเหมาะสมที่สุดของ SPT และกฎ WSJF ในปี 1956 +Conway, Maxwell, และ Miller [2] ให้การอธิบายแบบตำราเรียนที่ครอบคลุม +ความยุติธรรมของนโยบายการจัดลำดับตามขนาดได้รับการถกเถียงในการจัด +ลำดับระบบคอมพิวเตอร์: Bansal และ Harchol-Balter [22] ตรวจสอบความไม่ +ยุติธรรมของ SRPT; Wierman และ Harchol-Balter [23] ทำให้การจำแนกความ +ยุติธรรมเทียบกับ Processor-Sharing เป็นรูปแบบอย่างเป็นทางการ; Angel, +Bampis, และ Pascual [21] วัดคุณภาพตารางงาน SPT เทียบกับเกณฑ์ความ +เหมาะสมที่สุดเชิงยุติธรรม + +งานวิจัยก่อนหน้านี้วิเคราะห์ความยุติธรรมในการจัดลำดับ CPU และเซิร์ฟเวอร์ +บทความปัจจุบันใช้ผลลัพธ์ทางคณิตศาสตร์เดียวกันกับ*การจัดการงานองค์กร* +ซึ่ง "ตัวจัดลำดับ" คือทีมมนุษย์ "งาน" คือคำขอของลูกค้าที่มีลำดับความสำคัญ +ตามผลกระทบทางธุรกิจ และ "ฟังก์ชันวัตถุประสงค์" คือมาตรวัดการบริหาร +กลไกเหมือนกัน ผลกระทบแตกต่างกันเพราะการจัดลำดับงานองค์กรมีระบบ +ลำดับความสำคัญ ความสัมพันธ์กับลูกค้า และต้นทุนทางจิตใจที่การจัดลำดับ +CPU ไม่มี + +### 11.2 ความผิดปกติของการวัดผล + +Austin [18] พิสูจน์ว่าการวัดผลที่ไม่สมบูรณ์ การวัดเพียงส่วนย่อยของมิติที่ +เกี่ยวข้อง สร้างแรงจูงใจให้เพิ่มประสิทธิภาพมิติที่ถูกวัดโดยเสียสละมิติที่ไม่ +ได้วัด และว่าผลกระทบนี้ไม่เพียงแค่เป็นไปได้แต่*หลีกเลี่ยงไม่ได้*เมื่อ +การวัดผูกกับรางวัล กรอบความไม่สมมาตรของข้อมูลของเขามีความคล้ายกัน +อย่างใกล้ชิดกับบทที่ 7 บทความปัจจุบันให้กลไกทางคณิตศาสตร์เฉพาะ +(ทฤษฎีบท 1–2) สำหรับกรณีการจัดลำดับงาน และขยายข้อโต้แย้งผ่าน +จิตวิทยา (บทที่ 8) เพื่อติดตามห่วงโซ่ความเสียหายขององค์กรอย่างสมบูรณ์ + +Muller [19] บันทึก "metric fixation" (การยึดติดกับมาตรวัด) ในการศึกษา +การแพทย์ ตำรวจ และการเงิน โดยให้หลักฐานเชิงประจักษ์อย่างกว้างขวาง +สำหรับรูปแบบที่ตั้งทฤษฎีไว้ในบทที่ 7.4 Campbell [24] ทำให้ผลกระทบ +การบิดเบือนจากการใช้ตัวชี้วัดเป็นเป้าหมายเป็นรูปแบบอย่างเป็นทางการ +เสริมการสังเกตดั้งเดิมของ Goodhart [6] และการวางนัยทั่วไปของ +Strathern [7] + +Bevan และ Hood [26] บันทึกพฤติกรรมการบิดเบือนในระบบสาธารณสุข +ของอังกฤษเชิงประจักษ์ รวมถึงรูปแบบ "ถึงเป้าหมายแต่พลาดประเด็น" +ที่อธิบายในบทที่ 5.2 ของเราอย่างตรงเผง + +### 11.3 ต้นทุนทางจิตใจของความผิดปกติของมาตรวัด + +การประยุกต์ใช้บาดแผลทางศีลธรรม (Shay [16], Litz et al. [17]) กับ +บริบททางธุรกิจมีแบบอย่างล่าสุด: การศึกษาใน *Journal of Business Ethics* +ปี 2024 [25] ขยายแนวคิดนี้ไปยังสถานที่ทำงานแสวงหากำไรอย่างชัดเจน +พบเงื่อนไขเชิงโครงสร้างที่คล้ายกับที่อธิบายในบทที่ 8.4 Moore [27] +วิเคราะห์การ*ถอนตัวทางศีลธรรม* (moral disengagement) ซึ่งเป็นการ +ปรับโครงสร้างทางปัญญาที่ทำให้พฤติกรรมที่ไม่มีจริยธรรมเกิดขึ้นได้ภายใต้ +แรงกดดันขององค์กร บทความปัจจุบันกล่าวถึงปรากฏการณ์ที่เสริมกัน: +ความเสียหายต่อบุคคลที่*ปฏิเสธ*ที่จะถอนตัว + +### 11.4 สิ่งที่เป็นนวัตกรรม + +องค์ประกอบแต่ละส่วน ความเหมาะสมที่สุดของ SPT กฎของ Goodhart ความ +ผิดปกติของการวัดผล บาดแผลทางศีลธรรม ล้วนมีแบบอย่างมาก่อน +ผลงานของบทความนี้คือ: + +1. **กฎการอนุรักษ์ (ทฤษฎีบท 2) ใช้เชิงกำหนด** เป็นข้อโต้แย้ง + เชิงสร้างสรรค์ว่าเวลาดำเนินการแบบถ่วงน้ำหนักตามปริมาณงาน*ไม่ + สามารถ*ถูกบิดเบือน แทนที่จะเป็นผลลัพธ์เชิงทฤษฎีการจัดลำดับ + +2. **การพิสูจน์เฉพาะว่าระดับลำดับความสำคัญทำให้มาตรวัดเป็นปฏิปักษ์ + เชิงพีชคณิต** (ทฤษฎีบท 8–9) ไม่เพียงแค่ไม่ดีเชิงประจักษ์ แต่ขัดแย้ง + เชิงโครงสร้าง โดยมีข้อมูลร่วมเป็นศูนย์ระหว่างตารางงานและระบบลำดับ + ความสำคัญ + +3. **ห่วงโซ่บูรณาการ**จากการพิสูจน์ทางคณิตศาสตร์ ผ่านความไม่สมมาตร + ของข้อมูล ผ่านความเสียหายทางจิตใจ ไปจนถึงวงจรการคัดเลือกแบบ + ปฏิปักษ์ ติดตามมาตรวัดเดียวจาก Smith (1956) ถึงการกลวงขององค์กร + +4. **กลยุทธ์การซึมซับของผู้จัดการ** (บทที่ 9) พร้อมการวิเคราะห์เชิง + ทฤษฎีเกมอย่างเป็นทางการเกี่ยวกับเสถียรภาพและเงื่อนไขการล่มสลาย + ภายใต้การแข่งขันระหว่างทีม + +5. **การประยุกต์ทฤษฎีการจัดลำดับงานกับการวิจารณ์การบริหารองค์กร** + พิสูจน์ว่ามาตรวัดทีมที่ใช้กันทั่วไปมีพยาธิสภาพเฉพาะที่วัดปริมาณได้ + แทนที่จะโต้แย้งจากเรื่องเล่าหรือหลักการทั่วไป + +--- + +## 12. บทสรุป + +ค่าเฉลี่ยเวลาดำเนินการแบบไม่ถ่วงน้ำหนักเป็น**สถิติที่มีอคติ**ที่: + +1. **สามารถถูกบิดเบือน**ด้วยนโยบายการจัดลำดับ (ทฤษฎีบท 1) ต่างจาก + เวลาดำเนินการแบบถ่วงน้ำหนักตามปริมาณงานซึ่งไม่แปรผันตามตารางงาน + (ทฤษฎีบท 2) +2. **สร้างแรงจูงใจให้เกิดการอดอาหาร**ของงานขนาดใหญ่ (ทฤษฎีบท 3) +3. **ลดคุณภาพความพึงพอใจของลูกค้า**โดยไม่มีผลผลิตเพิ่มขึ้นเป็นการ + ชดเชย (ทฤษฎีบท 7) +4. **ขัดแย้งกับระบบลำดับความสำคัญโดยตรง**โดยไม่มีข้อมูลใดๆ เกี่ยวกับ + การจำแนกผลกระทบทางธุรกิจ (ทฤษฎีบท 9) +5. **ไม่สนใจลำดับความสำคัญเลย**ในคำแนะนำการจัดลำดับ ให้ต้นทุน + ความล่าช้าแบบถ่วงน้ำหนักตามลำดับความสำคัญที่ไม่เหมาะสมที่สุด + เมื่อใดก็ตามที่ลำดับความสำคัญและขนาดไม่สัมพันธ์ผกผันอย่างสมบูรณ์ + (ทฤษฎีบท 10) + +มาตรวัดที่สามารถปรับปรุงได้ด้วยการเรียงลำดับงานใหม่ โดยไม่ต้องทำงาน +เพิ่มเติมใดๆ กำลังวัดนโยบายการจัดลำดับ ไม่ใช่ความสามารถของระบบ เมื่อ +รวมกับระบบลำดับความสำคัญ มันแนะนำตารางงานที่สร้างความเสียหายมาก +ที่สุดให้กับงานที่มีลำดับความสำคัญสูงที่สุด + +เมื่อมาตรวัดถูกรายงานต่อลูกค้า มันสร้างความไม่สมมาตรของข้อมูล (บทที่ 7) +ที่ดุลยภาพทางธุรกิจมีกำไรแต่เปราะบาง เมื่อสมาชิกทีมเข้าใจข้อบกพร่อง +มันละเมิดแรงจูงใจภายในของพวกเขาและคัดเลือกให้คนที่มีความสามารถ +มากที่สุดลาออก (บทที่ 8) ผู้จัดการคนเดียวที่มีความรู้สามารถบรรเทาผลกระทบ +เหล่านี้ได้บางส่วนผ่านการเพิ่มประสิทธิภาพภายใต้ข้อจำกัด (บทที่ 9) แต่ +กลยุทธ์ร่วมมือนี้ไม่เสถียรภายใต้การแข่งขันระหว่างทีม + +ค่าเฉลี่ยไม่ถ่วงน้ำหนักสมเหตุสมผลเฉพาะภายใต้เงื่อนไขที่แคบ (บทที่ 10.5): +ขนาดงานสม่ำเสมอ ไม่มีลำดับความสำคัญ การจับคู่ลูกค้า-งานแบบหนึ่งต่อ +หนึ่ง และไม่มีอิทธิพลต่อพฤติกรรม เงื่อนไขเหล่านี้แทบไม่เคยเป็นจริง + +**ค่าเฉลี่ยเวลาดำเนินการแบบไม่ถ่วงน้ำหนักไม่ใช่มาตรวัดที่ยุติธรรมหรือ +แม่นยำของผลการปฏิบัติงานด้านการดำเนินการ การใช้เป็นมาตรวัดทีมจะ +ก่อให้เกิดการอดอาหารของงานที่ซับซ้อนอย่างมีเหตุผล การละเมิดลำดับ +ความสำคัญที่ระบุไว้ ผลลัพธ์ที่ไม่เท่าเทียมต่อลูกค้า และภาพลวงของ +ผลผลิตที่ไม่มีอยู่จริง** + +ทางออกที่ดีที่สุดคือการปฏิรูปมาตรวัดระดับองค์กร ทางออกที่ปฏิบัติได้คือ +ผู้จัดการที่เข้าใจการพิสูจน์นี้ + +--- + +## เอกสารอ้างอิง + +### ทฤษฎีการจัดลำดับงาน + +[1] Smith, W. E. (1956). Various optimizers for single-stage production. +*Naval Research Logistics Quarterly*, 3(1–2), 59–66. +doi:[10.1002/nav.3800030106](https://doi.org/10.1002/nav.3800030106) + +> ที่มาของผลลัพธ์ความเหมาะสมที่สุดของ SPT (ทฤษฎีบท 1) กฎเวลา +> ดำเนินการแบบถ่วงน้ำหนัก $w_i/p_i$ จากมากไปน้อย (WSJF, ทฤษฎีบท 11) +> และเทคนิคการพิสูจน์แบบสลับคู่ที่อยู่ติดกัน (อาร์กิวเมนต์การแลกเปลี่ยน) +> ที่ใช้ตลอดทั้งบทความ + +[2] Conway, R. W., Maxwell, W. L., & Miller, L. W. (1967). *Theory of +Scheduling*. Addison-Wesley. + +> ตำราเรียนมาตรฐานสำหรับทฤษฎีการจัดลำดับงานเครื่องจักรเดียว ขยายผล +> ลัพธ์ของ Smith + +[3] Little, J. D. C. (1961). A proof for the queuing formula: L = λW. +*Operations Research*, 9(3), 383–387. +doi:[10.1287/opre.9.3.383](https://doi.org/10.1287/opre.9.3.383) + +> การพิสูจน์อย่างเข้มงวดครั้งแรกของกฎของ Little อ้างอิงในบทที่ 3.2 +> สำหรับบริบทเชิงทฤษฎีแถวคอย + +[4] Little, J. D. C. (2011). Little's Law as viewed on its 50th +anniversary. *Operations Research*, 59(3), 536–549. +doi:[10.1287/opre.1110.0941](https://doi.org/10.1287/opre.1110.0941) + +> บทวิเคราะห์ย้อนหลังที่อภิปรายขอบเขต ข้อจำกัด และการนำไปใช้ผิดที่พบ +> บ่อย + +[5] Reinertsen, D. G. (2009). *The Principles of Product Development +Flow: Second Generation Lean Product Development*. Celeritas Publishing. +ISBN: 978-0-9844512-0-8. + +> ทำให้ WSJF และ "Cost of Delay / Duration" (ต้นทุนความล่าช้า / ระยะเวลา) +> เป็นที่นิยมในบริบท agile/lean รากฐานทางคณิตศาสตร์คือ Smith (1956) [1] + +### การวัดผลและแรงจูงใจ + +[6] Goodhart, C. A. E. (1984). Problems of monetary management: The U.K. +experience. In *Monetary Theory and Practice* (pp. 91–121). Macmillan. + +> ที่มาของกฎของ Goodhart: "ความสม่ำเสมอทางสถิติที่สังเกตได้ใดๆ จะ +> มีแนวโน้มที่จะพังทลายเมื่อถูกกดดันเพื่อวัตถุประสงค์ในการควบคุม" + +[7] Strathern, M. (1997). 'Improving ratings': Audit in the British +university system. *European Review*, 5(3), 305–321. +doi:[10.1002/(SICI)1234-981X(199707)5:3<305::AID-EURO184>3.0.CO;2-4](https://doi.org/10.1002/(SICI)1234-981X(199707)5:3%3C305::AID-EURO184%3E3.0.CO;2-4) + +> วางนัยทั่วไปกฎของ Goodhart: "เมื่อมาตรวัดกลายเป็นเป้าหมาย มันหยุด +> เป็นมาตรวัดที่ดี" + +### เศรษฐศาสตร์พฤติกรรม + +[8] Kahneman, D., & Tversky, A. (1979). Prospect theory: An analysis of +decision under risk. *Econometrica*, 47(2), 263–292. +doi:[10.2307/1914185](https://doi.org/10.2307/1914185) + +> สร้างแนวคิดการเกลียดการสูญเสีย อ้างอิงในบทที่ 4.5 + +### ทฤษฎีเกมและทฤษฎีสัญญา + +[9] Akerlof, G. A. (1970). The market for "lemons": Quality uncertainty +and the market mechanism. *The Quarterly Journal of Economics*, 84(3), +488–500. doi:[10.2307/1879431](https://doi.org/10.2307/1879431) + +> ความไม่สมมาตรของข้อมูลและการคัดเลือกที่ไม่พึงประสงค์ ดุลยภาพแบบ +> รวมกลุ่มในบทที่ 7.5 มีโครงสร้างที่คล้ายกัน + +[10] Hölmstrom, B. (1979). Moral hazard and observability. *The Bell +Journal of Economics*, 10(1), 74–91. +doi:[10.2307/3003320](https://doi.org/10.2307/3003320) + +> การอธิบายอย่างเป็นทางการของภัยทางศีลธรรม สถานการณ์การรายงาน +> มาตรวัดในบทที่ 7.5 เป็นปัญหาภัยทางศีลธรรม + +### จิตวิทยา + +[11] Festinger, L. (1957). *A Theory of Cognitive Dissonance*. Stanford +University Press. ISBN: 978-0-8047-0131-0. + +> ทฤษฎีพื้นฐาน อ้างอิงในบทที่ 8.2 + +[12] Deci, E. L., & Ryan, R. M. (1985). *Intrinsic Motivation and +Self-Determination in Human Behavior*. Plenum Press. +ISBN: 978-0-306-42022-1. + +> การอธิบายดั้งเดิมของทฤษฎีการกำหนดตนเอง อ้างอิงในบทที่ 8.3 + +[13] Ryan, R. M., & Deci, E. L. (2000). Self-determination theory and +the facilitation of intrinsic motivation, social development, and +well-being. *American Psychologist*, 55(1), 68–78. +doi:[10.1037/0003-066X.55.1.68](https://doi.org/10.1037/0003-066X.55.1.68) + +> ภาพรวมของทฤษฎีการกำหนดตนเองที่เชื่อมโยงการตอบสนองความต้องการ +> กับแรงจูงใจภายในและความเป็นอยู่ที่ดี + +[14] Seligman, M. E. P., & Maier, S. F. (1967). Failure to escape +traumatic shock. *Journal of Experimental Psychology*, 74(1), 1–9. +doi:[10.1037/h0024514](https://doi.org/10.1037/h0024514) + +> การแสดงให้เห็นดั้งเดิมของความสิ้นหวังที่เรียนรู้ อ้างอิงในบทที่ 8.5 + +[15] Seligman, M. E. P. (1975). *Helplessness: On Depression, +Development, and Death*. W. H. Freeman. ISBN: 978-0-7167-0752-3. + +> การอธิบายขยายที่เชื่อมโยงความสิ้นหวังที่เรียนรู้กับภาวะซึมเศร้าของ +> มนุษย์และพฤติกรรมสถาบัน + +[16] Shay, J. (1994). *Achilles in Vietnam: Combat Trauma and the Undoing +of Character*. Atheneum / Simon & Schuster. ISBN: 978-0-689-12182-3. + +> แนะนำแนวคิดบาดแผลทางศีลธรรม อ้างอิงในบทที่ 8.4 + +[17] Litz, B. T., Stein, N., Delaney, E., Lebowitz, L., Nash, W. P., +Silva, C., & Maguen, S. (2009). Moral injury and moral repair in war +veterans: A preliminary model and intervention strategy. *Clinical +Psychology Review*, 29(8), 695–706. +doi:[10.1016/j.cpr.2009.07.003](https://doi.org/10.1016/j.cpr.2009.07.003) + +> ทำให้บาดแผลทางศีลธรรมเป็นแนวคิดทางคลินิกอย่างเป็นทางการ คำนิยาม +> อ้างอิงในบทที่ 8.4 + +### การวัดผลองค์กร + +[18] Austin, R. D. (1996). *Measuring and Managing Performance in +Organizations*. Dorset House. ISBN: 978-0-932633-36-1. + +> พิสูจน์ว่าการวัดผลที่ไม่สมบูรณ์สร้างแรงจูงใจที่หลีกเลี่ยงไม่ได้ในการ +> เพิ่มประสิทธิภาพมิติที่ถูกวัดโดยเสียสละมิติที่ไม่ได้วัด กรอบความไม่สมมาตร +> ของข้อมูลมีความคล้ายกันอย่างใกล้ชิดกับบทที่ 7 เป็นงานบรรพบุรุษที่สำคัญ +> ที่สุดสำหรับข้อโต้แย้งของบทความนี้ + +[19] Muller, J. Z. (2018). *The Tyranny of Metrics*. Princeton University +Press. ISBN: 978-0-691-17495-2. + +> การอธิบายอย่างครอบคลุมเกี่ยวกับ "metric fixation" (การยึดติดกับมาตรวัด) +> ในการศึกษา การแพทย์ ตำรวจ และการเงิน หลักฐานเชิงประจักษ์อย่าง +> กว้างขวางสำหรับรูปแบบที่ตั้งทฤษฎีไว้ในบทที่ 7.4 + +### ความยุติธรรมในการจัดลำดับงาน + +[20] Coffman, E. G., Shanthikumar, J. G., & Yao, D. D. (1992). +Multiclass queueing systems: Polymatroid structure and optimal scheduling +control. *Operations Research*, 40(S2), S293–S299. + +> กฎการอนุรักษ์ในการจัดลำดับงาน ความไม่แปรผันของเวลาดำเนินการแบบ +> ถ่วงน้ำหนักตามปริมาณงาน (ทฤษฎีบท 2) เป็นตัวอย่างหนึ่งของกฎ +> การอนุรักษ์เหล่านี้ + +[21] Angel, E., Bampis, E., & Pascual, F. (2008). How good are SPT +schedules for fair optimality criteria? *Annals of Operations Research*, +159(1), 53–64. doi:[10.1007/s10479-007-0267-0](https://doi.org/10.1007/s10479-007-0267-0) + +> วัดคุณภาพตารางงาน SPT เทียบกับเกณฑ์ความยุติธรรมโดยตรง เป็น +> งานบรรพบุรุษที่ใกล้ที่สุดในทฤษฎีการจัดลำดับงานกับการวิเคราะห์ความ +> ยุติธรรมในบทที่ 4 + +[22] Bansal, N., & Harchol-Balter, M. (2001). Analysis of SRPT +scheduling: Investigating unfairness. *ACM SIGMETRICS Performance +Evaluation Review*, 29(1), 279–290. +doi:[10.1145/384268.378792](https://doi.org/10.1145/384268.378792) + +> ตรวจสอบความเชื่อที่ว่า SRPT ลงโทษงานขนาดใหญ่อย่างไม่ยุติธรรม +> ในการจัดลำดับคอมพิวเตอร์ โต้แย้งว่าความไม่ยุติธรรมน้อยกว่าที่เชื่อกัน +> แต่ยอมรับความตึงเครียดหลัก + +[23] Wierman, A., & Harchol-Balter, M. (2003). Classifying scheduling +policies with respect to unfairness in an M/GI/1. *ACM SIGMETRICS +Performance Evaluation Review*, 31(1), 238–249. + +> ทำให้นิยามความยุติธรรมสำหรับนโยบายการจัดลำดับเป็นรูปแบบอย่างเป็น +> ทางการโดยเปรียบเทียบกับ Processor-Sharing + +### เอกสารอ้างอิงเพิ่มเติม + +[24] Campbell, D. T. (1979). Assessing the impact of planned social +change. *Evaluation and Program Planning*, 2(1), 67–90. +doi:[10.1016/0149-7189(79)90048-X](https://doi.org/10.1016/0149-7189(79)90048-X) + +> กฎของ Campbell: "ยิ่งตัวชี้วัดเชิงปริมาณทางสังคมใดๆ ถูกใช้สำหรับ +> การตัดสินใจทางสังคมมากเท่าไร มันก็จะยิ่งถูกกดดันให้เกิดการบิดเบือน +> มากขึ้นเท่านั้น และยิ่งมีแนวโน้มที่จะบิดเบือนและทำลายกระบวนการ +> ทางสังคมที่มันตั้งใจจะติดตาม" เสริมกฎของ Goodhart [6] + +[25] Ferreira, C. M., et al. (2024). It's business: A qualitative study +of moral injury in business settings. *Journal of Business Ethics*. +doi:[10.1007/s10551-024-05615-0](https://doi.org/10.1007/s10551-024-05615-0) + +> ขยายบาดแผลทางศีลธรรมไปยังสถานที่ทำงานแสวงหากำไร ยืนยันการ +> ประยุกต์ใช้ของบทที่ 8.4 จาก Shay/Litz นอกเหนือจากบริบททางทหาร +> และการแพทย์ + +[26] Bevan, G., & Hood, C. (2006). What's measured is what matters: +Targets and gaming in the English public health care system. *Public +Administration*, 84(3), 517–538. +doi:[10.1111/j.1467-9299.2006.00600.x](https://doi.org/10.1111/j.1467-9299.2006.00600.x) + +> บันทึกพฤติกรรมการบิดเบือนเชิงประจักษ์ รวมถึง "ถึงเป้าหมายแต่พลาด +> ประเด็น" ให้หลักฐานจากโลกจริงสำหรับความขัดแย้งระหว่างลำดับ +> ความสำคัญกับมาตรวัดในบทที่ 5.2 + +[27] Moore, C. (2012). Why employees do bad things: Moral disengagement +and unethical organizational behavior. *Personnel Psychology*, 65(1), +1–48. doi:[10.1111/j.1744-6570.2011.01237.x](https://doi.org/10.1111/j.1744-6570.2011.01237.x) + +> วิเคราะห์การ*ถอนตัวทางศีลธรรม* ซึ่งเป็นการปรับโครงสร้างทางปัญญาที่ +> ทำให้พฤติกรรมที่ไม่มีจริยธรรมเกิดขึ้นได้ บทที่ 8 กล่าวถึงปรากฏการณ์ที่ +> เสริมกัน: ความเสียหายต่อบุคคลที่*ปฏิเสธ*ที่จะถอนตัว + +--- + +*การพิสูจน์นี้ถูกพัฒนาผ่านการสนทนาและทำให้เป็นรูปแบบเมื่อ 28 มีนาคม 2569* diff --git a/README.tl.md b/README.tl.md new file mode 100644 index 0000000..933dfe8 --- /dev/null +++ b/README.tl.md @@ -0,0 +1,859 @@ +# Ang Hindi Tinimbangang Karaniwang Oras ng Pagkumpleto ay Hindi Patas na Sukatan para sa Pag-iiskedyul ng Gawain + +Isang matematikal na patunay na ang hindi tinimbangang karaniwang oras ng pagkumpleto ng gawain ay isang may kinikilingang estadistika na nagbibigay-insentibo sa pamimili ng mga madaling gawain, at ang anumang bentahe sa pag-iiskedyul na lumilitaw nito ay isang artipisyo ng sukatan — hindi isang tunay na pagpapakita ng produktibidad o kalidad ng serbisyo. + +--- + +## 1. Panimula + +Maraming organisasyon ang sumusukat ng pagganap sa pagpapatupad ng gawain gamit ang **hindi tinimbangang karaniwang oras ng pagkumpleto**: ang karaniwang bilang ng mga oras (o araw) mula sa pagsusumite hanggang sa paglutas ng gawain, kung saan bawat gawain ay binibilang nang pantay-pantay anuman ang laki o priyoridad. + +Pinatutunayan ng papel na ito na ang sukatang ito ay hindi lamang hindi tumpak kundi may istrukturang pagkiling. Maaari itong pagbutihin sa pamamagitan ng muling pag-aayos ng trabaho nang hindi gumagawa ng karagdagang trabaho (Teorema 1), samantalang ang wastong tinimbangang alternatibo ay ganap na hindi naaapektuhan ng manipulasyon sa pag-iiskedyul (Teorema 2). Kapag isinama sa isang sistema ng priyoridad, ang sukatan ay aktibong sumasalungat sa sariling mga klasipikasyon ng priyoridad ng organisasyon (Teorema 9). + +Ang argumento ay nahahati sa apat na bahagi: + +- **Bahagi I** (Seksyon 2–4) nagtatag ng matematikal na pundasyon: + ang hindi tinimbangang karaniwang halaga ay maaaring manipulahin ng Shortest Processing Time (SPT — Pinakamaikling Oras ng Pagproseso muna) na pag-iiskedyul, ang tinimbangang-ayon-sa-trabaho na karaniwang halaga ay hindi nagbabago sa anumang iskedyul, at ang mga resulta sa kalidad ng serbisyo ay napatunayang negatibo. + +- **Bahagi II** (Seksyon 5–6) nagpapalawak ng modelo sa mga gawaing may klasipikasyon ng priyoridad, pinatutunayan na ang sukatan ay nagiging kalaban ng sistema ng priyoridad, at nagmumungkahi ng mga tinimbangang alternatibo kasama ang isang halimbawang IT service desk. + +- **Bahagi III** (Seksyon 7–9) sinusuri ang mga dinamika ng organisasyon: ano ang mangyayari kapag ang sukatan ay iniulat sa mga kliyente (asimetriyang impormasyon), ano ang mangyayari sa mga miyembro ng koponan na nauunawaan ang mga depekto nito (sikolohikal na pinsala), at ano ang magagawa ng isang may kaalamang tagapamahala tungkol dito (constrainedna optimisasyon na may pagsusuri sa katatagan ayon sa teorya ng laro). + +- **Bahagi IV** (Seksyon 10–12) nagpapakita ng tapat na mga kontra-argumento, inilalagay ang pananaliksik sa konteksto ng umiiral na literatura, at nagtatapos. + +Ang mga pangunahing resulta ay nakabatay sa pundasyonal na teorya ng pag-iiskedyul ni Smith (1956) [1], pinalawak sa pamamagitan ng teorya ng laro [9, 10], teorya ng pagsukat sa organisasyon [18, 19], at sikolohiya [11–17] upang masubaybayan ang kumpletong kadena mula sa isang matematikal na patunay tungkol sa isang tiyak na sukatan hanggang sa mga resulta ng organisasyon. + +--- + +# Bahagi I: Matematikal na Pundasyon + +## 2. Mga Kahulugan + +Hayaang mayroong **n** na gawain na may mga oras ng pagproseso $p_1, p_2, \ldots, p_n$. + +Ang isang **iskedyul** $\sigma$ ay isang permutasyon ng $\{1, 2, \ldots, n\}$ na nagtatalaga ng mga gawain sa pagkakasunod-sunod ng pagpapatupad sa isang tagapagpatupad. + +Ang **oras ng pagkumpleto** ng gawain $\sigma(k)$ sa ilalim ng iskedyul $\sigma$ ay: + +$$C_{\sigma(k)} = \sum_{j=1}^{k} p_{\sigma(j)}$$ + +Ang **hindi tinimbangang karaniwang oras ng pagkumpleto** ay: + +$$\bar{C}(\sigma) = \frac{1}{n} \sum_{k=1}^{n} C_{\sigma(k)}$$ + +Ang **tinimbangang-ayon-sa-trabaho na karaniwang oras ng pagkumpleto** ay: + +$$\bar{C}_w(\sigma) = \frac{\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)}}{\sum_{k=1}^{n} p_{\sigma(k)}}$$ + +--- + +## 3. Mga Pangunahing Resulta + +### 3.1 Ang Hindi Tinimbangang Karaniwang Halaga ay Maaaring Manipulahin + +**Teorema 1** (Smith, 1956 [1])**.** Ang iskedyul na nagpapaliit sa +$\bar{C}(\sigma)$ ay SPT (Shortest Processing Time — Pinakamaikling Oras ng Pagproseso muna): ayusin ang mga gawain upang +$p_{\sigma(1)} \le p_{\sigma(2)} \le \cdots \le p_{\sigma(n)}$. + +**Patunay (argumento ng pagpapalitan [1, 2]).** + +Isaalang-alang ang anumang iskedyul $\sigma$ kung saan ang dalawang magkatabing gawain $i, j$ ay nakatutugon sa $p_i > p_j$ na ang gawain $i$ ay naka-iskedyul nang kaagad bago ang gawain $j$. Hayaang $t$ ang oras ng pagsisimula ng gawain $i$. + +| | Natatapos ang Gawain $i$ | Natatapos ang Gawain $j$ | Kabuuan | +|---|---|---|---| +| **Bago ang pagpapalit** ($i$ pagkatapos $j$) | $t + p_i$ | $t + p_i + p_j$ | $2t + 2p_i + p_j$ | +| **Pagkatapos ng pagpapalit** ($j$ pagkatapos $i$) | $t + p_j$ | $t + p_j + p_i$ | $2t + p_i + 2p_j$ | + +Ang pagbabago sa kabuuan ng mga oras ng pagkumpleto ay: + +$$(2p_i + p_j) - (p_i + 2p_j) = p_i - p_j > 0$$ + +Bawat pagpapalit ng mas-mahabang-bago-ang-mas-maikli na magkatabing pares ay mahigpit na nagpapababa ng kabuuan. Ang anumang hindi SPT na iskedyul ay naglalaman ng gayong pares. Ang paulit-ulit na pagpapalit ay nagtutungo sa SPT. Samakatuwid, ang SPT ay natatanging nagpapaliit ng $\bar{C}(\sigma)$. $\blacksquare$ + +### 3.2 Ang Tinimbangang-ayon-sa-Trabaho na Karaniwang Halaga ay Hindi Nagbabago sa Iskedyul + +**Teorema 2.** Ang tinimbangang-ayon-sa-trabaho na karaniwang oras ng pagkumpleto $\bar{C}_w(\sigma)$ ay pareho para sa bawat iskedyul $\sigma$. + +**Patunay.** + +Palawakin ang numerador: + +$$\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)} = \sum_{k=1}^{n} p_{\sigma(k)} \sum_{j=1}^{k} p_{\sigma(j)}$$ + +Muling i-index sa pamamagitan ng pagpapalit ng $a = \sigma(k)$ at $b = \sigma(j)$. Ang dobleng kabuuan ay binibilang ang bawat ordered na pares $(a, b)$ kung saan ang $b$ ay naka-iskedyul nang hindi lalampas sa $a$: + +$$= \sum_{\substack{a, b \\ b \preceq_\sigma a}} p_a \, p_b$$ + +Para sa anumang pares $(a, b)$ na may $a \ne b$, eksaktong isa sa +$\{b \preceq_\sigma a\}$ o $\{a \prec_\sigma b\}$ ang totoo. Ang mga diagonal na termino ($a = b$) ay nag-aambag ng $p_a^2$ anuman ang pagkakasunod-sunod. Samakatuwid: + +$$\sum_{\substack{a, b \\ b \preceq_\sigma a}} p_a \, p_b = \sum_{a} p_a^2 + \sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b$$ + +Kasama ng komplementaryong kabuuan, ang dalawang off-diagonal na kabuuan ay sumasaklaw sa lahat ng hindi naka-ayos na pares: + +$$\sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b + \sum_{\substack{a \ne b \\ a \prec_\sigma b}} p_a \, p_b = \sum_{a \ne b} p_a \, p_b$$ + +Ang kanang bahagi ay hindi nakadepende sa iskedyul. Sa pamamagitan ng simetriya ng $p_a p_b$, ang parehong off-diagonal na kabuuan ay magkapantay: + +$$\sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b = \frac{1}{2} \sum_{a \ne b} p_a \, p_b$$ + +Samakatuwid: + +$$\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)} = \sum_a p_a^2 + \frac{1}{2} \sum_{a \ne b} p_a \, p_b = \frac{1}{2}\left(\sum_a p_a\right)^2 + \frac{1}{2}\sum_a p_a^2$$ + +Ang ekspresyong ito ay walang sanggunian sa $\sigma$. Dahil ang denominador +$\sum p_a$ ay hindi rin nakadepende sa iskedyul: + +$$\bar{C}_w(\sigma) = \frac{\frac{1}{2}\left(\sum p_a\right)^2 + \frac{1}{2}\sum p_a^2}{\sum p_a}$$ + +ay **pare-pareho sa lahat ng iskedyul**. $\blacksquare$ + +Ito ay isang halimbawa ng mga batas ng konserbasyon sa pag-iiskedyul na tinukoy nina Coffman, Shanthikumar, at Yao [20]. Ang pagkakapare-pareho ay tumutugon sa pagsukat kung gaano katagal naghihintay ang isang yunit ng *trabaho* kaysa kung gaano katagal naghihintay ang isang *gawain* — ang hindi tinimbangang estadistika ay bumibilang ng mga pagkumpleto sa halip na trabaho, kaya naman ito ay maaaring manipulahin. (Tingnan din si Little [3, 4] para sa konteksto ng teorya ng pila, na may paalala na ang Batas ni Little ay direktang naaangkop lamang sa mga sistemang nasa steady-state, hindi sa batch case na sinusuri dito.) + +### 3.3 Naglalarawang Halimbawa + +Dalawang gawain: $A$ na may $p_A = 1$ oras, $B$ na may $p_B = 10$ oras. + +| Iskedyul | $C_A$ | $C_B$ | Hindi tinimbangang karaniwang halaga | Tinimbangang-ayon-sa-trabaho na karaniwang halaga | +|----------|-------|-------|-----------------|-------------------| +| SPT (A muna) | 1 | 11 | 6.0 | 111/11 ≈ 10.09 | +| Baliktad (B muna) | 11 | 10 | 10.5 | 111/11 ≈ 10.09 | + +Lumilitaw na **4.5 oras na mas magaling** ang SPT sa hindi tinimbangang sukatan ngunit nagbibigay ng **zero na pagpapabuti** sa tinimbangang-ayon-sa-trabaho na sukatan. Ang litaw na bentahe ay umiiral lamang dahil hinahayaan ng hindi tinimbangang estadistika ang isang 1-oras na gawain na "bumoto" nang pantay sa isang 10-oras na gawain. + +--- + +## 4. Mga Kahihinatnan para sa Kalidad ng Serbisyo + +### 4.1 Pagkagutom ng Malalaking Gawain + +**Teorema 3 (Pagkiling ng Sukatan).** Ang anumang patakaran sa pag-iiskedyul na nagpapaliit sa hindi tinimbangang karaniwang oras ng pagkumpleto ay kinakailangang nagpapalaki nang husto sa oras ng pagkumpleto ng pinakamalaking gawain. + +**Patunay.** Inilalagay ng SPT ang pinakamalaking gawain sa huli. Ang oras ng pagkumpleto nito ay katumbas ng kabuuang oras ng pagproseso $\sum p_i$, na siyang pinakamataas na posibleng oras ng pagkumpleto para sa anumang indibidwal na gawain. Sa ilalim ng anumang iskedyul na hindi naglalagay ng pinakamalaking gawain sa huli, ang gawaing iyon ay natatapos nang mas maaga. $\blacksquare$ + +Lumilikha ito ng **insentibo ng pagkagutom**: ang mga makatwirang ahente na nag-o-optimize ng hindi tinimbangang estadistika ay walang katapusang magpapaliban ng malalaking gawain pabor sa maliliit. Tinukoy ni Austin [18] ang pangkalahatang patern na ito — na ang hindi kumpletong pagsukat ay lumilikha ng mga insentibo upang i-optimize ang sinusukat na dimensyon sa kapinsalaan ng mga hindi sinusukat — sa konteksto ng pamamahala ng pagganap ng organisasyon. Ang Teorema 3 ay nagbibigay ng tiyak na mekanismo para sa pag-iiskedyul ng gawain. + +### 4.2 Pinakamataas na Oras ng Pagkumpleto para sa Pinakamalaking Gawain + +**Teorema 4 (Natatanging Pagpapalaki ng SPT sa Oras ng Pagkumpleto ng Pinakamalaking Gawain).** +Sa lahat ng iskedyul, ang SPT ang natatanging patakaran na nagtatalaga ng pinakamataas na posibleng oras ng pagkumpleto ($\sum p_i$) sa pinakamalaking gawain. + +**Patunay.** Isinasaayos ng SPT ang mga gawain sa pataas na pagkakasunod-sunod ng $p_i$, na naglalagay ng pinakamalaking gawain $p_{\max}$ sa huling posisyon. Ang huling gawain sa anumang iskedyul ay may oras ng pagkumpleto na $\sum_{i=1}^{n} p_i$, na siyang pinakamataas na maaaring matanggap ng anumang indibidwal na gawain. Sa ilalim ng anumang iskedyul na hindi naglalagay ng $p_{\max}$ sa huli, natatapos ito nang mahigpit na bago ang $\sum p_i$. $\blacksquare$ + +**Korolari 4.1.** Ang isang koponang nag-o-optimize ng hindi tinimbangang karaniwang oras ng pagkumpleto ay sistematikong maghahatid ng pinakamasamang karanasan sa mga kliyenteng may pinakamasalimuot na mga pangangailangan. Hindi ito isang epekto sa gilid — ito ang *mekanismo* kung saan nagpapabuti ang sukatan. + +**Tala sa mga ratio ng pagbagal.** Ang SPT ay talagang *nagko-compress* ng mga ratio ng pagbagal ($S_i = C_i / p_i$) dahil ang mas malalaking gawain sa mga huling posisyon ay may malalaking denominador na sumisipsip ng naipon na kabuuan. Halimbawa, sa mga gawaing $[1, 5, 10]$: ang SPT ay nagbibigay ng mga pagbagal na $[1, 1.2, 1.6]$ (mababang variance) samantalang ang LPT ay nagbibigay ng $[1, 3, 16]$ (mataas na variance). Ang pinsala ng SPT sa mga kliyenteng may malalaking gawain ay hindi nakikita sa ratio ng pagbagal — nakikita ito sa **absolutong oras ng pagkumpleto**. Ang pagkakaibang ito ay mahalaga: ang literatura sa katarungan ng pag-iiskedyul [21, 22, 23] ay nagdebate sa kawalan ng katarungan ng SPT/SRPT pangunahin sa pamamagitan ng mga sukatang batay sa pagbagal, na maaaring magtago ng absolutong pasanin ng pagkaantala na pinatunayan sa ibaba. + +### 4.3 Konsentrasyon ng Pagkaantala + +**Teorema 5 (Kinokonsentra ng SPT ang Pagkaantala sa Pinakamalaking Gawain).** Sa ilalim ng SPT, ang pinakamalaking gawain ang nagdadala ng mas maraming absolutong pagkaantala kaysa sa ilalim ng anumang ibang iskedyul. + +**Patunay.** Tukuyin ang absolutong pagkaantala bilang $\Delta_i = C_i - p_i$ (oras na ginugol sa paghihintay, independyente sa sariling laki). Sa ilalim ng SPT, ang pinakamalaking gawain ay nasa posisyon $n$ na may: + +$$\Delta_{\max\text{-task}}^{\text{SPT}} = C_n - p_n = \sum_{i=1}^{n-1} p_i$$ + +Ito ang kabuuan ng mga oras ng pagproseso ng lahat ng iba pang gawain — ang pinakamataas na posibleng pagkaantala para sa anumang solong gawain. Sa ilalim ng anumang iskedyul kung saan ang pinakamalaking gawain ay hindi nasa huli, ang pagkaantala nito ay mahigpit na mas mababa. Samantala, binibigyan ng SPT ang pinakamaliit na gawain ng zero na pagkaantala ($\Delta_1^{\text{SPT}} = 0$). Ang buong pasanin ng pagpila ay inililipat mula sa maliliit na gawain patungo sa malalaking gawain. $\blacksquare$ + +Pinapaliit ng SPT ang *kabuuang* pagkaantala (mabuti para sa pinagsama-samang kahusayan) sa pamamagitan ng pagkokonsentra ng pagkaantala sa mga gawaing may kakayahang sumipsip nito sa mga termino ng ratio ng pagbagal. Ngunit sa absolutong termino — mga oras na ginugol sa paghihintay — ang pinakamalaking gawain ang nagdadala ng buong bigat. + +### 4.4 Pagkakapare-pareho ng Throughput + +**Teorema 6 (Pagkakapare-pareho ng Throughput).** Ang kabuuang trabahong natapos sa anumang hangganan ng oras $T$ ay magkapareho sa ilalim ng lahat ng patakaran sa pag-iiskedyul. + +**Patunay.** Nagpoproseso ng trabaho ang tagapagpatupad sa isang nakapirming bilis. Sa anumang hangganan $T \ge \sum p_i$, ang kabuuang trabahong natapos ay eksaktong $\sum p_i$ anuman ang pagkakasunod-sunod. Para sa kaso ng steady-state na may patuloy na mga pagdating, ang pangmatagalang throughput ay tinutukoy ng bilis ng serbisyo $\mu$ at ganap na independyente sa pag-iiskedyul: + +$$\lim_{T \to \infty} \frac{W(T)}{T} = \mu \quad \text{para sa lahat ng iskedyul } \sigma$$ + +$\blacksquare$ + +**Korolari 6.1.** Ang isang koponang lilipat mula sa anumang patakaran sa pag-iiskedyul patungo sa SPT ay magmamasid ng pagpapabuti sa hindi tinimbangang karaniwang oras ng pagkumpleto na may **zero na pagbabago sa aktwal na throughput**. Nagpapabuti ang sukatan. Hindi nagbabago ang output. + +### 4.5 Ang Pinagsamang Epekto + +Pinagsasama ang mga Teorema 4, 5, at 6: + +| Sukatan | Epekto ng pag-o-optimize ng hindi tinimbangang karaniwang halaga | +|---------|--------------------------------------| +| Throughput (trabaho/oras) | Walang pagbabago (Teorema 6) | +| Pagkaantala para sa maliliit na gawain | Pinapaliit — lumalapit sa zero (SPT) | +| Pagkaantala para sa malalaking gawain | **Pinalalaki** — dinadala ang lahat ng pasanin ng pagpila (Teorema 5) | +| Oras ng pagkumpleto ng pinakamalaking gawain | **Pinakamataas na posible**: $\sum p_i$ (Teorema 4) | + +Ang netong epekto sa ipinagmamalaking kalidad ay negatibo dahil: + +1. **Asimetriko ang pag-iwas sa pagkawala** [8]. Ang isang kliyenteng ang 100-oras na gawain ay ibinaba ang priyoridad ay nakakaranas ng isang malaki, kapansin-pansing negatibo. Ang isang kliyenteng ang 1-oras na gawain ay pinabilis ay nakakaranas ng isang maliit, madalas na hindi napapansing positibo. + +2. **Ang mga gawaing may mataas na pagsisikap ay may korelasyon sa mga kliyenteng may mataas na halaga.** Ang malalaking gawain ay hindi proporsyonal na maaaring nagmumula sa malalaking kliyente, masalimuot na mga kontrata, o mga kritikal na pangangailangan ng negosyo. + +3. **Nagsasanib-sanib ang pagkagutom.** Sa isang tuloy-tuloy na sistema (Teorema 3), ang malalaking gawain ay maaaring **walang katapusang ipagpaliban** habang patuloy na dumarating ang mga bagong maliliit na gawain. + +**Teorema 7 (Ang Pangunahing Resulta).** Para sa isang koponang nagpoproseso ng mga gawaing may hindi magkakapareho na laki, ang pag-adopt ng hindi tinimbangang karaniwang oras ng pagkumpleto bilang sukatan ng pagganap ay: + +(a) Nagbibigay ng **zero na pagtaas sa produktibidad** (Teorema 6), samantalang +(b) **Nagtatalaga ng pinakamataas na posibleng oras ng pagkumpleto** sa pinakamalaking gawain (Teorema 4), at +(c) **Kinokonsentra ang lahat ng pagkaantala sa pagpila** sa mga pinakamalaking gawain habang inaalis ang pagkaantala para sa pinakamaliliit (Teorema 5). + +Hindi ito isang kompromiso. Ang sukatan ay lumilikha ng isang purong paglilipat ng kalidad ng serbisyo mula sa mga kliyenteng may mataas na pagsisikap patungo sa mga kliyenteng may mababang pagsisikap, nang walang netong trabahong nakuha. $\blacksquare$ + +--- + +# Bahagi II: Mga Sistema ng Priyoridad + +## 5. Pagkasira sa Ilalim ng Klasipikasyon ng Priyoridad + +Pinatunayan ng mga naunang seksyon na ang hindi tinimbangang karaniwang oras ng pagkumpleto ay may pagkiling kapag magkakaiba ang laki ng mga gawain. Ipapakita natin ngayon na ang pagpapakilala ng isang **sistema ng priyoridad** — gaya ng ginagamit ng halos lahat ng tunay na koponan — ay nagiging sanhi na ang sukatan ay hindi lamang may pagkiling kundi **aktibong kalaban** ng mga ipinahayag na layunin ng organisasyon. + +### 5.1 Pinalawak na Modelo: Mga Gawain na may Priyoridad + +Hayaang ang bawat gawain $i$ ay may oras ng pagproseso $p_i$ at isang klase ng priyoridad $q_i \in \{1, 2, 3, 4\}$ kung saan ang 1 ang pinakamataas na priyoridad (kritikal) at ang 4 ang pinakamababa (kosmetiko/pagpapahusay). Italaga ang mga timbang ng priyoridad: + +$$w(q) = \begin{cases} 8 & q = 1 \text{ (Kritikal)} \\ 4 & q = 2 \text{ (Mataas)} \\ 2 & q = 3 \text{ (Katamtaman)} \\ 1 & q = 4 \text{ (Mababa)} \end{cases}$$ + +Ang mga tiyak na timbang ay pang-ilustrasyon; ang mga resulta ay totoo para sa anumang mahigpit na pababang function ng timbang. Ang pangunahing katangian ay ang priyoridad ay itinatalaga ayon sa **epekto sa negosyo**, hindi sa laki ng gawain. + +### 5.2 Ang Sukatan ay Sumasalungat sa Sistema ng Priyoridad + +**Teorema 8 (Pagbabaligtad ng Priyoridad-Laki).** Kapag ang priyoridad ay independyente sa laki ng gawain, ang iskedyul na nagpapaliit sa hindi tinimbangang karaniwang oras ng pagkumpleto (SPT) ay, sa inaasahan, tatapusin ang mga gawaing may mababang priyoridad bago ang mga gawaing may mataas na priyoridad na mas malaki ang laki. + +**Patunay.** Inaayos ng SPT ang mga gawain ayon sa $p_i$ pataas, anuman ang $q_i$. Isaalang-alang ang dalawang gawain: + +- Gawain A: $p_A = 40$ oras, $q_A = 1$ (Kritikal — hal., pagbagsak ng server) +- Gawain B: $p_B = 0.5$ oras, $q_B = 4$ (Mababa — hal., kosmetikong ayos sa UI) + +Ini-iskedyul ng SPT ang B bago ang A. Ang hindi tinimbangang karaniwang halaga para sa pares na ito: + +$$\bar{C}^{\text{SPT}} = \frac{0.5 + 40.5}{2} = 20.5 \qquad \bar{C}^{\text{priority}} = \frac{40 + 40.5}{2} = 40.25$$ + +Idineklara ng sukatan na ang SPT ay halos **dalawang beses na mas magaling** — sa kabila ng pagkumpleto ng isang kosmetikong ayos habang nag-aalab ang pagbagsak ng server. + +Sa pangkalahatan, kapag ang $q_i$ ay estadistikong independyente sa $p_i$, ang pagkakaayos ng SPT ay may **zero na korelasyon** sa priyoridad. Sa praktika, ang mga Kritikal na gawain (mga pagbagsak, mga insidenteng panseguridad, pagkawala ng datos) ay madalas na nangangailangan ng mas maraming trabaho kaysa sa mga Mababang gawain, kaya ang sukatan ay malamang na **anti-correlated** sa sistema ng priyoridad. $\blacksquare$ + +### 5.3 Pagkasira ng Impormasyon + +Pinapaliit ng hindi tinimbangang karaniwang halaga ang isang tatlong-dimensyon na gawain $(p_i, q_i, C_i)$ sa isang isang-dimensyon na senyal ($C_i$), pagkatapos ay nagkakaraniwang halaga nang pare-pareho. Itinatakwil nito ang priyoridad nang buo at implisitong binabaliktad ang laki. + +**Teorema 9 (Pagkasira ng Impormasyon).** Hayaang $I(\sigma)$ ang mutual information sa pagitan ng implisitong ranggo ng priyoridad ng iskedyul (posisyon) at ang aktwal na pagtatalaga ng priyoridad $q_i$. Para sa SPT: + +$$I(\sigma_{\text{SPT}}) = 0 \quad \text{kapag } p_i \perp q_i$$ + +**Patunay.** Nagtatalaga ang SPT ng mga posisyon batay lamang sa $p_i$. Kapag ang $p_i$ at $q_i$ ay independyente, ang pag-alam sa posisyon ng isang gawain sa iskedyul ng SPT ay nagbibigay ng zero na impormasyon tungkol sa priyoridad nito. $\blacksquare$ + +**Korolari 9.1.** Ang isang koponang nag-o-optimize ng hindi tinimbangang karaniwang oras ng pagkumpleto ay nagpapatakbo ng isang sistema ng pag-iiskedyul na walang dalang impormasyon tungkol sa sarili nitong klasipikasyon ng priyoridad. Ang field ng priyoridad sa kanilang ticketing system ay, kaugnay ng pagkakasunod-sunod ng pagpapatupad, pang-dekorasyon lamang. + +Ito ay isang halimbawa ng tinatawag ni Austin [18] na pundamental na problema ng hindi kumpletong pagsukat: kapag ang sistema ng pagsukat ay kumukuha lamang ng isang subset ng mga kaugnay na dimensyon, ang pag-o-optimize ng pagsukat ay sistematikong nagpapasama sa mga hindi sinusukat na dimensyon. + +### 5.4 Gastos ng Pagkaantala na Tinimbang ayon sa Priyoridad + +Tukuyin ang **gastos ng pagkaantala na tinimbang ayon sa priyoridad** ng isang iskedyul: + +$$D(\sigma) = \sum_{i=1}^{n} w(q_i) \cdot C_i$$ + +**Teorema 10 (SPT at Gastos ng Pagkaantala na Tinimbang ayon sa Priyoridad).** Ang optimal na iskedyul para sa pagpapaliit ng $D(\sigma)$ ay WSJF (Weighted Shortest Job First — Tinimbangang Pinakamaikling Trabaho Muna): ayusin ayon sa $w(q_i)/p_i$ pababa [1, 5]. Ang pagkakaayos ng SPT — ayon sa $1/p_i$ pababa — ay ganap na hindi pinapansin ang priyoridad at nagbubunga ng mas mataas na $D$ kaysa sa mga alternatibong gumagalang sa priyoridad kapag ang priyoridad ay may korelasyon sa laki ng gawain. + +**Patunay.** Sa pamamagitan ng argumento ng pagpapalitan, ang pagpapalit ng magkatabing gawain $i, j$ ay nagbabago ng $D$ ng: + +$$\Delta D = w(q_j) \cdot p_i - w(q_i) \cdot p_j$$ + +Pinapabuti ng pagpapalit ang $D$ kapag $w(q_j)/p_j > w(q_i)/p_i$ ngunit ang $j$ ay naka-iskedyul pagkatapos ng $i$. Samakatuwid, ang optimal na pagkakasunod-sunod ay pababang $w(q_i)/p_i$ — ang panuntunan ng WSJF. Ang SPT ay tumutugon sa WSJF lamang kapag $w(q_i) = \text{const}$ (lahat ng gawain ay may pantay na priyoridad). + +**Halimbawa.** Kritikal ($w = 8$, $p = 3$) at Mababa ($w = 1$, $p = 2$): + +- SPT (Mababa muna): $D = 1 \cdot 2 + 8 \cdot 5 = 42$ +- WSJF (Kritikal muna): $D = 8 \cdot 3 + 1 \cdot 5 = 29$ + +Nagdudulot ang SPT ng 45% na mas maraming pagkaantala na tinimbang ayon sa priyoridad. Sa praktika, ang mga Kritikal na gawain ay malamang na mas malaki (mga pagbagsak, mga insidenteng panseguridad), kaya ang pagkakaiba ay sistematiko. $\blacksquare$ + +--- + +## 6. Mga Iminungkahing Solusyon + +### 6.1 Mga Sukatan na Tinimbang ayon sa Priyoridad + +Palitan ang hindi tinimbangang karaniwang oras ng pagkumpleto ng **Priority-Weighted Completion Score (PWCS — Iskoring Pagkumpleto na Tinimbang ayon sa Priyoridad)**: + +$$\text{PWCS}(\sigma) = \frac{\sum_{i=1}^{n} w(q_i) \cdot \frac{C_i}{p_i}}{\sum_{i=1}^{n} w(q_i)}$$ + +Ito ang karaniwang ratio ng pagbagal na tinimbang ayon sa priyoridad. Sinusukat nito kung gaano katagal naghintay ang bawat gawain kaugnay ng laki nito, na tinimbang ayon sa kung gaano kahalaga ang gawaing iyon. Mas mababa ay mas magaling. + +**Mga Katangian:** + +1. **Gumagalang sa priyoridad.** Ang mga pagkaantala sa mga Kritikal na gawain ay nagkakahalaga ng 8x na mas marami kaysa sa mga pagkaantala sa mga Mababang gawain. +2. **Patas sa laki.** Gumagamit ng ratio ng pagbagal $C_i / p_i$, kaya ang malalaking gawain ay hindi pinaparusahan sa pagiging malaki. +3. **Hindi maaaring manipulahin ng SPT.** Ang muling pagkakaayos ayon sa oras ng pagproseso ay hindi sistematikong nagpapabuti ng iskor. +4. **Nagiging hindi tinimbang na karaniwang halaga kapag ang mga gawain ay magkakapareho.** Isang mahigpit na pangkalahatang kaso. + +### 6.2 Optimal na Patakaran: WSJF + +**Teorema 11.** Ang iskedyul na nagpapaliit sa oras ng pagkumpleto na tinimbang ayon sa priyoridad $\text{PWCT}(\sigma) = \sum w(q_i) \cdot C_i / \sum w(q_i)$ ay nagpoproseso ng mga gawain sa pagkakasunod-sunod ng pababang $w(q_i)/p_i$ — ang panuntunan ng **WSJF (Weighted Shortest Job First — Tinimbangang Pinakamaikling Trabaho Muna)** [1, 5]. + +**Patunay.** Sa pamamagitan ng argumento ng pagpapalitan (tulad ng sa Teorema 10), ang pagpapalit ng magkatabing gawain $i, j$ ay nagpapabuti ng PWCT kapag $w(q_j)/p_j > w(q_i)/p_i$ ngunit ang $j$ ay naka-iskedyul pagkatapos ng $i$. Ang optimal na pagkakasunod-sunod ay samakatuwid pababang $w(q_i)/p_i$. $\blacksquare$ + +Sa loob ng isang klase ng priyoridad, ito ay nagiging SPT (pinakamaikli muna). Sa pagitan ng mga klase, ang isang Kritikal na 4-oras na gawain ($w/p = 2.0$) ay mas mataas kaysa sa isang Mababang 1-oras na gawain ($w/p = 1.0$). + +**Praktikal na paalala.** Ang purong WSJF ay maaaring maglagay ng maliliit na gawaing may Mababang priyoridad bago ang malalaking Kritikal na gawain (isang 15-minutong Mababang gawain ay may $w/p = 1/0.25 = 4.0$, na tumatalò sa isang 6-oras na Kritikal na gawain sa $w/p = 8/6 = 1.33$). Sa praktika, nababawasan ito sa pamamagitan ng pagpapatupad ng **mahigpit na pagkakaayos ayon sa klase ng priyoridad** at paglalapat ng WSJF lamang *sa loob* ng bawat klase. + +### 6.3 Inilapat na Halimbawa: IT Service Desk + +Isaalang-alang ang isang koponan ng IT na may sumusunod na pila ng tiket: + +| Tiket | Priyoridad | Uri | Tinantiyang Oras | +|--------|----------|------|-----------| +| T1 | P1 (Kritikal) | Bumagsak ang email server | 6 | +| T2 | P2 (Mataas) | Hindi gumagana ang VPN para sa remote na koponan | 4 | +| T3 | P3 (Katamtaman) | Pag-setup ng laptop ng bagong empleyado | 2 | +| T4 | P4 (Mababa) | I-update ang patakaran sa wallpaper ng desktop | 0.5 | +| T5 | P3 (Katamtaman) | I-install ang lisensya ng software | 1 | +| T6 | P1 (Kritikal) | Hindi gumagana ang pag-backup ng database | 3 | +| T7 | P2 (Mataas) | Offline ang fleet ng printer | 2 | +| T8 | P4 (Mababa) | I-archive ang lumang shared drive folder | 0.25 | + +**Pagkakasunod-sunod ng SPT** (nag-o-optimize ng hindi tinimbangang karaniwang halaga): T8, T4, T5, T3, T7, T6, T2, T1 + +| Pos | Tiket | Priyoridad | Oras | Pagkumpleto | Pagbagal | +|-----|--------|----------|-------|------------|----------| +| 1 | T8 (i-archive ang folder) | P4 Mababa | 0.25 | 0.25 | 1.0 | +| 2 | T4 (wallpaper) | P4 Mababa | 0.5 | 0.75 | 1.5 | +| 3 | T5 (software) | P3 Katam. | 1 | 1.75 | 1.75 | +| 4 | T3 (laptop) | P3 Katam. | 2 | 3.75 | 1.875 | +| 5 | T7 (mga printer) | P2 Mataas | 2 | 5.75 | 2.875 | +| 6 | T6 (mga backup) | P1 Krit. | 3 | 8.75 | 2.917 | +| 7 | T2 (VPN) | P2 Mataas | 4 | 12.75 | 3.188 | +| 8 | T1 (email) | P1 Krit. | 6 | 18.75 | 3.125 | + +**Praktikal na WSJF** (klase ng priyoridad muna, SPT sa loob ng klase): + +| Pos | Tiket | Priyoridad | Oras | Pagkumpleto | +|-----|--------|----------|-------|------------| +| 1 | T6 (mga backup) | P1 Krit. | 3 | 3 | +| 2 | T1 (email) | P1 Krit. | 6 | 9 | +| 3 | T7 (mga printer) | P2 Mataas | 2 | 11 | +| 4 | T2 (VPN) | P2 Mataas | 4 | 15 | +| 5 | T5 (software) | P3 Katam. | 1 | 16 | +| 6 | T3 (laptop) | P3 Katam. | 2 | 18 | +| 7 | T8 (i-archive) | P4 Mababa | 0.25 | 18.25 | +| 8 | T4 (wallpaper) | P4 Mababa | 0.5 | 18.75 | + +**Paghahambing:** + +| Sukatan | SPT | Praktikal na WSJF | Panalo | +|--------|-----|----------------|--------| +| Hindi tinimbangang karaniwang pagkumpleto | **6.56 oras** | 13.63 oras | SPT | +| Karaniwang oras ng paglutas ng P1 | 13.75 oras | **6 oras** | WSJF | +| Karaniwang oras ng paglutas ng P2 | 9.25 oras | **13 oras** | SPT | +| Oras upang ayusin ang email server | 18.75 oras | **9 oras** | WSJF | +| Oras upang ayusin ang mga backup ng database | 8.75 oras | **3 oras** | WSJF | +| Oras upang i-update ang wallpaper | **0.75 oras** | 18.75 oras | SPT | + +Ang pinagsama-samang oras ng pagkumpleto na tinimbang ayon sa priyoridad ay halos magkapareho (PWCT: 10.2 vs 10.17) dahil itinatago ng pinagsasama-samang pagkuha ang pinsalang distribusyonal. Ang tunay na pagkakaiba ay nasa **bawat klase ng priyoridad** na detalye: ang email server ay hindi gumagana nang 18.75 oras sa ilalim ng SPT kumpara sa 9 oras sa ilalim ng WSJF. Ang mga backup ng database ay nabigo nang 8.75 oras kumpara sa 3. + +Ang hindi tinimbangang sukatan ay matiyagang nag-uulat na ang SPT ay **higit sa dalawang beses na mas mahusay** (6.56 vs 13.63), na ginagantimpalaan ang koponang nag-update ng wallpaper ng desktop habang nasusunog ang email server. + +### 6.4 Inirerekomendang Hanay ng mga Sukatan + +Kahit ang mga pinagsama-samang sukatan na tinimbang ayon sa priyoridad ay maaaring mabigo sa pagkilala ng mabuti mula sa masamang iskedyul, dahil itinatago ng pinagsasama-samang pagkuha ang pinsalang distribusyonal. Walang iisang sukatan ang sapat. Ang isang kumpletong sistema ng pagsukat ay dapat sumubaybay ng: + +| Sukatan | Ano ang sinusukat | Formula | +|--------|-----------------|---------| +| **Karaniwang pagkumpleto ayon sa klase ng priyoridad** | Pagtugon bawat klase | $\bar{C}$ na sinala ayon sa $q$ | +| **Karaniwang oras ng paglutas ng P1** | Tugon sa kritikal na insidente | $\bar{C}$ para sa $q = 1$ | +| **Throughput** | Hilaw na kapasidad ng trabaho | Mga oras ng trabahong natapos / oras sa kalendaryo | +| **Mga paglabag sa pagtanda** | Pag-iwas sa pagkagutom | Mga gawaing lumampas sa SLA ayon sa priyoridad | +| **Pinakamataas na oras ng pagkumpleto (P1/P2)** | Pinakamasamang tugon sa kritikal | $\max(C_i)$ para sa $q \le 2$ | + +Ang pangunahing aral: ang mga **sukatan bawat klase ng priyoridad** ay naglalantad ng mga kabiguan sa pag-iiskedyul na itinatago ng pinagsama-samang mga sukatan. + +--- + +# Bahagi III: Mga Dinamika ng Organisasyon + +## 7. Kapag ang Sukatan ang Produkto + +Ipinapalagay ng mga Seksyon 2–6 na ang kasiyahan ng kliyente ay isang function ng *naranasang kalidad ng serbisyo*. Ngunit may umiiral na sitwasyon kung saan nabibigo ang palagay na ito at bumabagsak ang buong argumento. + +### 7.1 Ang Self-Referential na Sukatan + +Ipagpalagay na ang nagbibigay ng serbisyo ay direktang nag-uulat ng hindi tinimbangang karaniwang halaga sa kliyente — sa isang dashboard, sa isang ulat ng SLA, sa isang pahina ng marketing — at ang kasiyahan ng kliyente ay pangunahing nagmumula sa *numerong iyon*: + +$$U_{\text{client}} = f\!\left(\bar{C}(\sigma)\right), \quad f' < 0$$ + +Sa ilalim ng modelong ito, tunay na pinalalaki ng SPT ang kasiyahan ng kliyente (Teorema 1). Hindi nagbabago ang throughput (Teorema 6). Nagpapabuti ang resulta ng negosyo: parehong dami ng trabaho, mas masayang kliyente. + +**Ang bawat teorema sa papel na ito ay nananatiling matematikal na tama. Ngunit nagbabaligtad ang konklusyon.** Ang sukatan ay hindi na isang proxy na maaaring manipulahin — ito na *ang* kalidad ng serbisyo, dahil sumang-ayon ang kliyente na suriin ang kalidad sa pamamagitan ng pinagsama-samang numero. + +### 7.2 Ang Ekonomiya + +Lumilikha ito ng isang magkakaugnay, matatag na ekwilibriyo: + +| Aktor | Pag-uugali | Resulta | +|-------|----------|---------| +| Nagbibigay ng serbisyo | Nag-o-optimize ng hindi tinimbangang karaniwang halaga (SPT) | Nagpapabuti ang sukatan, walang dagdag na trabaho | +| Kliyente | Nagbabasa ng dashboard, nakikitang mababa ang karaniwang halaga | Nag-uulat ng kasiyahan | +| Pamamahala | Nakikitang masaya ang kliyente + maganda ang sukatan | Ginagantimpalaan ang koponan | + +Ang nagbibigay ng serbisyo ay kumukuha ng kasiyahan sa zero na marginal na gastos, sa pamamagitan ng pag-o-optimize ng isang numero na tinanggap ng kliyente bilang proxy para sa kalidad. + +### 7.3 Ang Karupukan + +Ang ekwilibriyong ito ay matatag lamang hangga't hindi sinisiyasat ng kliyente ang sarili nilang karanasan. Nasisira ito kapag: + +1. **Sinuri ng kliyente ang sarili nilang tiket.** Ang isang CTO na ang email server ay hindi gumagana nang 18.75 oras ay hindi maaaliw ng "Karaniwang oras ng paglutas: 6.56 oras." Ang mga kliyenteng pinakamalamang na magsisiyasat ay eksaktong ang mga tumatanggap ng pinakamasamang serbisyo (Teorema 4). + +2. **Nag-aalok ang isang kakompetensiya ng SLA bawat tiket.** Ang "P1 na nalutas sa loob ng 4 na oras" ay tumatalo sa "karaniwang paglutas na mas mababa sa 7 oras" para sa anumang kliyenteng may kritikal na pangangailangan. + +3. **Isinasapuso ng koponan ang sukatan.** Kung naniniwala ang koponan na ang sukatan ay sumasalamin sa tunay na pagganap, nawawala ang kanilang kakayahang kilalanin kung kailan napapabayaan ang kritikal na trabaho. Ang sukatan ay nagiging isang panganib sa kaalaman. + +### 7.4 Ang Pangkalahatang Patern + +Ang patern na ito — pinapalitan ng proxy ang kalidad, ino-optimize ang proxy, lumalayo ang kalidad, matatag ang sistema hanggang sa masuri ng realidad — ay paulit-ulit sa iba't ibang larangan. Komprehensibong idinokumento ito ni Muller [19] bilang "metric fixation" (pagkahilig sa sukatan); pormal na isinaayos ni Campbell [24] ang nakasisirang epekto ng paggamit ng mga tagapagpahiwatig bilang mga target. + +| Larangan | Proxy na sukatan | Tunay na kalidad | Pagkakaiba | +|--------|-------------|-------------------|------------| +| Suporta sa IT | Kar. oras ng paglutas | Uptime ng kritikal na sistema | Server na bumagsak nang 19 oras, sinasabi ng kar. na 6.5 | +| Edukasyon | Mga iskor sa pagsusulit | Aktwal na pagkatuto | Pagtuturo para sa pagsusulit | +| Pangangalagang Pangkalusugan | Throughput ng pasyente | Mga resulta ng pasyente | Mas mabilis na paglabas, mas mataas na muling pagpasok | +| Pananalapi | Kita bawat quarter | Pangmatagalang halaga | Pagbabawas ng gastos na nagpapataas ng EPS, sumisira ng kakayahan | +| Software | Velocity (story points) | Kalidad ng produkto | Paglobo ng puntos, mga feature na kalahating tapos | + +### 7.5 Asimetriyang Impormasyon + +Imodelo ang sistema bilang isang laro sa pagitan ng nagbibigay ng serbisyo (P) at kliyente (C). Nakikita ni P ang mga indibidwal na $\{C_i\}$ at pumipili ng $\sigma$; nakikita lamang ni C ang $\bar{C}(\sigma)$. Ito ay isang problemang **moral hazard** (panganib sa moralidad) [10]: ang optimal na estratehiya ni P ay paliitin ang nakikitang senyal anuman ang hindi nakikitang distribusyon. + +Ang ekwilibriyo ay isang **pooling equilibrium** (pinagsama-samang ekwilibriyo) [9]: ang iniulat na sukatan ni P ay magkapareho ang hitsura anuman ang pinagbabatayang pagganap na tinimbang ayon sa priyoridad. Ito ay matatag hanggang makakuha si C ng access sa mga indibidwal na halaga ng $C_i$ — sa pamamagitan ng isang portal ng kliyente, ng transparensiya ng kakompetensiya, o ng isang sapat na masakit na insidente. + +### 7.6 Ang Hindi Komportableng Konklusyon + +Ang tapat na sagot sa "napipinsala ba ng pag-o-optimize ng hindi tinimbangang karaniwang halaga ang negosyo?" ay: **hindi kinakailangan, hangga't hindi tumingin ang kliyente sa likod ng numero**. Ang tapat na sagot sa "napapanatili ba ito?" ay: ito ay eksaktong kasing-panatili ng anumang sistema kung saan mas maraming alam ang nagbebenta kaysa sa bumibili — matatag sa mahabang panahon, pagkatapos ay mabilis na pagbagsak kapag nabutas ang asimetriya. + +--- + +## 8. Ang Sikolohikal na Halaga ng Kaalaman + +Iminodelo ng Seksyon 7 ang nagbibigay ng serbisyo bilang isang nag-iisang aktor. Ngunit ang mga koponan ay binubuo ng mga indibidwal. Kapag naunawaan ng isang miyembro ng koponan ang patunay — kapag *alam* nila na ang sukatan ay artipisyal, na ang dashboard ay pagtatanghal, na ang email server ay hindi pa rin gumagana habang nagsasara sila ng mga tiket ng wallpaper — lumilitaw ang isang bagong gastos na hindi kasama sa modelo ng ekwilibriyo. + +### 8.1 Ang Nakatagong Variable: Kamalayan ng Koponan + +| Aktor | Nakikita ang indibidwal na $C_i$ | Nakikita ang $\bar{C}$ | Nauunawaan ang patunay | +|-------|--------------------------|--------------------|-----------------------| +| Pamamahala | Posible | Oo | Iba-iba | +| Miyembro ng koponan | **Oo** | Oo | **Oo** (sa senaryong ito) | +| Kliyente | Hindi | Oo | Hindi | + +Ang miyembro ng koponan ay may buong impormasyon. Nakikita nila ang pila ng tiket. Alam nila na ang email server ay bumagsak mula pa kaninang 7 AM. Alam nilang nagsasara sila ng tiket ng wallpaper dahil pinapabuti nito ang numero. At alam nila *kung bakit*. + +### 8.2 Dissonansyang Kognitibo sa Ilalim ng Buong Impormasyon + +Ang dissonansyang kognitibo [11] ay lumilitaw kapag ang isang indibidwal ay nagtataglay ng magkasalungat na mga kaisipan. Nang walang pag-unawa sa *kung bakit*, ang kontradiksyon ay maaaring rasyunalisahin: "mas alam ng pamamahala." Ang pag-unawa sa patunay ay nag-aalis ng kalabuan. Ang miyembro ng koponan ngayon ay nagtataglay ng: + +- **Kaisipan A:** "Isa akong may kakayahang propesyonal. Ang trabaho ko ay lutasin ang mahahalagang problema." +- **Kaisipan B:** "Nagsasara ako ng tiket ng wallpaper habang bumagsak ang email server, dahil ang sukatan ay matematikal na may pagkiling (Teorema 1), ang muling pagkakaayos ay nagbubunga ng zero na throughput (Teorema 6), at ang tanging nakikinabang ay ang dashboard (Seksyon 7). Kaya ko itong patunayan." + +Ang dissonansya ngayon ay *kritikal na bumabata ng bigat*. Ang mga magagamit na resolusyon — iwanan ang propesyonal na pagkakakilanlan, tanggihan ang patunay, itaguyod ang pagbabago, o umalis — bawat isa ay nagpapataw ng mga gastos na hindi umiiral noon. + +### 8.3 Teorya ng Sariling Pagpapasya: Tatlong Pangangailangan na Nilabag + +Tinukoy ng Teorya ng Sariling Pagpapasya (Self-Determination Theory) nina Deci at Ryan [12, 13] ang tatlong pangangailangan na humuhula ng likas na motibasyon: + +**Awtonomiya.** Pinapigilan ng sukatan ang mga pagpili sa paraang alam ng miyembro ng koponan na matematikal na suboptimal. Ang isang manggagawa na nauunawaan na ang proseso ay napatunayang kontra-produktibo ay hindi makakaramdam ng awtonomiya sa pagsunod dito. + +**Kakayahan.** Ginagantimpalaan ng sukatan ang *litaw* na pagiging epektibo (mababang $\bar{C}$) habang hindi nagbabago sa *aktwal* na pagiging epektibo (Teorema 6). Ang tunay na kakayahan — ang pag-aayos ng email server muna — ay *pinaparusahan* ng sukatan. + +**Pagkakaugnay.** Alam ng miyembro ng koponan na bumagsak ang email server ng kliyente. Maaari silang tumulong. Sa halip, nag-a-update sila ng wallpaper — hindi dahil nakakatulong ito sa sinuman, kundi dahil nakakatulong ito sa isang numero. Ang koneksyon sa pagitan ng trabaho at epekto sa tao ay naputol, at nakikita ng miyembro ng koponan ang mga pinutol na dulo. + +### 8.4 Pinsalang Moral + +Ang pinsalang moral (moral injury) [16, 17] ay ang pangmatagalang pinsalang dulot ng "paggawa, pagkabigong maiwasan, pagiging saksi, o pag-alam ng mga gawang sumasalungat sa malalim na pinaniniwalaan" [17]. Ito ay pinalawak na sa mga kapaligiran ng negosyo [25]. Ang pangunahing pagkakaiba mula sa burnout: **ang burnout ay pagkahapo mula sa labis na paggawa. Ang pinsalang moral ay pinsala mula sa paggawa ng maling bagay.** + +Ang isang miyembro ng koponan na alam na bumagsak ang email server, alam na dapat nilang ayusin ito, nagsasara ng tiket ng wallpaper sa halip, at ginagawa ito dahil hinihiling ng sukatan, ay nakakaranas ng mga istrukturang kondisyon para sa pinsalang moral. + +### 8.5 Natutunan na Kawalan ng Kakayahan at Patalismo sa Sukatan + +Inilalarawan ng natutunan na kawalan ng kakayahan (learned helplessness) ni Seligman [14, 15] kung paano ang pagkakalantad sa mga hindi makokontrol na negatibong resulta ay humahantong sa pagiging pasibo. Ang pagkakasunod-sunod: + +1. May depekto ang sukatan (naunawaan ang patunay). +2. Itaguyod ang pagbabago. +3. Tinanggihan ("maganda ang mga numero, huwag gambalain ang katahimikan"). +4. Ulitin na may bumababang paniniwala. +5. Huling kalagayan: "Ang sukatan ay kung ano ito. Magsasara na lang ako ng mga tiket." + +Hindi ito katamaran. Ito ang makatwirang tugon sa isang sistema na nagpaparusa sa tamang pag-uugali at ginagantimpalaan ang maling pag-uugali, kapag ang indibidwal ay walang kapangyarihang baguhin ang sistema. + +### 8.6 Ang Kalaban na Spiral ng Pagpili + +Pinagsasama ang ekwilibriyo ng Seksyon 7 sa dinamika ng paglipat ng empleyado: + +1. Inaangkop ng organisasyon ang hindi tinimbangang karaniwang halaga. Maganda ang hitsura ng sukatan (SPT). +2. Nakakaranas ng sikolohikal na gastos ang mga mulat at may kakayahang miyembro ng koponan (8.2–8.5). +3. Umalis ang mga miyembrong iyon. Pinapalitan ng mga miyembrong hindi nauunawaan ang mga depekto ng sukatan o walang pakialam. +4. Patuloy na maganda ang hitsura ng sukatan — lagi itong ganoon sa ilalim ng SPT, anuman ang kakayahan ng koponan (Korolari 6.1). +5. Bumababa ang aktwal na kalidad ng serbisyo, ngunit hindi ito matukoy ng sukatan (Korolari 9.1). +6. Bumalik sa hakbang 1. + +Ang sukatan ay pumipili *laban* sa mga taong magpapabuti ng sistema at *pabor* sa mga taong hindi ito hahamon. Ang sistema ay nagtatatatag sa isang mas mababang antas ng kakayahan, na hindi nakikita ng sarili nitong sistema ng pagsukat. + +### 8.7 Ang Kumpletong Modelo ng Gastos + +| Seksyon 7 (nakikita) | Seksyon 8 (nakatago) | +|---------------------|---------------------| +| Masaya ang kliyente (magandang numero) | Hindi masaya ang koponan (masamang realidad) | +| Hindi nagbabago ang throughput | Iniaatras ang diskresyonaryong pagsisikap | +| Nagpapabuti ang sukatan | Umaalis ang mga may kakayahang miyembro | +| Matatag ang ekonomiya ng negosyo | Bumababa ang institusyonal na kakayahan | + +Gumagana ang mga ito sa magkakaibang oras: ang ekwilibriyo ay nakikita bawat quarter; ang pagbaba ng kakayahan ay nakikita sa loob ng mga taon. Ang kumpletong modelo ay: **gumagana ang sukatan, at ito ay mapanira, at ang pagkasira ay hindi nakikita ng sukatan.** Ang sukatan ay sariwang pintura sa kinakalawang na bakal. + +--- + +## 9. Internalisasyon ng Tagapamahala: Ang Naaaksyunang Solusyon + +Sinasabi ng mga Seksyon 2–6 na tanggihan ang sukatan. Sinasabi ng Seksyon 7 na gumagana ang sukatan (para sa negosyo). Sinasabi ng Seksyon 8 na sinisira nito ang koponan. Sa praktika, karamihan sa mga tagapamahala ay hindi maaaring mag-isang baguhin ang sukatan. Ang pinakamabuting solusyon ay reporma sa sukatan sa buong kumpanya. Ang *naaaksyunang* solusyon ay kung ano ang magagawa ng isang may kaalamang tagapamahala sa ngayon. + +### 9.1 Ang Estratehiya + +Ang isang tagapamahala na nauunawaan ang patunay ay maaaring **i-internalize ang mga limitasyon ng sukatan nang hindi ito ipinapalaganap sa koponan**: + +1. **Mag-iskedyul pangunahin ayon sa priyoridad.** Ginagawa muna ng koponan ang mga kritikal na gawain. +2. **Taktikal na mag-interleave ng maliliit na gawain.** Kapag ang isang maliit na gawaing may mababang priyoridad ay maaaring tapusin nang hindi malaking naiaantala ang gawaing may mataas na priyoridad, gawin ito. Hindi dahil hinihingi ng sukatan, kundi dahil kailangan din itong magawa at halos walang gastos. +3. **Huwag kailanman ibunyag ang sukatan bilang motibasyon.** "Tapusin muna natin itong mabilis habang hinihintay natin ang callback ng vendor para sa P1" — hindi "kailangan nating babaan ang ating karaniwang halaga." Nananatiling buo ang likas na motibasyon ng koponan (Seksyon 8). Sinasalo ng tagapamahala ang pasanin ng pamamahala ng sukatan. + +### 9.2 Pormasyon + +Ang problema ng tagapamahala ay isang constrained na optimisasyon: + +$$\min_{\sigma} \sum_{i=1}^{n} w(q_i) \cdot C_i \quad \text{na napapailalim sa} \quad \bar{C}(\sigma) \le \bar{C}_{\text{target}}$$ + +**Teorema 12 (Limitadong Gastos ng Sukatan sa Pag-iiskedyul ayon sa Priyoridad).** Ang isang tagapamahala na gumagamit ng SPT *sa loob* ng bawat klase ng priyoridad at pagkakaayos ng priyoridad *sa pagitan* ng mga klase ay magbubunga ng sukatan na malapit sa halaga na optimal para sa SPT — ang pagkakaiba ay lumilitaw lamang mula sa mga pagbabaligtad sa pagitan ng mga klase. + +**Balangkas ng patunay.** Sa loob ng bawat klase ng priyoridad, ang SPT ay libre (lahat ng gawain ay may pantay na priyoridad). Ang tanging paglihis mula sa global na SPT ay ang pagkakaayos sa pagitan ng mga klase. Ang bawat pagbabaligtad sa pagitan ng mga klase ay nagkakahalaga ng hindi hihigit sa $p_{\text{large}} - p_{\text{small}}$ sa hindi tinimbangang kabuuan, at ang mga pagbabaligtad na ito ay limitado ng bilang ng mga klase. Sa praktika, ang pagkakaiba ay karaniwang nasa loob ng 10–20% ng optimal ng SPT. $\blacksquare$ + +### 9.3 Ang Tagapamahala bilang Harang sa Impormasyon + +| Antas | Nakikita ang sukatan | Nakikita ang mga priyoridad | Nakikita ang patunay | +|-------|-----------|----------------|------------| +| Organisasyon | Oo | Sa pangalan | Hindi | +| Tagapamahala | Oo | Oo | **Oo** | +| Koponan | Hindi (pinoprotektahan) | Oo | Hindi kaugnay | +| Kliyente | Oo (dashboard) | Sa pamamagitan ng SLA | Hindi | + +Ang tagapamahala ang tanging aktor na nagtataglay ng lahat ng tatlong piraso ng impormasyon. Hindi ito manipulasyon — ginagawa nila ang tamang trabaho sa tamang pagkakasunod-sunod, at ang sukatan ay katanggap-tanggap dahil ang SPT sa loob ng klase ay libre. + +### 9.4 Ang Pagkasira sa Kompetisyon + +Nabibigo ang estratehiyang ito kapag ang sukatan ay nagiging **kompetitibo sa pagitan ng mga koponan**. + +**Kaso 1: Kooperatibo** — Sinusukat ang mga koponan para sa pagkakapareho, hindi sa ranggo. Ang bawat tagapamahala ay hiwalay na gumagamit ng estratehiya ng internalisasyon. Ang sukatan ay pang-dekorasyon ngunit hindi nakakapinsala. Ito ay isang **coordination game** (laro ng koordinasyon) na may matatag na kooperatibong ekwilibriyo. + +**Kaso 2: Kompetitibo** — Niranggo ang mga koponan ayon sa $\bar{C}$. Ito ay isang **prisoner's dilemma** (dilemma ng bilanggo): + +| | Koponan B: Priyoridad muna | Koponan B: SPT | +|---|---|---| +| **Koponan A: Priyoridad muna** | (Mabuting trabaho, Mabuting trabaho) | (Masama ang hitsura ng A, Maganda ang hitsura ng B) | +| **Koponan A: SPT** | (Maganda ang hitsura ng A, Masama ang hitsura ng B) | (Parehong maganda ang hitsura, parehong maling trabaho) | + +Ang Nash equilibrium ay (SPT, SPT). Ang estratehiya ng internalisasyon ay isang kooperatibong ekwilibriyo na **hindi matatag sa ilalim ng kompetisyon**. + +### 9.5 Saklaw + +| Kondisyon | Viabilidad | +|-----------|-----------| +| Sukatan na ginagamit para sa health-check / pagkakapareho | **Viable** | +| Nakikita ang sukatan ngunit hindi niranggo | **Viable** | +| Sukatan na niranggo sa pagitan ng mga koponan | **Marupok** — kailangan ng kooperasyon ng lahat ng tagapamahala | +| Sukatan na nakatali sa kompensasyon / mga mapagkukunan | **Hindi viable** — nangingibabaw ang prisoner's dilemma | +| Posible ang reporma ng sukatan sa antas ng organisasyon | **Hindi kailangan** — ayusin ang sukatan sa halip | + +**Ang pinakamabuting solusyon ay para sa buong kumpanya. Ang naaaksyunang solusyon ay isang tagapamahala na nauunawaan ang patunayang ito, pinoprotektahan ang kanilang koponan mula sa sukatan, nag-iiskedyul ayon sa priyoridad, at gumagamit lamang ng SPT sa loob ng mga klase ng priyoridad upang mapanatiling makatwiran ang numero.** + +--- + +# Bahagi IV: Pagsusuri + +## 10. Adbokado ng Diyablo + +Nangangailangan ang intelektwal na katapatan ng pagkilala kung saan may mga limitasyon ang argumento. + +### 10.1 May Tunay na Halaga ang Kasimplihan + +**Argumento.** Ang hindi tinimbangang karaniwang halaga ay hindi nangangailangan ng mga timbang ng priyoridad, mga tantiya ng laki ng gawain, o kalibrasyong anuman. + +**Pagsusuri: Totoo.** Ngunit ang hindi tinimbangang sukatan ay hindi umiiwas sa mga pagpapalagay — *itinatago* nito ang mga ito sa pamamagitan ng implisitong pagtatakda ng lahat ng timbang sa 1 at lahat ng laki sa 1. Ang isang alam-na-hindi-tumpak na tantiya ng laki ng gawain ay mas nagbibigay-kaalaman pa rin kaysa sa implisitong pagpapalagay na magkapareho ang lahat ng laki. + +### 10.2 Pagpapaliit ng Bilang ng mga Taong Naghihintay + +**Argumento.** Pinapaliit ng SPT ang kabuuang oras-ng-tao na ginugol sa paghihintay. Kung ang bawat gawain ay kumakatawan sa isang kliyente, ito ay optimal. + +**Pagsusuri: Matematikal na tama.** Kung nagpapatakbo ka ng DMV at ang oras ng bawat tao ay pantay na mahalaga, ang SPT ang tamang patakaran. Nabibigo ito kapag ang mga gawain ay hindi 1:1 sa mga kliyente, ang gastos ng paghihintay ay hindi pare-pareho, o ang sukatan ay ginagamit upang suriin ang mga koponan sa halip na magsilbi sa isang literal na pila. + +### 10.3 Ang SPT bilang Heuristika ng Triage + +**Argumento.** Kapag ang mga laki ng gawain ay magkakalapit na nagkukumpol, ang SPT ay halos katulad ng FIFO at ang hindi tinimbangang karaniwang halaga ay halos katulad ng tinimbangang karaniwang halaga. + +**Pagsusuri: Tama.** Ang koepisyent ng pagkakaiba-iba $CV = \sigma_p / \bar{p}$ ang tumutukoy sa kalubhaan ng pagbaluktot: + +| $CV$ | Distribusyon ng laki ng gawain | Pagbaluktot | +|------|----------------------|------------| +| < 0.3 | Masikip (call center) | Hindi gaanong kapansin-pansin | +| 0.3 – 1.0 | Katamtaman (halo-halong IT) | Katamtaman | +| > 1.0 | Malawak (tipikal na pila ng IT) | Malubha | + +Ang isang tipikal na IT desk ay sumasaklaw mula 15 minuto hanggang 40+ oras ($CV > 2$). Ang pagbaluktot ay hindi isang pambihirang kaso — ito ang default. + +### 10.4 Nangangailangan ng Masamang Intensyon ang Panloloko + +**Argumento.** Ipinapakita ng mga teorema na ang sukatan ay *maaaring* manipulahin, hindi na *manipulahin*. + +**Pagsusuri: Ito ang pinakamalakas na kontra-argumento.** Kung ang sukatan ay puro impormasyon at hindi kailanman nakaiimpluwensiya sa pag-uugali, wala ang insentibo ng panloloko. Gayunpaman, ang anumang sukatang iniulat sa pamamahala, nakatali sa mga OKR, o tinatalakay sa mga retrospective ay makaiimpluwensiya sa pag-uugali. Ito ang Batas ni Goodhart [6, 7] — at naaangkop ito sa mga koponan na may mabuting intensyon nang kasing-tiyak sa mga sinikal. Ang pagbabago ay nangyayari nang organiko: ang pagsasara ng tatlong madaling tiket ay "pakiramdam na produktibo" habang pinapatunayan ng sukatan ang damdaming iyon. + +### 10.5 Kailan Maaaring Ipagtanggol ang Hindi Tinimbangang Karaniwang Halaga + +Ang sukatan ay maipagtanggol **lamang kapag ang lahat ng apat na kondisyon ay natutugunan**: + +1. Ang mga laki ng gawain ay halos magkakapareho ($CV < 0.3$) +2. Walang pagkakaiba sa priyoridad (lahat ng gawain ay pantay na mahalaga) +3. Ang bawat gawain ay kumakatawan sa eksaktong isang kliyente +4. Ang sukatan ay hindi ginagamit upang suriin, gantimpalaan, o gabayan ang pag-uugali + +Ang mga kondisyong ito ay bihirang matugunan sa mga sistema kung saan ang sukatan ay pinakakaraniwang ginagamit. + +--- + +## 11. Kaugnay na Literatura + +Ang papel na ito ay nasa interseksyon ng ilang mga literatura na hindi pa dating naiugnay. + +### 11.1 Teorya ng Pag-iiskedyul at Katarungan + +Itinatag ni Smith [1] ang resulta ng optimalidad ng SPT at ang panuntunan ng WSJF noong 1956. Ibinigay nina Conway, Maxwell, at Miller [2] ang komprehensibong pagtalakay sa textbook. Ang katarungan ng mga patakarang batay sa laki sa pag-iiskedyul ay pinagdebatehan sa pag-iiskedyul ng mga sistema ng kompyuter: sinuri nina Bansal at Harchol-Balter [22] ang kawalan ng katarungan ng SRPT; pormal na isinaayos nina Wierman at Harchol-Balter [23] ang mga klasipikasyon ng katarungan laban sa Processor-Sharing; sinukat nina Angel, Bampis, at Pascual [21] ang kalidad ng iskedyul ng SPT laban sa mga pamantayan ng patas na optimalidad. + +Ang naunang pananaliksik na ito ay nagsusuri ng katarungan sa pag-iiskedyul ng CPU at server. Ang kasalukuyang papel ay naglalapat ng parehong matematikal na mga resulta sa *pamamahala ng gawain sa organisasyon*, kung saan ang "nag-iiskedyul" ay isang koponan ng tao, ang mga "trabaho" ay mga kahilingan ng kliyente na may mga priyoridad ng epekto sa negosyo, at ang "function ng layunin" ay isang sukatan ng pamamahala. Ang mekanismo ay magkapareho; ang mga kahihinatnan ay magkakaiba dahil ang pag-iiskedyul sa organisasyon ay may mga sistema ng priyoridad, mga relasyon sa kliyente, at mga sikolohikal na gastos na wala sa pag-iiskedyul ng CPU. + +### 11.2 Disfunksyon ng Pagsukat + +Pinatunayan ni Austin [18] na ang hindi kumpletong pagsukat — pagsukat lamang ng isang subset ng mga kaugnay na dimensyon — ay lumilikha ng mga insentibo upang i-optimize ang sinusukat na mga dimensyon sa kapinsalaan ng mga hindi sinusukat, at na ang epektong ito ay hindi lamang posible kundi *hindi maiiwasan* kapag ang pagsukat ay nakatali sa mga gantimpala. Ang kanyang pagsasaayos ng asimetriyang impormasyon ay malapit na kahanay ng Seksyon 7. Ang kasalukuyang papel ay nagbibigay ng tiyak na matematikal na mekanismo (Teorema 1–2) para sa kaso ng pag-iiskedyul ng gawain, at pinapalawak ang argumento sa pamamagitan ng sikolohiya (Seksyon 8) upang masubaybayan ang kumpletong kadena ng pinsala sa organisasyon. + +Idinokumento ni Muller [19] ang "metric fixation" (pagkahilig sa sukatan) sa edukasyon, pangangalagang pangkalusugan, pagpapatupad ng batas, at pananalapi, na nagbibigay ng malawak na empirikal na katibayan para sa mga patern na inilarawan sa Seksyon 7.4. Pormal na isinaayos ni Campbell [24] ang nakasisirang epekto ng paggamit ng mga tagapagpahiwatig bilang mga target, na kumukumpleto sa orihinal na obserbasyon ni Goodhart [6] at sa pangkalahatang pormulasyon ni Strathern [7]. + +Empirikal na idinokumento nina Bevan at Hood [26] ang mga pag-uugali ng panloloko sa sistema ng pampublikong kalusugan ng Inglatera — kabilang ang mga eksaktong patern ng "tinatamaan ang target at nami-miss ang punto" na inilarawan sa ating Seksyon 5.2. + +### 11.3 Mga Sikolohikal na Gastos ng Disfunksyon ng Sukatan + +Ang paglalapat ng pinsalang moral (Shay [16], Litz et al. [17]) sa mga kapaligiran ng negosyo ay may kamakailang precedent: isang pag-aaral noong 2024 sa *Journal of Business Ethics* [25] ang tahasang nagpalawig ng konstrukto sa mga lugar ng trabahong for-profit, na nakahanap ng mga istrukturang kondisyon na katulad ng mga inilarawan sa Seksyon 8.4. Sinuri ni Moore [27] ang moral na *pag-alis ng pakikilahok* — ang kognitibong restruktura na nagpapahintulot sa hindi etikal na pag-uugali sa ilalim ng presyon ng organisasyon. Ang kasalukuyang papel ay tumatalakay sa komplementaryong penomenon: ang pinsala sa mga indibidwal na *tumatangging* mag-alis ng pakikilahok. + +### 11.4 Ano ang Bago + +Ang mga indibidwal na bahagi — optimalidad ng SPT, Batas ni Goodhart, disfunksyon ng pagsukat, pinsalang moral — ay lahat may precedent. Ang mga ambag ng papel na ito ay: + +1. **Ang batas ng konserbasyon (Teorema 2) na ginamit nang prescriptive** — bilang isang konstruktibong argumento na ang oras ng pagkumpleto na tinimbang ayon sa trabaho ay *hindi maaaring* manipulahin, sa halip na bilang isang teoretikal na resulta ng pag-iiskedyul. + +2. **Ang tiyak na patunay na ang mga klase ng priyoridad ay ginagawang algebraikong kalaban ang sukatan** (Teorema 8–9) — hindi lamang empirikal na masama kundi istrukturang kontradiktoryo, na may zero na mutual information sa pagitan ng iskedyul at ng sistema ng priyoridad. + +3. **Ang pinagsama-samang kadena** mula sa matematikal na patunay sa pamamagitan ng asimetriyang impormasyon sa pamamagitan ng sikolohikal na pinsala sa pamamagitan ng kalaban na spiral ng pagpili — sumusubaybay ng isang solong sukatan mula kay Smith (1956) hanggang sa pagkaguho ng organisasyon. + +4. **Ang estratehiya ng internalisasyon ng tagapamahala** (Seksyon 9) na may pormal na pagsusuring game-theoretic ng katatagan nito at mga kondisyon ng pagkasira sa ilalim ng kompetisyon sa pagitan ng mga koponan. + +5. **Ang paglalapat ng teorya ng pag-iiskedyul sa kritisismo ng pamamahala ng organisasyon** — pinapatunayan na ang isang karaniwang ginagamit na sukatan ng koponan ay may mga tiyak, maaaring masukat na patolohiya sa halip na nangangatwiran mula sa anekdota o pangkalahatang prinsipyo. + +--- + +## 12. Konklusyon + +Ang hindi tinimbangang karaniwang oras ng pagkumpleto ay isang **may kinikilingang estadistika** na: + +1. **Maaaring manipulahin** ng patakaran sa pag-iiskedyul (Teorema 1), hindi tulad ng oras ng pagkumpleto na tinimbang ayon sa trabaho na hindi nagbabago sa iskedyul (Teorema 2). +2. **Nagbibigay-insentibo sa pagkagutom** ng malalaking gawain (Teorema 3). +3. **Nagpapasama sa kasiyahan ng kliyente** nang walang kapalit na pagtaas sa produktibidad (Teorema 7). +4. **Aktibong sumasalungat sa mga sistema ng priyoridad** sa pamamagitan ng walang dalang impormasyon tungkol sa klasipikasyong may epekto sa negosyo (Teorema 9). +5. **Ganap na binabalewala ang priyoridad** sa rekomendasyon nito sa pag-iiskedyul, na nagbubunga ng suboptimal na pagkaantala na tinimbang ayon sa priyoridad tuwing ang priyoridad at laki ay hindi ganap na inversely correlated (Teorema 10). + +Ang isang sukatan na maaaring pagbutihin sa pamamagitan ng muling pagkakaayos ng trabaho — nang hindi gumagawa ng anumang karagdagang trabaho — ay sumusukat sa patakaran ng pag-iiskedyul, hindi sa kapasidad ng sistema. Kapag isinama sa isang sistema ng priyoridad, inirerekomenda nito ang iskedyul na nagdudulot ng pinakamaraming pinsala sa gawaing may pinakamataas na priyoridad. + +Kapag ang sukatan ay iniulat sa mga kliyente, lumilikha ito ng isang asimetriyang impormasyon (Seksyon 7) na ang ekwilibriyo ng negosyo ay kumikita ngunit marupok. Kapag nauunawaan ng mga miyembro ng koponan ang mga depekto nito, nilalabag nito ang kanilang likas na motibasyon at pumipili para sa pag-alis ng pinakamarunong na mga tao (Seksyon 8). Ang isang may kaalamang tagapamahala ay maaaring bahagyang magpagaan ng mga epektong ito sa pamamagitan ng constrained na optimisasyon (Seksyon 9), ngunit ang kooperatibong estratehiyang ito ay hindi matatag sa ilalim ng kompetisyon sa pagitan ng mga koponan. + +Ang hindi tinimbangang karaniwang halaga ay maipagtanggol lamang sa ilalim ng makitid na mga kondisyon (Seksyon 10.5): magkakapareho na laki ng gawain, walang priyoridad, isa-sa-isang pagmamapa ng kliyente-gawain, at walang impluwensiya sa pag-uugali. Ang mga kondisyong ito ay bihirang matugunan. + +**Ang hindi tinimbangang karaniwang oras ng pagkumpleto ay hindi patas o tumpak na pagsukat ng pagganap sa pagpapatupad ng gawain. Ang pag-adopt nito bilang sukatan ng koponan ay makatwiran na magbubunga ng pagkagutom ng masalimuot na trabaho, paglabag sa mga ipinahayag na priyoridad, hindi patas na mga resulta para sa kliyente, at ang ilusyon ng produktibidad kung saan wala.** + +Ang pinakamabuting solusyon ay reporma ng sukatan sa buong organisasyon. Ang naaaksyunang solusyon ay isang tagapamahala na nauunawaan ang patunayang ito. + +--- + +## Mga Sanggunian + +### Teorya ng Pag-iiskedyul + +[1] Smith, W. E. (1956). Various optimizers for single-stage production. +*Naval Research Logistics Quarterly*, 3(1–2), 59–66. +doi:[10.1002/nav.3800030106](https://doi.org/10.1002/nav.3800030106) + +> Pinagmulan ng resulta ng optimalidad ng SPT (Teorema 1), ang panuntunan ng tinimbangang oras ng pagkumpleto $w_i/p_i$ pababa (WSJF, Teorema 11), at ang teknik ng patunay na adjacent-job pairwise interchange (argumento ng pagpapalitan) na ginamit sa buong papel. + +[2] Conway, R. W., Maxwell, W. L., & Miller, L. W. (1967). *Theory of +Scheduling*. Addison-Wesley. + +> Karaniwang pagtalakay sa textbook ng teorya ng pag-iiskedyul sa isang makina, na nagpapalawak sa mga resulta ni Smith. + +[3] Little, J. D. C. (1961). A proof for the queuing formula: L = λW. +*Operations Research*, 9(3), 383–387. +doi:[10.1287/opre.9.3.383](https://doi.org/10.1287/opre.9.3.383) + +> Unang mahigpit na patunay ng Batas ni Little. Binanggit sa Seksyon 3.2 para sa konteksto ng teorya ng pila. + +[4] Little, J. D. C. (2011). Little's Law as viewed on its 50th +anniversary. *Operations Research*, 59(3), 536–549. +doi:[10.1287/opre.1110.0941](https://doi.org/10.1287/opre.1110.0941) + +> Retrospective na tumatalakay sa saklaw, mga limitasyon, at mga karaniwang maling paglalapat. + +[5] Reinertsen, D. G. (2009). *The Principles of Product Development +Flow: Second Generation Lean Product Development*. Celeritas Publishing. +ISBN: 978-0-9844512-0-8. + +> Nagpasikat ng WSJF at "Cost of Delay / Duration" sa mga konteksto ng agile/lean. Ang matematikal na pundasyon ay si Smith (1956) [1]. + +### Pagsukat at mga Insentibo + +[6] Goodhart, C. A. E. (1984). Problems of monetary management: The U.K. +experience. In *Monetary Theory and Practice* (pp. 91–121). Macmillan. + +> Pinagmulan ng Batas ni Goodhart: "Anumang naobserbahang estadistikal na regularidad ay malamang na bumagsak kapag ginamit ito para sa kontrol." + +[7] Strathern, M. (1997). 'Improving ratings': Audit in the British +university system. *European Review*, 5(3), 305–321. +doi:[10.1002/(SICI)1234-981X(199707)5:3<305::AID-EURO184>3.0.CO;2-4](https://doi.org/10.1002/(SICI)1234-981X(199707)5:3%3C305::AID-EURO184%3E3.0.CO;2-4) + +> Pinalawak ang Batas ni Goodhart: "Kapag ang isang sukatan ay naging target, tumitigil ito sa pagiging mabuting sukatan." + +### Ekonomikang Pangkagawian + +[8] Kahneman, D., & Tversky, A. (1979). Prospect theory: An analysis of +decision under risk. *Econometrica*, 47(2), 263–292. +doi:[10.2307/1914185](https://doi.org/10.2307/1914185) + +> Itinatag ang pag-iwas sa pagkawala (loss aversion). Binanggit sa Seksyon 4.5. + +### Teorya ng Laro at Teorya ng Kontrata + +[9] Akerlof, G. A. (1970). The market for "lemons": Quality uncertainty +and the market mechanism. *The Quarterly Journal of Economics*, 84(3), +488–500. doi:[10.2307/1879431](https://doi.org/10.2307/1879431) + +> Asimetriyang impormasyon at adverse selection (pagpiling laban). Ang pooling equilibrium sa Seksyon 7.5 ay istrukturang katulad. + +[10] Hölmstrom, B. (1979). Moral hazard and observability. *The Bell +Journal of Economics*, 10(1), 74–91. +doi:[10.2307/3003320](https://doi.org/10.2307/3003320) + +> Pormal na pagtalakay sa moral hazard (panganib sa moralidad). Ang senaryo ng pag-uulat ng sukatan sa Seksyon 7.5 ay isang problemang moral hazard. + +### Sikolohiya + +[11] Festinger, L. (1957). *A Theory of Cognitive Dissonance*. Stanford +University Press. ISBN: 978-0-8047-0131-0. + +> Pundasyonal na teorya. Binanggit sa Seksyon 8.2. + +[12] Deci, E. L., & Ryan, R. M. (1985). *Intrinsic Motivation and +Self-Determination in Human Behavior*. Plenum Press. +ISBN: 978-0-306-42022-1. + +> Orihinal na pagtalakay sa Teorya ng Sariling Pagpapasya (Self-Determination Theory). Binanggit sa Seksyon 8.3. + +[13] Ryan, R. M., & Deci, E. L. (2000). Self-determination theory and +the facilitation of intrinsic motivation, social development, and +well-being. *American Psychologist*, 55(1), 68–78. +doi:[10.1037/0003-066X.55.1.68](https://doi.org/10.1037/0003-066X.55.1.68) + +> Pangkalahatang-ideya ng SDT na nag-uugnay ng kasiyahan ng pangangailangan sa likas na motibasyon at kagalingan. + +[14] Seligman, M. E. P., & Maier, S. F. (1967). Failure to escape +traumatic shock. *Journal of Experimental Psychology*, 74(1), 1–9. +doi:[10.1037/h0024514](https://doi.org/10.1037/h0024514) + +> Orihinal na demonstrasyon ng natutunan na kawalan ng kakayahan (learned helplessness). Binanggit sa Seksyon 8.5. + +[15] Seligman, M. E. P. (1975). *Helplessness: On Depression, +Development, and Death*. W. H. Freeman. ISBN: 978-0-7167-0752-3. + +> Pinalawak na pagtalakay na nag-uugnay ng natutunan na kawalan ng kakayahan sa depresyon ng tao at pag-uugali ng institusyon. + +[16] Shay, J. (1994). *Achilles in Vietnam: Combat Trauma and the Undoing +of Character*. Atheneum / Simon & Schuster. ISBN: 978-0-689-12182-3. + +> Nagpakilala ng konsepto ng pinsalang moral (moral injury). Binanggit sa Seksyon 8.4. + +[17] Litz, B. T., Stein, N., Delaney, E., Lebowitz, L., Nash, W. P., +Silva, C., & Maguen, S. (2009). Moral injury and moral repair in war +veterans: A preliminary model and intervention strategy. *Clinical +Psychology Review*, 29(8), 695–706. +doi:[10.1016/j.cpr.2009.07.003](https://doi.org/10.1016/j.cpr.2009.07.003) + +> Pormal na isinayos ang pinsalang moral bilang isang klinikal na konstrukto. Ang kahulugan ay sinipi sa Seksyon 8.4. + +### Pagsukat sa Organisasyon + +[18] Austin, R. D. (1996). *Measuring and Managing Performance in +Organizations*. Dorset House. ISBN: 978-0-932633-36-1. + +> Pinatunayan na ang hindi kumpletong pagsukat ay lumilikha ng hindi maiiwasang mga insentibo upang i-optimize ang sinusukat na mga dimensyon sa kapinsalaan ng mga hindi sinusukat. Ang pagsasaayos ng asimetriyang impormasyon ay malapit na kahanay ng Seksyon 7. Ang pinakamahalaga sa mga naunang gawa na kaugnay ng argumento ng papel na ito. + +[19] Muller, J. Z. (2018). *The Tyranny of Metrics*. Princeton University +Press. ISBN: 978-0-691-17495-2. + +> Komprehensibong pagtalakay sa "metric fixation" (pagkahilig sa sukatan) sa edukasyon, pangangalagang pangkalusugan, pagpapatupad ng batas, at pananalapi. Malawak na empirikal na katibayan para sa mga patern na inilarawan sa Seksyon 7.4. + +### Katarungan sa Pag-iiskedyul + +[20] Coffman, E. G., Shanthikumar, J. G., & Yao, D. D. (1992). +Multiclass queueing systems: Polymatroid structure and optimal scheduling +control. *Operations Research*, 40(S2), S293–S299. + +> Mga batas ng konserbasyon sa pag-iiskedyul. Ang pagkakapare-pareho ng oras ng pagkumpleto na tinimbang ayon sa trabaho sa iskedyul (Teorema 2) ay isang halimbawa ng mga batas ng konserbasyon na ito. + +[21] Angel, E., Bampis, E., & Pascual, F. (2008). How good are SPT +schedules for fair optimality criteria? *Annals of Operations Research*, +159(1), 53–64. doi:[10.1007/s10479-007-0267-0](https://doi.org/10.1007/s10479-007-0267-0) + +> Direktang sinusukat ang kalidad ng iskedyul ng SPT laban sa mga pamantayan ng katarungan. Pinakamalapit na nauna sa pagsusuri ng katarungan ng Seksyon 4 sa teorya ng pag-iiskedyul. + +[22] Bansal, N., & Harchol-Balter, M. (2001). Analysis of SRPT +scheduling: Investigating unfairness. *ACM SIGMETRICS Performance +Evaluation Review*, 29(1), 279–290. +doi:[10.1145/384268.378792](https://doi.org/10.1145/384268.378792) + +> Sinisiyasat ang paniniwala na ang SRPT ay hindi patas na nagpaparusa sa malalaking trabaho sa pag-iiskedyul ng kompyuter. Isinasaad na mas maliit kaysa sa pinaniniwalaan ang kawalan ng katarungan ngunit kinikilala ang pangunahing tensiyon. + +[23] Wierman, A., & Harchol-Balter, M. (2003). Classifying scheduling +policies with respect to unfairness in an M/GI/1. *ACM SIGMETRICS +Performance Evaluation Review*, 31(1), 238–249. + +> Pormal na isinasaayos ang mga kahulugan ng katarungan para sa mga patakaran sa pag-iiskedyul sa pamamagitan ng paghahambing sa Processor-Sharing. + +### Mga Karagdagang Sanggunian + +[24] Campbell, D. T. (1979). Assessing the impact of planned social +change. *Evaluation and Program Planning*, 2(1), 67–90. +doi:[10.1016/0149-7189(79)90048-X](https://doi.org/10.1016/0149-7189(79)90048-X) + +> Batas ni Campbell: "Habang mas ginagamit ang anumang quantitative na tagapagpahiwatig sa lipunan para sa paggawa ng desisyon, mas napapailalim ito sa mga presyon ng katiwalian at mas malamang na magbaluktot at masira ang mga prosesong panlipunan na nilalayon nitong subaybayan." Kumukumpleto sa Batas ni Goodhart [6]. + +[25] Ferreira, C. M., et al. (2024). It's business: A qualitative study +of moral injury in business settings. *Journal of Business Ethics*. +doi:[10.1007/s10551-024-05615-0](https://doi.org/10.1007/s10551-024-05615-0) + +> Nagpapalawak ng pinsalang moral sa mga lugar ng trabahong for-profit. Pinapatunayan ang paglalapat ng Seksyon 8.4 ni Shay/Litz sa labas ng mga kapaligiran ng militar at pangangalagang pangkalusugan. + +[26] Bevan, G., & Hood, C. (2006). What's measured is what matters: +Targets and gaming in the English public health care system. *Public +Administration*, 84(3), 517–538. +doi:[10.1111/j.1467-9299.2006.00600.x](https://doi.org/10.1111/j.1467-9299.2006.00600.x) + +> Empirikal na idinodokumento ang mga pag-uugali ng panloloko kabilang ang "tinatamaan ang target at nami-miss ang punto." Nagbibigay ng katibayan mula sa totoong mundo para sa kontradiksyon ng priyoridad-sukatan ng Seksyon 5.2. + +[27] Moore, C. (2012). Why employees do bad things: Moral disengagement +and unethical organizational behavior. *Personnel Psychology*, 65(1), +1–48. doi:[10.1111/j.1744-6570.2011.01237.x](https://doi.org/10.1111/j.1744-6570.2011.01237.x) + +> Sinusuri ang moral na *pag-alis ng pakikilahok* (moral disengagement) — ang kognitibong restruktura na nagpapahintulot sa hindi etikal na pag-uugali. Ang Seksyon 8 ay tumatalakay sa komplementaryong penomenon: ang pinsala sa mga indibidwal na *tumatangging* mag-alis ng pakikilahok. + +--- + +*Ang patunayang ito ay binuo sa pamamagitan ng pag-uusap at pormal na isinulat noong 2026-03-28.* diff --git a/README.zh.md b/README.zh.md new file mode 100644 index 0000000..6a598b2 --- /dev/null +++ b/README.zh.md @@ -0,0 +1,1164 @@ +# 未加权平均完成时间不是任务调度的公正指标 + +一项数学证明:未加权平均任务完成时间是一个有偏统计量, +它激励挑选简单工作的行为,且它所显示的任何调度优势 +都是指标本身的伪影——而非真实吞吐量或服务质量的反映。 + +--- + +## 1. 引言 + +许多组织通过**未加权平均完成时间**来衡量任务执行绩效:即从任务提交 +到任务解决之间的平均小时(或天)数,每个任务不论规模或优先级 +一律等权计算。 + +本文证明,该指标不仅仅是不精确的,而且是结构性有偏的。它可以 +通过重新排列工作顺序来改善,而无需做任何额外工作(定理 1), +而一个适当加权的替代指标则完全不受调度操纵的影响(定理 2)。 +当与优先级系统结合使用时,该指标会积极地与组织自身的优先级 +分类相矛盾(定理 9)。 + +论证分四个部分展开: + +- **第一部分**(第 2–4 节)建立数学基础:未加权平均可被 + 最短处理时间优先(SPT, Shortest Processing Time)调度策略所操纵, + 工作量加权平均与调度顺序无关,由此产生的服务质量后果 + 可证明是负面的。 + +- **第二部分**(第 5–6 节)将模型扩展到具有优先级分类的任务, + 证明该指标会与优先级系统产生对抗性,并提出加权替代方案, + 附带一个 IT 服务台的实例。 + +- **第三部分**(第 7–9 节)考察组织动态:当指标被报告给 + 客户时会发生什么(信息不对称),当团队成员理解其缺陷时 + 会发生什么(心理伤害),以及一位知情的管理者能做什么 + (带博弈论稳定性分析的约束优化)。 + +- **第四部分**(第 10–12 节)提出诚实的反驳意见,将本工作 + 置于现有文献中定位,并作出结论。 + +核心结果建立在 Smith(1956)的奠基性调度理论 [1] 之上, +通过博弈论 [9, 10]、组织度量理论 [18, 19] 和心理学 [11–17] +加以扩展,从而追溯出一条完整的链条:从关于某一特定指标的 +数学证明到组织层面的后果。 + +--- + +# 第一部分:数学基础 + +## 2. 定义 + +设有 **n** 个任务,其处理时间为 $p_1, p_2, \ldots, p_n$。 + +**调度方案** $\sigma$ 是 $\{1, 2, \ldots, n\}$ 的一个排列, +将任务分配到单一执行者的执行顺序上。 + +在调度方案 $\sigma$ 下,任务 $\sigma(k)$ 的**完成时间**为: + +$$C_{\sigma(k)} = \sum_{j=1}^{k} p_{\sigma(j)}$$ + +**未加权平均完成时间**为: + +$$\bar{C}(\sigma) = \frac{1}{n} \sum_{k=1}^{n} C_{\sigma(k)}$$ + +**工作量加权平均完成时间**为: + +$$\bar{C}_w(\sigma) = \frac{\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)}}{\sum_{k=1}^{n} p_{\sigma(k)}}$$ + +--- + +## 3. 核心结果 + +### 3.1 未加权平均可被操纵 + +**定理 1**(Smith, 1956 [1])**。** 使 $\bar{C}(\sigma)$ 最小化的调度方案 +是最短处理时间优先(SPT):按 $p_{\sigma(1)} \le p_{\sigma(2)} \le \cdots \le p_{\sigma(n)}$ 排序任务。 + +**证明(交换论证 [1, 2])。** + +考虑任意调度方案 $\sigma$,其中两个相邻任务 $i, j$ 满足 +$p_i > p_j$,且任务 $i$ 被安排在任务 $j$ 的紧前方。设 $t$ +为任务 $i$ 的开始时间。 + +| | 任务 $i$ 完成 | 任务 $j$ 完成 | 合计 | +|---|---|---|---| +| **交换前**($i$ 在 $j$ 前) | $t + p_i$ | $t + p_i + p_j$ | $2t + 2p_i + p_j$ | +| **交换后**($j$ 在 $i$ 前) | $t + p_j$ | $t + p_j + p_i$ | $2t + p_i + 2p_j$ | + +完成时间之和的变化为: + +$$(2p_i + p_j) - (p_i + 2p_j) = p_i - p_j > 0$$ + +每次将较长任务与其后方较短任务交换,都会严格减少完成时间 +总和。任何非 SPT 调度方案都包含这样的相邻对。反复交换收敛于 +SPT。因此 SPT 唯一地最小化 $\bar{C}(\sigma)$。$\blacksquare$ + +### 3.2 工作量加权平均与调度方案无关 + +**定理 2。** 工作量加权平均完成时间 $\bar{C}_w(\sigma)$ +对于所有调度方案 $\sigma$ 均相同。 + +**证明。** + +展开分子: + +$$\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)} = \sum_{k=1}^{n} p_{\sigma(k)} \sum_{j=1}^{k} p_{\sigma(j)}$$ + +令 $a = \sigma(k)$,$b = \sigma(j)$ 重新标号。该双重求和计算 +所有满足 $b$ 排在 $a$ 之前或与 $a$ 同位的有序对 $(a, b)$: + +$$= \sum_{\substack{a, b \\ b \preceq_\sigma a}} p_a \, p_b$$ + +对于 $a \ne b$ 的任何一对,$\{b \preceq_\sigma a\}$ 或 +$\{a \prec_\sigma b\}$ 恰好成立其一。对角项($a = b$) +无论顺序如何,贡献 $p_a^2$。因此: + +$$\sum_{\substack{a, b \\ b \preceq_\sigma a}} p_a \, p_b = \sum_{a} p_a^2 + \sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b$$ + +连同互补求和,两个非对角求和覆盖所有无序对: + +$$\sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b + \sum_{\substack{a \ne b \\ a \prec_\sigma b}} p_a \, p_b = \sum_{a \ne b} p_a \, p_b$$ + +右侧与调度方案无关。由 $p_a p_b$ 的对称性,两个非对角 +求和相等: + +$$\sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b = \frac{1}{2} \sum_{a \ne b} p_a \, p_b$$ + +因此: + +$$\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)} = \sum_a p_a^2 + \frac{1}{2} \sum_{a \ne b} p_a \, p_b = \frac{1}{2}\left(\sum_a p_a\right)^2 + \frac{1}{2}\sum_a p_a^2$$ + +该表达式不包含对 $\sigma$ 的引用。由于分母 $\sum p_a$ 同样 +与调度方案无关: + +$$\bar{C}_w(\sigma) = \frac{\frac{1}{2}\left(\sum p_a\right)^2 + \frac{1}{2}\sum p_a^2}{\sum p_a}$$ + +在**所有调度方案下均为常数**。$\blacksquare$ + +这是 Coffman、Shanthikumar 和 Yao [20] 所发现的调度守恒律 +的一个实例。该不变性对应于度量一个*工作*单元等待了多长时间, +而非一个*任务*等待了多长时间——未加权统计量计算的是完成次数 +而非工作量,这正是它可被操纵的原因。(另见 Little [3, 4] 的 +排队论背景,需注意 Little 定律仅直接适用于稳态系统,而非 +本文分析的批处理情形。) + +### 3.3 说明性示例 + +两个任务:$A$,$p_A = 1$ 小时;$B$,$p_B = 10$ 小时。 + +| 调度方案 | $C_A$ | $C_B$ | 未加权平均 | 工作量加权平均 | +|----------|-------|-------|------------|---------------| +| SPT(A 在先) | 1 | 11 | 6.0 | 111/11 ≈ 10.09 | +| 逆序(B 在先) | 11 | 10 | 10.5 | 111/11 ≈ 10.09 | + +SPT 在未加权指标上看起来好了 **4.5 小时**,但在工作量加权 +指标上**改善为零**。这种表面优势之所以存在,仅仅是因为 +未加权统计量让 1 小时的任务与 10 小时的任务拥有相同的"投票权"。 + +--- + +## 4. 对服务质量的影响 + +### 4.1 大型任务的饥饿 + +**定理 3(指标偏差)。** 任何最小化未加权平均完成时间的 +调度策略,必然会最大化最大任务的完成时间。 + +**证明。** SPT 将最大的任务放在最后。其完成时间等于总处理 +时间 $\sum p_i$,这是任何单个任务可能的最大完成时间。在任何 +不将最大任务放在最后的调度方案中,该任务严格更早完成。 +$\blacksquare$ + +这产生了一种**饥饿激励**:理性地优化未加权统计量的行为者 +会无限期地推迟大型任务,转而处理小型任务。Austin [18] +在组织绩效管理的背景下识别了这一普遍模式——不完整的度量 +会产生激励,使人们优化被度量的维度,而牺牲未被度量的维度。 +定理 3 提供了任务调度场景下的具体机制。 + +### 4.2 最大任务的最大完成时间 + +**定理 4(SPT 唯一地最大化最大任务的完成时间)。** +在所有调度方案中,SPT 是唯一使最大任务获得最大可能完成 +时间($\sum p_i$)的策略。 + +**证明。** SPT 按 $p_i$ 升序排列任务,将最大任务 $p_{\max}$ +置于最后位置。任何调度方案中最后一个任务的完成时间为 +$\sum_{i=1}^{n} p_i$,这是任何单个任务所能获得的最大值。 +在任何不将 $p_{\max}$ 放在最后的调度方案中,它严格在 +$\sum p_i$ 之前完成。$\blacksquare$ + +**推论 4.1。** 优化未加权平均完成时间的团队将系统性地为 +需求最复杂的客户提供最差的体验。这不是副作用——这是指标 +改善的*机制*。 + +**关于减速比的说明。** SPT 实际上*压缩*了减速比 +($S_i = C_i / p_i$),因为处于较后位置的大型任务具有较大 +的分母,可以吸收累积的总和。例如,对于任务 $[1, 5, 10]$: +SPT 给出减速比 $[1, 1.2, 1.6]$(低方差),而最长处理时间 +优先(LPT)给出 $[1, 3, 16]$(高方差)。SPT 对大型任务 +客户的伤害在减速比中并不可见——它在**绝对完成时间**中可见。 +这一区分很重要:调度公平性文献 [21, 22, 23] 主要通过基于 +减速比的度量来讨论 SPT/SRPT 的不公平性,这可能掩盖下文 +所证明的绝对延迟负担。 + +### 4.3 延迟集中 + +**定理 5(SPT 将延迟集中在最大任务上)。** 在 SPT 下, +最大任务承受的绝对延迟多于任何其他调度方案。 + +**证明。** 定义绝对延迟为 $\Delta_i = C_i - p_i$(等待时间, +与自身大小无关)。在 SPT 下,最大任务处于位置 $n$: + +$$\Delta_{\max\text{-task}}^{\text{SPT}} = C_n - p_n = \sum_{i=1}^{n-1} p_i$$ + +这是所有其他任务处理时间之和——任何单个任务可能的最大延迟。 +在任何最大任务不在最后的调度方案中,其延迟严格更小。同时, +SPT 给最小任务零延迟($\Delta_1^{\text{SPT}} = 0$)。全部 +排队负担从小型任务转移到了大型任务。$\blacksquare$ + +SPT 通过将延迟集中到在减速比意义上最能吸收它的任务上, +来最小化*总*延迟(有利于总体效率)。但在绝对意义上——等待 +的小时数——最大的任务承受了全部重量。 + +### 4.4 吞吐量不变性 + +**定理 6(吞吐量不变性)。** 在任何时间范围 $T$ 内完成 +的总工作量在所有调度策略下均相同。 + +**证明。** 执行者以固定速率处理工作。在任何时间范围 +$T \ge \sum p_i$ 内,完成的总工作量恰好为 $\sum p_i$, +与顺序无关。对于有持续到达任务的稳态情形,长期吞吐量由 +服务速率 $\mu$ 决定,完全不依赖于调度: + +$$\lim_{T \to \infty} \frac{W(T)}{T} = \mu \quad \text{对所有调度方案 } \sigma$$ + +$\blacksquare$ + +**推论 6.1。** 一个从任何调度策略切换到 SPT 的团队,将在 +未加权平均完成时间上观察到改善,而**实际吞吐量零变化**。 +指标改善了。产出没有改变。 + +### 4.5 复合效应 + +结合定理 4、5 和 6: + +| 度量 | 优化未加权平均的效果 | +|------|---------------------| +| 吞吐量(工作量/时间) | 无变化(定理 6) | +| 小型任务的延迟 | 最小化——趋近于零(SPT) | +| 大型任务的延迟 | **最大化**——承受全部排队负担(定理 5) | +| 最大任务的完成时间 | **最大可能值**:$\sum p_i$(定理 4) | + +对感知质量的净效果是负面的,因为: + +1. **损失厌恶是不对称的** [8]。一个 100 小时任务被降低优先级 + 的客户会经历一个巨大的、显著的负面体验。一个 1 小时任务 + 被加速的客户只会经历一个微小的、往往不被注意的正面体验。 + +2. **高工作量任务与高价值客户相关。** 大型任务不成比例地 + 更可能来自主要客户、复杂合同或关键业务需求。 + +3. **饥饿效应会累积。** 在连续系统中(定理 3),大型任务 + 可能被**无限期推迟**,因为新的小型任务持续到达。 + +**定理 7(核心结果)。** 对于处理非均匀大小任务的团队, +采用未加权平均完成时间作为绩效指标: + +(a) 提供**零生产力增益**(定理 6),同时 +(b) **将最大可能完成时间分配给**最大的任务(定理 4),并且 +(c) **将所有排队延迟集中**到最大的任务上,同时消除最小 + 任务的延迟(定理 5)。 + +这不是一个权衡。该指标创造了一个纯粹的服务质量转移: +从高工作量客户转向低工作量客户,而没有获得任何净工作量。 +$\blacksquare$ + +--- + +# 第二部分:优先级系统 + +## 5. 在优先级分类下的失效 + +前述章节证明了当任务大小不同时,未加权平均完成时间是有偏的。 +我们现在将证明,引入**优先级系统**——几乎所有实际团队都使用 +优先级系统——会导致该指标不仅仅是有偏的,而是**积极地与 +组织的既定目标对抗**。 + +### 5.1 扩展模型:带优先级的任务 + +设每个任务 $i$ 具有处理时间 $p_i$ 和优先级类别 +$q_i \in \{1, 2, 3, 4\}$,其中 1 为最高优先级(关键), +4 为最低(装饰性/增强型)。分配优先级权重: + +$$w(q) = \begin{cases} 8 & q = 1 \text{(关键)} \\ 4 & q = 2 \text{(高)} \\ 2 & q = 3 \text{(中)} \\ 1 & q = 4 \text{(低)} \end{cases}$$ + +具体权重仅为说明性的;结论对任何严格递减的权重函数成立。 +关键性质是:优先级根据**业务影响**而非任务大小来分配。 + +### 5.2 指标与优先级系统相矛盾 + +**定理 8(优先级-大小逆转)。** 当优先级与任务大小无关时, +最小化未加权平均完成时间的调度方案(SPT)将在期望意义上, +在更大的高优先级任务之前完成低优先级任务。 + +**证明。** SPT 按 $p_i$ 升序排列任务,不考虑 $q_i$。 +考虑两个任务: + +- 任务 A:$p_A = 40$ 小时,$q_A = 1$(关键——例如服务器宕机) +- 任务 B:$p_B = 0.5$ 小时,$q_B = 4$(低——例如界面装饰修复) + +SPT 将 B 排在 A 之前。这一对的未加权平均: + +$$\bar{C}^{\text{SPT}} = \frac{0.5 + 40.5}{2} = 20.5 \qquad \bar{C}^{\text{priority}} = \frac{40 + 40.5}{2} = 40.25$$ + +该指标宣称 SPT 好了将近**一倍**——尽管它是在服务器宕机 +期间完成了一个装饰性修复。 + +一般而言,当 $q_i$ 与 $p_i$ 统计独立时,SPT 的排序与 +优先级的**相关性为零**。实际上,关键任务(宕机、安全事件、 +数据丢失)往往比低优先级任务需要更多工作,因此该指标与 +优先级系统可能呈**负相关**。$\blacksquare$ + +### 5.3 信息销毁 + +未加权平均将三维任务 $(p_i, q_i, C_i)$ 化约为一维信号 +($C_i$),然后均匀平均。这完全丢弃了优先级信息,并隐式 +地反转了大小。 + +**定理 9(信息销毁)。** 设 $I(\sigma)$ 为调度方案的隐式 +优先级排序(位置)与实际优先级分配 $q_i$ 之间的互信息。 +对于 SPT: + +$$I(\sigma_{\text{SPT}}) = 0 \quad \text{当 } p_i \perp q_i$$ + +**证明。** SPT 仅根据 $p_i$ 分配位置。当 $p_i$ 和 $q_i$ +独立时,知道任务在 SPT 调度中的位置对其优先级提供零信息。 +$\blacksquare$ + +**推论 9.1。** 优化未加权平均完成时间的团队所运行的调度 +系统,关于其自身优先级分类携带零信息。他们工单系统中的 +优先级字段,就执行顺序而言,纯属装饰。 + +这是 Austin [18] 所称的不完整度量的根本问题的一个实例: +当度量系统仅捕获相关维度的子集时,对度量的优化会系统性 +地劣化未被度量的维度。 + +### 5.4 优先级加权延迟成本 + +定义调度方案的**优先级加权延迟成本**: + +$$D(\sigma) = \sum_{i=1}^{n} w(q_i) \cdot C_i$$ + +**定理 10(SPT 与优先级加权延迟成本)。** 使 $D(\sigma)$ 最小化 +的最优调度方案是 WSJF(加权最短作业优先, Weighted Shortest Job First): +按 $w(q_i)/p_i$ 降序排列 [1, 5]。SPT 的排序——按 $1/p_i$ 降序—— +完全忽略优先级,当优先级与任务大小相关时,会产生比尊重 +优先级的替代方案更高的 $D$。 + +**证明。** 通过交换论证,交换相邻任务 $i, j$ 使 $D$ 变化: + +$$\Delta D = w(q_j) \cdot p_i - w(q_i) \cdot p_j$$ + +当 $w(q_j)/p_j > w(q_i)/p_i$ 但 $j$ 排在 $i$ 之后时,交换 +改善 $D$。因此最优顺序是 $w(q_i)/p_i$ 递减——即 WSJF 规则。 +SPT 仅在 $w(q_i) = \text{const}$(所有任务优先级相同)时 +等价于 WSJF。 + +**示例。** 关键($w = 8$, $p = 3$)和低($w = 1$, $p = 2$): + +- SPT(低优先级在先):$D = 1 \cdot 2 + 8 \cdot 5 = 42$ +- WSJF(关键在先):$D = 8 \cdot 3 + 1 \cdot 5 = 29$ + +SPT 产生了多 45% 的优先级加权延迟。在实际中,关键任务 +往往更大(宕机、安全事件),使得这种偏离具有系统性。 +$\blacksquare$ + +--- + +## 6. 建议的解决方案 + +### 6.1 优先级加权指标 + +用**优先级加权完成得分(PWCS, Priority-Weighted Completion Score)** +替代未加权平均完成时间: + +$$\text{PWCS}(\sigma) = \frac{\sum_{i=1}^{n} w(q_i) \cdot \frac{C_i}{p_i}}{\sum_{i=1}^{n} w(q_i)}$$ + +这是优先级加权平均减速比。它度量每个任务相对于其大小等待 +了多长时间,并按该任务的重要程度加权。越低越好。 + +**性质:** + +1. **尊重优先级。** 关键任务的延迟成本是低优先级任务的 8 倍。 +2. **大小公平。** 使用减速比 $C_i / p_i$,因此大型任务不会 + 因为本身较大而被惩罚。 +3. **不可被 SPT 操纵。** 按处理时间重新排序不会系统性地改善 + 该得分。 +4. **在任务均匀时退化为未加权平均。** 是严格的推广。 + +### 6.2 最优策略:WSJF + +**定理 11。** 使优先级加权完成时间 +$\text{PWCT}(\sigma) = \sum w(q_i) \cdot C_i / \sum w(q_i)$ +最小化的调度方案,按 $w(q_i)/p_i$ 递减的顺序处理任务——即 +**加权最短作业优先(WSJF, Weighted Shortest Job First)** +规则 [1, 5]。 + +**证明。** 通过交换论证(同定理 10),交换相邻任务 $i, j$ +在 $w(q_j)/p_j > w(q_i)/p_i$ 但 $j$ 排在 $i$ 之后时改善 +PWCT(Priority-Weighted Completion Time,优先级加权完成时间)。 +因此最优顺序为 $w(q_i)/p_i$ 递减。$\blacksquare$ + +在同一优先级类别内,这退化为 SPT(最短优先)。跨类别时, +一个关键的 4 小时任务($w/p = 2.0$)优于一个低优先级的 +1 小时任务($w/p = 1.0$)。 + +**实际注意事项。** 纯粹的 WSJF 可能将微小的低优先级任务 +排在大型关键任务之前(一个 15 分钟的低优先级任务有 +$w/p = 1/0.25 = 4.0$,超过一个 6 小时关键任务的 +$w/p = 8/6 = 1.33$)。在实际中,通过强制执行**严格的优先级 +类别排序**并仅在每个类别*内部*应用 WSJF 来缓解此问题。 + +### 6.3 应用示例:IT 服务台 + +考虑一个具有以下工单队列的 IT 团队: + +| 工单 | 优先级 | 类型 | 预估工时 | +|------|--------|------|----------| +| T1 | P1(关键) | 邮件服务器宕机 | 6 | +| T2 | P2(高) | 远程团队 VPN 故障 | 4 | +| T3 | P3(中) | 新员工笔记本配置 | 2 | +| T4 | P4(低) | 更新桌面壁纸策略 | 0.5 | +| T5 | P3(中) | 安装软件许可证 | 1 | +| T6 | P1(关键) | 数据库备份失败 | 3 | +| T7 | P2(高) | 打印机集群离线 | 2 | +| T8 | P4(低) | 归档旧共享驱动器文件夹 | 0.25 | + +**SPT 顺序**(优化未加权平均):T8, T4, T5, T3, T7, T6, T2, T1 + +| 位置 | 工单 | 优先级 | 工时 | 完成时间 | 减速比 | +|------|------|--------|------|----------|--------| +| 1 | T8(归档文件夹) | P4 低 | 0.25 | 0.25 | 1.0 | +| 2 | T4(壁纸) | P4 低 | 0.5 | 0.75 | 1.5 | +| 3 | T5(软件) | P3 中 | 1 | 1.75 | 1.75 | +| 4 | T3(笔记本) | P3 中 | 2 | 3.75 | 1.875 | +| 5 | T7(打印机) | P2 高 | 2 | 5.75 | 2.875 | +| 6 | T6(备份) | P1 关键 | 3 | 8.75 | 2.917 | +| 7 | T2(VPN) | P2 高 | 4 | 12.75 | 3.188 | +| 8 | T1(邮件) | P1 关键 | 6 | 18.75 | 3.125 | + +**实用 WSJF**(优先级类别优先,类别内 SPT): + +| 位置 | 工单 | 优先级 | 工时 | 完成时间 | +|------|------|--------|------|----------| +| 1 | T6(备份) | P1 关键 | 3 | 3 | +| 2 | T1(邮件) | P1 关键 | 6 | 9 | +| 3 | T7(打印机) | P2 高 | 2 | 11 | +| 4 | T2(VPN) | P2 高 | 4 | 15 | +| 5 | T5(软件) | P3 中 | 1 | 16 | +| 6 | T3(笔记本) | P3 中 | 2 | 18 | +| 7 | T8(归档) | P4 低 | 0.25 | 18.25 | +| 8 | T4(壁纸) | P4 低 | 0.5 | 18.75 | + +**对比:** + +| 指标 | SPT | 实用 WSJF | 优胜者 | +|------|-----|-----------|--------| +| 未加权平均完成时间 | **6.56 小时** | 13.63 小时 | SPT | +| P1 平均解决时间 | 13.75 小时 | **6 小时** | WSJF | +| P2 平均解决时间 | 9.25 小时 | **13 小时** | SPT | +| 修复邮件服务器的时间 | 18.75 小时 | **9 小时** | WSJF | +| 修复数据库备份的时间 | 8.75 小时 | **3 小时** | WSJF | +| 更新壁纸的时间 | **0.75 小时** | 18.75 小时 | SPT | + +聚合优先级加权完成时间几乎相同(PWCT:10.2 vs 10.17), +因为聚合隐藏了分布性损害。真正的差异在于**按优先级类别 +分解的**结果:邮件服务器在 SPT 下宕机 18.75 小时,而在 WSJF +下为 9 小时。数据库备份失败 8.75 小时 vs 3 小时。 + +未加权指标自信地报告 SPT **效率超过两倍**(6.56 vs 13.63), +奖励了在邮件服务器着火时更新桌面壁纸的团队。 + +### 6.4 推荐指标套件 + +即使是优先级加权的聚合指标也可能无法区分好的和坏的调度方案, +因为聚合隐藏了分布性损害。没有单一指标足够。一个完整的 +度量系统应当跟踪: + +| 指标 | 度量内容 | 公式 | +|------|----------|------| +| **按优先级类别的平均完成时间** | 各类别响应速度 | 按 $q$ 过滤的 $\bar{C}$ | +| **P1 平均解决时间** | 关键事件响应 | $q = 1$ 的 $\bar{C}$ | +| **吞吐量** | 原始工作能力 | 完成工时 / 日历时间 | +| **老化违规** | 饥饿预防 | 按优先级超出 SLA 的任务 | +| **最大完成时间(P1/P2)** | 最坏情况关键响应 | $q \le 2$ 的 $\max(C_i)$ | + +关键洞察:**按优先级类别的指标**可以暴露出聚合指标所隐藏 +的调度失败。 + +--- + +# 第三部分:组织动态 + +## 7. 当指标成为产品 + +第 2–6 节假设客户满意度是*实际体验到的服务质量*的函数。 +但存在一种场景,在该场景下此假设不成立,整个论证会崩溃。 + +### 7.1 自指指标 + +假设服务提供方将未加权平均直接报告给客户——在仪表板上、 +在 SLA 报告中、在营销页面上——而客户的满意度主要来自 +*那个数字*: + +$$U_{\text{client}} = f\!\left(\bar{C}(\sigma)\right), \quad f' < 0$$ + +在此模型下,SPT 确实最大化了客户满意度(定理 1)。吞吐量 +不变(定理 6)。业务结果改善:同样的工作完成了,客户更满意。 + +**本文中的每一个定理在数学上仍然正确。但结论反转了。** +指标不再是一个可以被操纵的代理变量——它*就是*服务质量, +因为客户已同意按该聚合数字来评价质量。 + +### 7.2 经济学分析 + +这创造了一个一致的、稳定的均衡: + +| 参与者 | 行为 | 结果 | +|--------|------|------| +| 服务提供方 | 优化未加权平均(SPT) | 指标改善,无额外工作 | +| 客户 | 查看仪表板,看到低平均值 | 报告满意 | +| 管理层 | 看到满意的客户 + 好的指标 | 奖励团队 | + +服务提供方以零边际成本提取满意度,通过优化一个客户已接受 +的质量代理数字来实现。 + +### 7.3 脆弱性 + +此均衡仅在客户从不检视自身实际体验时才是稳定的。 +以下情况会打破它: + +1. **客户检查自己的工单。** 一位邮件服务器宕机 18.75 小时的 + CTO 不会因"平均解决时间:6.56 小时"而感到宽慰。最可能 + 检查的客户恰恰是获得最差服务的客户(定理 4)。 + +2. **竞争对手提供按工单的 SLA。** "P1 在 4 小时内解决" + 对任何有关键需求的客户而言,优于"平均解决时间低于 7 小时"。 + +3. **团队将指标内化。** 如果团队相信该指标反映了真实绩效, + 他们就失去了识别关键工作被忽视的能力。指标成为一种认知 + 危害。 + +### 7.4 一般模式 + +这种模式——代理变量替代质量,代理变量被优化,质量偏离, +系统在被现实检验之前保持稳定——在各领域反复出现。 +Muller [19] 将其广泛记录为"指标固化";Campbell [24] +形式化了将指标用作目标时的腐蚀效应。 + +| 领域 | 代理指标 | 底层质量 | 偏离 | +|------|----------|----------|------| +| IT 支持 | 平均解决时间 | 关键系统正常运行时间 | 服务器宕机 19 小时,平均值显示 6.5 | +| 教育 | 考试分数 | 实际学习 | 应试教育 | +| 医疗 | 患者吞吐量 | 患者结果 | 更快出院,更高再入院率 | +| 金融 | 季度盈利 | 长期价值 | 削减成本推高 EPS,侵蚀能力 | +| 软件 | 速率(故事点) | 产品质量 | 点数通胀,功能半成品 | + +### 7.5 信息不对称 + +将系统建模为服务提供方(P)和客户(C)之间的博弈。P 观察 +到各个 $\{C_i\}$ 并选择 $\sigma$;C 仅观察到 +$\bar{C}(\sigma)$。这是一个**道德风险**问题 [10]:P 的最优 +策略是最小化可观察信号,不顾不可观察分布如何。 + +该均衡是一个**混同均衡** [9]:P 报告的指标无论底层优先级 +加权绩效如何,看起来都是相同的。它在 C 获得各个 $C_i$ 值 +的访问权之前保持稳定——通过客户门户、竞争对手的透明度 +或一次足够痛苦的事件。 + +### 7.6 令人不安的结论 + +对"优化未加权平均是否损害业务?"的诚实回答是:**不一定, +只要客户从不查看数字背后的实际情况**。对"这是否可持续?"的 +诚实回答是:它的可持续性与任何卖方比买方知道更多的系统 +完全一样——在较长时期内稳定,然后在不对称性被刺破时 +迅速崩溃。 + +--- + +## 8. 知情的心理代价 + +第 7 节将服务提供方建模为一个统一的行为者。但团队由个人 +组成。当一位团队成员理解了这个证明——当他们*知道*该指标 +是人造的,仪表板是一场表演,邮件服务器仍然宕机而他们在 +关闭壁纸工单——一种新的成本出现了,而均衡模型忽略了 +这一成本。 + +### 8.1 隐含变量:团队认知 + +| 参与者 | 观察到各个 $C_i$ | 观察到 $\bar{C}$ | 理解该证明 | +|--------|-------------------|-------------------|------------| +| 管理层 | 可能 | 是 | 不一定 | +| 团队成员 | **是** | 是 | **是**(在此场景下) | +| 客户 | 否 | 是 | 否 | + +团队成员拥有完整信息。他们看到工单队列。他们知道邮件服务器 +从早上 7 点就宕机了。他们知道自己在关闭一个壁纸工单, +因为这会改善那个数字。他们知道*为什么*。 + +### 8.2 完全信息下的认知失调 + +认知失调 [11] 产生于个体持有矛盾认知时。在不理解*原因*的 +情况下,矛盾可以被合理化:"管理层比我们懂。"理解了该证明 +则消除了模糊性。团队成员现在同时持有: + +- **认知 A:** "我是一名有能力的专业人员。我的工作是解决 + 重要问题。" +- **认知 B:** "我正在邮件服务器宕机时关闭一个壁纸工单, + 因为该指标在数学上有偏(定理 1),重新排序产生零吞吐量 + (定理 6),唯一的受益者是仪表板(第 7 节)。我能证明这一点。" + +认知失调现在是*承重的*。可用的解决方式——放弃职业身份认同、 +否认该证明、倡导变革或离开——每一种都施加了此前不存在的 +成本。 + +### 8.3 自我决定理论:三种需求被违反 + +Deci 和 Ryan 的自我决定理论(SDT, Self-Determination Theory) +[12, 13] 识别了预测内在动机的三种需求: + +**自主性。** 该指标以团队成员知道在数学上次优的方式约束 +其选择。一个理解该过程可证明是适得其反的工作者,不可能在 +遵循该过程时感到自主。 + +**胜任感。** 该指标奖励*表面上的*效能(低 $\bar{C}$), +同时对*实际的*效能无感(定理 6)。真正的胜任表现——首先 +修复邮件服务器——*被*指标*惩罚*。 + +**归属感。** 团队成员知道客户的邮件服务器宕机了。他们可以 +帮忙。他们却在更新壁纸——不是因为这帮助了任何人,而是因为 +这帮助了一个数字。工作与人类影响之间的连接已被切断, +而团队成员能看到断裂的两端。 + +### 8.4 道德伤害 + +道德伤害 [16, 17] 是由"实施、未能阻止、目睹或知晓违反 +深层道德信念的行为"[17] 所造成的持久伤害。该概念此后已被 +扩展到商业环境 [25]。与倦怠的关键区别在于:**倦怠是因为 +做太多而精疲力竭。道德伤害是因为做错事而受到损害。** + +一位知道邮件服务器宕机、知道应该修复它、却关闭了一个 +壁纸工单、且这样做是因为指标要求如此的团队成员,正在 +经历道德伤害的结构性条件。 + +### 8.5 习得性无助与指标宿命论 + +Seligman 的习得性无助理论 [14, 15] 描述了暴露于不可控的 +负面结果如何导致被动。其序列为: + +1. 指标有缺陷(证明已理解)。 +2. 倡导变革。 +3. 被拒绝("数字很好看,别兴风作浪")。 +4. 以递减的信念重复。 +5. 终态:"指标就是这样的。我就关工单吧。" + +这不是懒惰。这是对一个惩罚正确行为、奖励错误行为的系统 +的理性反应——当个人无力改变该系统时。 + +### 8.6 逆向选择螺旋 + +将第 7 节的均衡与人员流动动态相结合: + +1. 组织采用未加权平均。指标看起来很好(SPT)。 +2. 有认知的、有能力的团队成员承受心理代价(8.2–8.5)。 +3. 这些成员离开。被不理解指标缺陷或不在意的成员替代。 +4. 指标继续看起来很好——在 SPT 下它总是如此,无论团队 + 能力如何(推论 6.1)。 +5. 实际服务质量下降,但指标无法检测到(推论 9.1)。 +6. 回到步骤 1。 + +指标*逆向选择*了人才:淘汰那些会改善系统的人,留下那些 +不会质疑系统的人。系统在更低的能力水平上稳定下来, +这对其自身的度量装置是不可见的。 + +### 8.7 完整成本模型 + +| 第 7 节(可见的) | 第 8 节(隐藏的) | +|-------------------|-------------------| +| 客户满意(好数字) | 团队不满(坏现实) | +| 吞吐量不变 | 自主努力被撤回 | +| 指标改善 | 有能力的成员离开 | +| 商业经济稳定 | 机构能力退化 | + +这些在不同的时间尺度上运作:均衡在季度层面可见;能力退化 +在数年后才可见。完整模型是:**指标有效,且它是破坏性的, +而破坏对指标本身不可见。** 指标是腐蚀钢筋上的新漆。 + +--- + +## 9. 管理者内化:可操作的解决方案 + +第 2–6 节说应当拒绝该指标。第 7 节说该指标有效(对业务 +而言)。第 8 节说它摧毁团队。在实践中,大多数管理者无法 +单方面改变指标。最佳解决方案是全公司范围的指标改革。 +*可操作的*解决方案是一位知情的管理者现在就能做的事情。 + +### 9.1 策略 + +理解该证明的管理者可以**内化指标的局限性,而不将其传播 +给团队**: + +1. **主要按优先级调度。** 团队首先处理关键任务。 +2. **策略性地穿插小型任务。** 当一个小的低优先级任务可以 + 在不实质性延迟高优先级工作的情况下完成时,就去做它。 + 不是因为指标要求,而是因为它也需要完成,且几乎不花 + 什么代价。 +3. **绝不将指标作为动机来源透露。** "趁我们等 P1 供应商 + 回电话的时候,把这个快速的处理掉"——而不是"我们需要降低 + 我们的平均值"。团队的内在动机保持完整(第 8 节)。 + 管理者吸收了指标管理的负担。 + +### 9.2 形式化 + +管理者的问题是一个约束优化问题: + +$$\min_{\sigma} \sum_{i=1}^{n} w(q_i) \cdot C_i \quad \text{subject to} \quad \bar{C}(\sigma) \le \bar{C}_{\text{target}}$$ + +**定理 12(优先级调度的有界指标成本)。** 一位在每个优先级 +类别*内部*使用 SPT、在类别*之间*使用优先级排序的管理者, +将产生接近 SPT 最优值的指标——差距仅来自跨类别逆序。 + +**证明概要。** 在每个优先级类别内,SPT 是免费的(所有任务 +具有相同优先级)。与全局 SPT 的唯一偏差是跨类别排序。 +每个跨类别逆序最多在未加权总和中增加 +$p_{\text{large}} - p_{\text{small}}$ 的成本,而这些逆序 +的数量受类别数量限制。在实际中,差距通常在 SPT 最优值的 +10–20% 以内。$\blacksquare$ + +### 9.3 管理者作为信息屏障 + +| 层级 | 看到指标 | 看到优先级 | 看到证明 | +|------|----------|-----------|----------| +| 组织 | 是 | 名义上 | 否 | +| 管理者 | 是 | 是 | **是** | +| 团队 | 否(被屏蔽) | 是 | 无关 | +| 客户 | 是(仪表板) | 通过 SLA | 否 | + +管理者是唯一同时持有这三部分信息的参与者。这不是操纵—— +他们在以正确的顺序做正确的工作,而指标恰好可以接受, +因为类别内的 SPT 是免费的。 + +### 9.4 竞争性失效 + +当指标在**团队间成为竞争性的**时,此策略失效。 + +**情形 1:合作型** —— 团队的度量目标为达标而非排名。每位 +管理者独立使用内化策略。指标是装饰性的但无害的。这是一个 +具有稳定合作均衡的**协调博弈**。 + +**情形 2:竞争型** —— 团队按 $\bar{C}$ 排名。这是一个 +**囚徒困境**: + +| | 团队 B:优先级优先 | 团队 B:SPT | +|---|---|---| +| **团队 A:优先级优先** | (好工作, 好工作) | (A 看起来差, B 看起来好) | +| **团队 A:SPT** | (A 看起来好, B 看起来差) | (都看起来好, 都做了错误的工作) | + +纳什均衡为(SPT, SPT)。内化策略是一个在竞争下 +**不稳定的**合作均衡。 + +### 9.5 适用范围 + +| 条件 | 可行性 | +|------|--------| +| 指标用于健康检查 / 达标检查 | **可行** | +| 指标可见但不排名 | **可行** | +| 指标跨团队排名 | **脆弱**——需要所有管理者合作 | +| 指标与薪酬 / 资源挂钩 | **不可行**——囚徒困境占主导 | +| 可在组织层面进行指标改革 | **不需要**——直接修正指标 | + +**最佳解决方案是全公司范围的。可操作的解决方案是一位理解 +本证明的管理者,屏蔽团队不受该指标影响,按优先级调度, +并仅在优先级类别内部使用 SPT 以保持数字在合理范围内。** + +--- + +# 第四部分:评估 + +## 10. 魔鬼代言人 + +学术诚信要求承认论证的局限性所在。 + +### 10.1 简单性具有真实价值 + +**论点。** 未加权平均不需要优先级权重、不需要任务大小估计、 +不需要校准。 + +**评估:正确。** 但未加权指标并非避免了假设——它只是将 +假设*隐藏*了,隐式地将所有权重设为 1、所有大小设为 1。 +一个已知不精确的任务大小估计,仍然比隐式假设所有大小 +相同更有信息量。 + +### 10.2 最小化等待人数 + +**论点。** SPT 最小化了总的人-小时等待时间。如果每个任务 +代表一个客户,这是最优的。 + +**评估:数学上正确。** 如果你运营一个车管所,且每个人的 +时间同等宝贵,SPT 是正确的策略。当任务与客户不是一一对应、 +等待成本不均匀、或该指标用于评估团队而非服务实际队列时, +它就失效了。 + +### 10.3 SPT 作为分诊启发式 + +**论点。** 当任务大小聚集紧密时,SPT 近似于先到先服务 +(FIFO),而未加权平均近似于加权平均。 + +**评估:正确。** 变异系数 $CV = \sigma_p / \bar{p}$ 决定 +了失真严重程度: + +| $CV$ | 任务大小分布 | 失真程度 | +|------|-------------|----------| +| < 0.3 | 紧密(呼叫中心) | 可忽略 | +| 0.3 – 1.0 | 中等(混合 IT) | 中等 | +| > 1.0 | 宽泛(典型 IT 队列) | 严重 | + +典型的 IT 服务台跨度从 15 分钟到 40 小时以上($CV > 2$)。 +失真不是边缘情况——它是默认状态。 + +### 10.4 操纵需要恶意 + +**论点。** 定理表明指标*可以*被操纵,而非*将会*被操纵。 + +**评估:这是最有力的反驳论点。** 如果指标纯粹是信息性的, +从不影响行为,则操纵激励不存在。然而,任何报告给管理层、 +与 OKR 挂钩或在回顾会议中讨论的指标都会影响行为。这是 +古德哈特定律 [6, 7]——它适用于善意的团队,与适用于玩世 +不恭的团队一样可靠。偏离是有机发生的:完成三个简单工单 +"感觉高效",而指标验证了这种感觉。 + +### 10.5 未加权平均可辩护的条件 + +该指标**仅在以下四个条件同时成立时**才可辩护: + +1. 任务大小近似均匀($CV < 0.3$) +2. 无优先级区分(所有任务同等重要) +3. 每个任务恰好代表一个客户 +4. 该指标不被用于评估、奖励或引导行为 + +这些条件在该指标最常被使用的系统中很少满足。 + +--- + +## 11. 相关工作 + +本文位于若干此前未被关联的文献的交汇处。 + +### 11.1 调度理论与公平性 + +Smith [1] 于 1956 年建立了 SPT 最优性结果和 WSJF 规则。 +Conway、Maxwell 和 Miller [2] 提供了全面的教科书论述。 +基于大小的调度策略的公平性在计算机系统调度领域已有讨论: +Bansal 和 Harchol-Balter [22] 研究了 SRPT 的不公平性; +Wierman 和 Harchol-Balter [23] 通过与处理器共享的比较形式化 +了公平性分类;Angel、Bampis 和 Pascual [21] 度量了 SPT 调度 +在公平最优性准则下的质量。 + +这些先前工作分析的是 CPU 和服务器调度中的公平性。本文将 +相同的数学结果应用于*组织任务管理*,其中"调度器"是人类团队, +"作业"是具有业务影响优先级的客户请求,而"目标函数"是管理指标。 +机制是相同的;后果不同,因为组织调度具有优先级系统、客户 +关系和心理成本,而 CPU 调度没有。 + +### 11.2 度量失灵 + +Austin [18] 证明了不完整度量——仅度量相关维度的子集—— +会产生激励,使人优化被度量的维度而牺牲未被度量的维度, +且当度量与奖励挂钩时,这一效应不仅仅是可能的,而是 +*不可避免的*。他的信息不对称框架与第 7 节密切对应。本文 +为任务调度情形提供了具体的数学机制(定理 1–2),并通过 +心理学(第 8 节)扩展了论证,以追溯组织危害的完整链条。 + +Muller [19] 记录了教育、医疗、警务和金融领域的"指标固化" +现象,为第 7.4 节所理论化的模式提供了广泛的实证证据。 +Campbell [24] 形式化了将指标用作目标时的腐蚀效应, +补充了 Goodhart 的原始观察 [6] 和 Strathern 的推广 [7]。 + +Bevan 和 Hood [26] 实证记录了英国公共卫生系统中的博弈行为 +——包括我们第 5.2 节所描述的"达到目标却偏离要点"的 +确切模式。 + +### 11.3 指标失灵的心理代价 + +将道德伤害(Shay [16],Litz 等 [17])应用于商业环境有 +近期先例:2024 年 *Journal of Business Ethics* 的一项研究 +[25] 明确将该概念扩展到营利性工作场所,发现了与第 8.4 节 +所描述的类似的结构性条件。Moore [27] 分析了道德*脱离*—— +在组织压力下使不道德行为成为可能的认知重构。本文讨论的是 +互补现象:对*拒绝*脱离的个体造成的伤害。 + +### 11.4 本文的新颖之处 + +各个组成部分——SPT 最优性、古德哈特定律、度量失灵、道德 +伤害——都有先例。本文的贡献在于: + +1. **守恒律(定理 2)的规范性使用**——作为工作量加权完成 + 时间*不可能*被操纵的建设性论证,而非仅作为一个理论调度 + 结果。 + +2. **优先级分类使指标在代数意义上具有对抗性的具体证明** + (定理 8–9)——不仅仅是经验上的不好,而是结构上的矛盾, + 在调度方案与优先级系统之间的互信息为零。 + +3. **从数学证明经信息不对称经心理伤害到逆向选择螺旋的 + 完整链条**——追溯单一指标从 Smith(1956)到组织空心化 + 的过程。 + +4. **管理者内化策略**(第 9 节),附带其在团队间竞争下的 + 稳定性与失效条件的正式博弈论分析。 + +5. **将调度理论应用于组织管理批判**——证明一个常用的团队 + 指标具有特定的、可量化的病理特征,而非仅凭轶事或一般 + 原则立论。 + +--- + +## 12. 结论 + +未加权平均完成时间是一个**有偏统计量**,它: + +1. **可被调度策略操纵**(定理 1),不同于工作量加权完成 + 时间的调度不变性(定理 2)。 +2. **激励大型任务的饥饿**(定理 3)。 +3. **降低客户满意度**,且零补偿性生产力增益(定理 7)。 +4. **积极与优先级系统矛盾**,关于业务影响分类携带零信息 + (定理 9)。 +5. **在其调度建议中完全忽略优先级**,当优先级与大小不是 + 完全负相关时,产生次优的优先级加权延迟(定理 10)。 + +一个可以通过重新排列工作顺序来改善——而无需做任何额外 +工作——的指标,度量的是调度策略,而非系统的能力。当与 +优先级系统结合时,它推荐的调度方案会对最高优先级的工作 +造成最大的损害。 + +当该指标被报告给客户时,它创造了一种信息不对称(第 7 节), +其商业均衡是有利可图的但脆弱的。当团队成员理解其缺陷时, +它侵犯他们的内在动机,并选择性地导致最有能力的人离开 +(第 8 节)。一位知情的管理者可以通过约束优化部分地 +缓解这些效应(第 9 节),但这种合作策略在团队间竞争下 +是不稳定的。 + +未加权平均仅在狭窄条件下可辩护(第 10.5 节):均匀的 +任务大小、无优先级、一对一的客户-任务映射以及无行为影响。 +这些条件很少满足。 + +**未加权平均完成时间不是一个公正或准确的任务执行绩效度量。 +将其作为团队指标采用,将理性地产生复杂工作的饥饿、既定 +优先级的违反、不公平的客户结果,以及在不存在生产力的地方 +制造生产力的幻觉。** + +最佳解决方案是组织层面的指标改革。可操作的解决方案是 +一位理解本证明的管理者。 + +--- + +## 参考文献 + +### Scheduling Theory + +[1] Smith, W. E. (1956). Various optimizers for single-stage production. +*Naval Research Logistics Quarterly*, 3(1–2), 59–66. +doi:[10.1002/nav.3800030106](https://doi.org/10.1002/nav.3800030106) + +> SPT 最优性结果(定理 1)、加权完成时间规则 $w_i/p_i$ 降序 +> (WSJF,定理 11)以及全文所用的相邻作业成对交换(交换论证) +> 证明技术的来源。 + +[2] Conway, R. W., Maxwell, W. L., & Miller, L. W. (1967). *Theory of +Scheduling*. Addison-Wesley. + +> 单机调度理论的标准教科书论述,扩展了 Smith 的结果。 + +[3] Little, J. D. C. (1961). A proof for the queuing formula: L = λW. +*Operations Research*, 9(3), 383–387. +doi:[10.1287/opre.9.3.383](https://doi.org/10.1287/opre.9.3.383) + +> Little 定律的首次严格证明。在第 3.2 节中因排队论背景而引用。 + +[4] Little, J. D. C. (2011). Little's Law as viewed on its 50th +anniversary. *Operations Research*, 59(3), 536–549. +doi:[10.1287/opre.1110.0941](https://doi.org/10.1287/opre.1110.0941) + +> 回顾性文章,讨论适用范围、局限性和常见误用。 + +[5] Reinertsen, D. G. (2009). *The Principles of Product Development +Flow: Second Generation Lean Product Development*. Celeritas Publishing. +ISBN: 978-0-9844512-0-8. + +> 在敏捷/精益背景下推广了 WSJF 和"延迟成本/工期"的概念。 +> 数学基础源自 Smith(1956)[1]。 + +### Measurement and Incentives + +[6] Goodhart, C. A. E. (1984). Problems of monetary management: The U.K. +experience. In *Monetary Theory and Practice* (pp. 91–121). Macmillan. + +> 古德哈特定律的来源:"任何被观察到的统计规律性,一旦被用于 +> 控制目的而施加压力,就会趋于崩溃。" + +[7] Strathern, M. (1997). 'Improving ratings': Audit in the British +university system. *European Review*, 5(3), 305–321. +doi:[10.1002/(SICI)1234-981X(199707)5:3<305::AID-EURO184>3.0.CO;2-4](https://doi.org/10.1002/(SICI)1234-981X(199707)5:3%3C305::AID-EURO184%3E3.0.CO;2-4) + +> 古德哈特定律的推广:"当一个度量成为目标时,它就不再是一个 +> 好的度量。" + +### Behavioral Economics + +[8] Kahneman, D., & Tversky, A. (1979). Prospect theory: An analysis of +decision under risk. *Econometrica*, 47(2), 263–292. +doi:[10.2307/1914185](https://doi.org/10.2307/1914185) + +> 建立了损失厌恶理论。在第 4.5 节中引用。 + +### Game Theory and Contract Theory + +[9] Akerlof, G. A. (1970). The market for "lemons": Quality uncertainty +and the market mechanism. *The Quarterly Journal of Economics*, 84(3), +488–500. doi:[10.2307/1879431](https://doi.org/10.2307/1879431) + +> 信息不对称与逆向选择。第 7.5 节中的混同均衡在结构上 +> 与之类似。 + +[10] Hölmstrom, B. (1979). Moral hazard and observability. *The Bell +Journal of Economics*, 10(1), 74–91. +doi:[10.2307/3003320](https://doi.org/10.2307/3003320) + +> 道德风险的形式化处理。第 7.5 节中的指标报告场景是一个 +> 道德风险问题。 + +### Psychology + +[11] Festinger, L. (1957). *A Theory of Cognitive Dissonance*. Stanford +University Press. ISBN: 978-0-8047-0131-0. + +> 基础理论。在第 8.2 节中引用。 + +[12] Deci, E. L., & Ryan, R. M. (1985). *Intrinsic Motivation and +Self-Determination in Human Behavior*. Plenum Press. +ISBN: 978-0-306-42022-1. + +> 自我决定理论的原始论述。在第 8.3 节中引用。 + +[13] Ryan, R. M., & Deci, E. L. (2000). Self-determination theory and +the facilitation of intrinsic motivation, social development, and +well-being. *American Psychologist*, 55(1), 68–78. +doi:[10.1037/0003-066X.55.1.68](https://doi.org/10.1037/0003-066X.55.1.68) + +> 自我决定理论综述,将需求满足与内在动机和幸福感联系起来。 + +[14] Seligman, M. E. P., & Maier, S. F. (1967). Failure to escape +traumatic shock. *Journal of Experimental Psychology*, 74(1), 1–9. +doi:[10.1037/h0024514](https://doi.org/10.1037/h0024514) + +> 习得性无助的原始实验证明。在第 8.5 节中引用。 + +[15] Seligman, M. E. P. (1975). *Helplessness: On Depression, +Development, and Death*. W. H. Freeman. ISBN: 978-0-7167-0752-3. + +> 扩展论述,将习得性无助与人类抑郁和制度行为联系起来。 + +[16] Shay, J. (1994). *Achilles in Vietnam: Combat Trauma and the Undoing +of Character*. Atheneum / Simon & Schuster. ISBN: 978-0-689-12182-3. + +> 引入了道德伤害的概念。在第 8.4 节中引用。 + +[17] Litz, B. T., Stein, N., Delaney, E., Lebowitz, L., Nash, W. P., +Silva, C., & Maguen, S. (2009). Moral injury and moral repair in war +veterans: A preliminary model and intervention strategy. *Clinical +Psychology Review*, 29(8), 695–706. +doi:[10.1016/j.cpr.2009.07.003](https://doi.org/10.1016/j.cpr.2009.07.003) + +> 将道德伤害形式化为一个临床构念。第 8.4 节引用了其定义。 + +### Organizational Measurement + +[18] Austin, R. D. (1996). *Measuring and Managing Performance in +Organizations*. Dorset House. ISBN: 978-0-932633-36-1. + +> 证明了不完整度量不可避免地产生激励,使人优化被度量的维度 +> 而牺牲未被度量的维度。信息不对称框架与第 7 节密切对应。 +> 本文论证最重要的先驱作品。 + +[19] Muller, J. Z. (2018). *The Tyranny of Metrics*. Princeton University +Press. ISBN: 978-0-691-17495-2. + +> 对教育、医疗、警务和金融领域"指标固化"的全面论述。 +> 为第 7.4 节所理论化的模式提供了广泛的实证证据。 + +### Scheduling Fairness + +[20] Coffman, E. G., Shanthikumar, J. G., & Yao, D. D. (1992). +Multiclass queueing systems: Polymatroid structure and optimal scheduling +control. *Operations Research*, 40(S2), S293–S299. + +> 调度中的守恒律。工作量加权完成时间的调度不变性(定理 2) +> 是这些守恒律的一个实例。 + +[21] Angel, E., Bampis, E., & Pascual, F. (2008). How good are SPT +schedules for fair optimality criteria? *Annals of Operations Research*, +159(1), 53–64. doi:[10.1007/s10479-007-0267-0](https://doi.org/10.1007/s10479-007-0267-0) + +> 直接度量 SPT 调度在公平性准则下的质量。在调度理论中, +> 是第 4 节公平性分析最接近的先驱。 + +[22] Bansal, N., & Harchol-Balter, M. (2001). Analysis of SRPT +scheduling: Investigating unfairness. *ACM SIGMETRICS Performance +Evaluation Review*, 29(1), 279–290. +doi:[10.1145/384268.378792](https://doi.org/10.1145/384268.378792) + +> 调查了 SRPT 在计算机调度中不公平地惩罚大型作业的观点。 +> 认为不公平性小于人们的认知,但承认核心张力。 + +[23] Wierman, A., & Harchol-Balter, M. (2003). Classifying scheduling +policies with respect to unfairness in an M/GI/1. *ACM SIGMETRICS +Performance Evaluation Review*, 31(1), 238–249. + +> 通过与处理器共享的比较,形式化了调度策略的公平性定义。 + +### Additional References + +[24] Campbell, D. T. (1979). Assessing the impact of planned social +change. *Evaluation and Program Planning*, 2(1), 67–90. +doi:[10.1016/0149-7189(79)90048-X](https://doi.org/10.1016/0149-7189(79)90048-X) + +> Campbell 定律:"任何定量社会指标越是被用于社会决策, +> 就越会受到腐蚀压力,也越容易扭曲和腐蚀它所要监测的 +> 社会过程。"与古德哈特定律 [6] 互补。 + +[25] Ferreira, C. M., et al. (2024). It's business: A qualitative study +of moral injury in business settings. *Journal of Business Ethics*. +doi:[10.1007/s10551-024-05615-0](https://doi.org/10.1007/s10551-024-05615-0) + +> 将道德伤害扩展到营利性工作场所。验证了第 8.4 节将 +> Shay/Litz 的概念应用于军事和医疗之外环境的做法。 + +[26] Bevan, G., & Hood, C. (2006). What's measured is what matters: +Targets and gaming in the English public health care system. *Public +Administration*, 84(3), 517–538. +doi:[10.1111/j.1467-9299.2006.00600.x](https://doi.org/10.1111/j.1467-9299.2006.00600.x) + +> 实证记录了博弈行为,包括"达到目标却偏离要点"。为第 5.2 节 +> 的优先级-指标矛盾提供了现实世界的证据。 + +[27] Moore, C. (2012). Why employees do bad things: Moral disengagement +and unethical organizational behavior. *Personnel Psychology*, 65(1), +1–48. doi:[10.1111/j.1744-6570.2011.01237.x](https://doi.org/10.1111/j.1744-6570.2011.01237.x) + +> 分析了道德*脱离*——使不道德行为在组织压力下成为可能的 +> 认知重构。第 8 节讨论的是互补现象:对*拒绝*脱离的个体 +> 造成的伤害。 + +--- + +*本证明通过对话方式发展并于 2026-03-28 正式化。*