Files
task-queue-proof/README.es.md
T
Mortdecai b6d42d3237 Add 10 translations: ES, TH, FR, EO, PL, DE, PT, AR, TL, ZH
Complete translations of the full paper into:
- Spanish (README.es.md)
- Thai (README.th.md)
- French (README.fr.md)
- Esperanto (README.eo.md)
- Polish (README.pl.md)
- German (README.de.md)
- Portuguese/Brazilian (README.pt.md)
- Arabic/MSA (README.ar.md)
- Tagalog/Filipino (README.tl.md)
- Simplified Chinese (README.zh.md)

All translations preserve mathematical notation, LaTeX formulas,
citation numbers, and markdown formatting. Reference citations kept
in English with translated annotations.

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-29 00:36:57 -04:00

61 KiB
Raw Blame History

El tiempo medio de finalización no ponderado no es una métrica justa para la planificación de tareas

Una demostración matemática de que el tiempo medio de finalización de tareas no ponderado es un estadístico sesgado que incentiva la selección preferencial de trabajo fácil, y de que cualquier ventaja de planificación que aparente revelar es un artefacto de la métrica — no un reflejo de rendimiento genuino ni de calidad de servicio.


1. Introducción

Muchas organizaciones miden el rendimiento en la ejecución de tareas mediante el tiempo medio de finalización no ponderado: el número promedio de horas (o días) entre el envío de una tarea y su resolución, contando cada tarea por igual independientemente de su tamaño o prioridad.

Este artículo demuestra que esta métrica no es meramente imprecisa, sino estructuralmente sesgada. Puede mejorarse reordenando el trabajo sin realizar ningún trabajo adicional (Teorema 1), mientras que una alternativa ponderada adecuadamente es completamente inmune a la manipulación del orden de ejecución (Teorema 2). Cuando se combina con un sistema de prioridades, la métrica contradice activamente las propias clasificaciones de prioridad de la organización (Teorema 9).

El argumento se desarrolla en cuatro partes:

  • Parte I (Secciones 24) establece la base matemática: la media no ponderada es manipulable mediante la planificación por Tiempo de Procesamiento más Corto Primero (SPT), la media ponderada por trabajo es invariante respecto al orden de ejecución, y las consecuencias resultantes para la calidad del servicio son demostrablemente negativas.

  • Parte II (Secciones 56) extiende el modelo a tareas clasificadas por prioridad, demuestra que la métrica se vuelve adversarial respecto al sistema de prioridades, y propone alternativas ponderadas con un ejemplo práctico de mesa de servicio de TI.

  • Parte III (Secciones 79) examina las dinámicas organizacionales: qué ocurre cuando la métrica se reporta a los clientes (asimetría de información), qué sucede con los miembros del equipo que comprenden sus defectos (daño psicológico), y qué puede hacer un gerente informado al respecto (optimización restringida con análisis de estabilidad desde la teoría de juegos).

  • Parte IV (Secciones 1012) presenta contraargumentos honestos, sitúa el trabajo en la literatura existente y concluye.

Los resultados fundamentales se basan en la teoría fundacional de planificación de Smith (1956) [1], extendida mediante la teoría de juegos [9, 10], la teoría de medición organizacional [18, 19] y la psicología [1117] para trazar una cadena completa desde una demostración matemática sobre una métrica específica hasta los resultados organizacionales.


Parte I: Fundamentos matemáticos

2. Definiciones

Sean n tareas con tiempos de procesamiento p_1, p_2, \ldots, p_n.

Un calendario de ejecución \sigma es una permutación de \{1, 2, \ldots, n\} que asigna tareas a un orden de ejecución en un único ejecutor.

El tiempo de finalización de la tarea \sigma(k) bajo el calendario \sigma es:

C_{\sigma(k)} = \sum_{j=1}^{k} p_{\sigma(j)}

El tiempo medio de finalización no ponderado es:

\bar{C}(\sigma) = \frac{1}{n} \sum_{k=1}^{n} C_{\sigma(k)}

El tiempo medio de finalización ponderado por trabajo es:

\bar{C}_w(\sigma) = \frac{\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)}}{\sum_{k=1}^{n} p_{\sigma(k)}}

3. Resultados fundamentales

3.1 La media no ponderada es manipulable

Teorema 1 (Smith, 1956 [1]). El calendario que minimiza \bar{C}(\sigma) es el de Tiempo de Procesamiento más Corto Primero (SPT): ordenar las tareas de modo que p_{\sigma(1)} \le p_{\sigma(2)} \le \cdots \le p_{\sigma(n)}.

Demostración (argumento de intercambio [1, 2]).

Considérese cualquier calendario \sigma en el que dos tareas adyacentes i, j satisfacen p_i > p_j, con la tarea i programada inmediatamente antes de la tarea j. Sea t el tiempo de inicio de la tarea i.

La tarea i finaliza La tarea j finaliza Suma
Antes del intercambio (i luego j) t + p_i t + p_i + p_j 2t + 2p_i + p_j
Después del intercambio (j luego i) t + p_j t + p_j + p_i 2t + p_i + 2p_j

El cambio en la suma de tiempos de finalización es:

(2p_i + p_j) - (p_i + 2p_j) = p_i - p_j > 0

Cada intercambio de un par adyacente largo-antes-de-corto reduce estrictamente el total. Todo calendario no-SPT contiene dicho par. Los intercambios repetidos convergen a SPT. Por lo tanto, SPT minimiza de forma única \bar{C}(\sigma). \blacksquare

3.2 La media ponderada por trabajo es invariante respecto al calendario

Teorema 2. El tiempo medio de finalización ponderado por trabajo \bar{C}_w(\sigma) es el mismo para todo calendario \sigma.

Demostración.

Expandamos el numerador:

\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)} = \sum_{k=1}^{n} p_{\sigma(k)} \sum_{j=1}^{k} p_{\sigma(j)}

Reindexemos haciendo a = \sigma(k) y b = \sigma(j). La suma doble cuenta cada par ordenado (a, b) donde b está programado no después de a:

= \sum_{\substack{a, b \\ b \preceq_\sigma a}} p_a \, p_b

Para cualquier par (a, b) con a \ne b, se cumple exactamente uno de \{b \preceq_\sigma a\} o \{a \prec_\sigma b\}. Los términos diagonales (a = b) contribuyen p_a^2 independientemente del orden. Por lo tanto:

\sum_{\substack{a, b \\ b \preceq_\sigma a}} p_a \, p_b = \sum_{a} p_a^2 + \sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b

Junto con la suma complementaria, las dos sumas fuera de la diagonal cubren todos los pares no ordenados:

\sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b + \sum_{\substack{a \ne b \\ a \prec_\sigma b}} p_a \, p_b = \sum_{a \ne b} p_a \, p_b

El lado derecho es independiente del calendario. Por la simetría de p_a p_b, ambas sumas fuera de la diagonal son iguales:

\sum_{\substack{a \ne b \\ b \prec_\sigma a}} p_a \, p_b = \frac{1}{2} \sum_{a \ne b} p_a \, p_b

Por lo tanto:

\sum_{k=1}^{n} p_{\sigma(k)} \cdot C_{\sigma(k)} = \sum_a p_a^2 + \frac{1}{2} \sum_{a \ne b} p_a \, p_b = \frac{1}{2}\left(\sum_a p_a\right)^2 + \frac{1}{2}\sum_a p_a^2

Esta expresión no contiene referencia alguna a \sigma. Dado que el denominador \sum p_a también es independiente del calendario:

\bar{C}_w(\sigma) = \frac{\frac{1}{2}\left(\sum p_a\right)^2 + \frac{1}{2}\sum p_a^2}{\sum p_a}

es constante para todos los calendarios. \blacksquare

Este es un caso de las leyes de conservación en planificación identificadas por Coffman, Shanthikumar y Yao [20]. La invariancia corresponde a medir cuánto tiempo espera una unidad de trabajo en lugar de cuánto tiempo espera una tarea — el estadístico no ponderado cuenta finalizaciones en vez de trabajo, razón por la cual es manipulable. (Véase también Little [3, 4] para el contexto de la teoría de colas, con la advertencia de que la Ley de Little se aplica directamente solo a sistemas en estado estacionario, no al caso por lotes analizado aquí.)

3.3 Ejemplo ilustrativo

Dos tareas: A con p_A = 1 hora, B con p_B = 10 horas.

Calendario C_A C_B Media no ponderada Media ponderada por trabajo
SPT (A primero) 1 11 6.0 111/11 ≈ 10.09
Inverso (B primero) 11 10 10.5 111/11 ≈ 10.09

SPT parece 4.5 horas mejor en la métrica no ponderada, pero proporciona cero mejora en la métrica ponderada por trabajo. La ventaja aparente existe solo porque el estadístico no ponderado permite que una tarea de 1 hora "vote" con el mismo peso que una tarea de 10 horas.


4. Consecuencias para la calidad del servicio

4.1 Inanición de tareas grandes

Teorema 3 (Sesgo de la métrica). Cualquier política de planificación que minimice el tiempo medio de finalización no ponderado necesariamente maximiza el tiempo de finalización de la tarea más grande.

Demostración. SPT coloca la tarea más grande en último lugar. Su tiempo de finalización es igual al tiempo total de procesamiento \sum p_i, que es el máximo tiempo de finalización posible para cualquier tarea individual. Bajo cualquier calendario que no coloque la tarea más grande en último lugar, dicha tarea se completa estrictamente antes. \blacksquare

Esto crea un incentivo de inanición: agentes racionales que optimizan el estadístico no ponderado postergarán indefinidamente las tareas grandes en favor de las pequeñas. Austin [18] identificó este patrón general — que la medición incompleta crea incentivos para optimizar la dimensión medida a expensas de las no medidas — en el contexto de la gestión del rendimiento organizacional. El Teorema 3 proporciona el mecanismo específico para la planificación de tareas.

4.2 Tiempo de finalización máximo para la tarea más grande

Teorema 4 (SPT maximiza de forma única el tiempo de finalización de la tarea más grande). Entre todos los calendarios, SPT es la única política que asigna el máximo tiempo de finalización posible (\sum p_i) a la tarea más grande.

Demostración. SPT ordena las tareas en orden ascendente de p_i, colocando la tarea más grande p_{\max} en la última posición. La última tarea en cualquier calendario tiene un tiempo de finalización de \sum_{i=1}^{n} p_i, que es el máximo que cualquier tarea individual puede recibir. Bajo cualquier calendario que no coloque p_{\max} en último lugar, esta se completa estrictamente antes de \sum p_i. \blacksquare

Corolario 4.1. Un equipo que optimiza el tiempo medio de finalización no ponderado proporcionará sistemáticamente la peor experiencia a los clientes con las necesidades más complejas. Esto no es un efecto secundario — es el mecanismo por el cual la métrica mejora.

Nota sobre las razones de ralentización. SPT en realidad comprime las razones de ralentización (S_i = C_i / p_i) porque las tareas más grandes en posiciones posteriores tienen denominadores grandes que absorben la suma acumulada. Por ejemplo, con las tareas [1, 5, 10]: SPT produce ralentizaciones [1, 1.2, 1.6] (baja varianza) mientras que LPT produce [1, 3, 16] (alta varianza). El perjuicio de SPT a los clientes con tareas grandes no es visible en la razón de ralentización — es visible en el tiempo de finalización absoluto. Esta distinción es importante: la literatura sobre equidad en planificación [21, 22, 23] ha debatido la injusticia de SPT/SRPT principalmente mediante medidas basadas en ralentización, que pueden ocultar la carga de retraso absoluto demostrada a continuación.

4.3 Concentración del retraso

Teorema 5 (SPT concentra el retraso en la tarea más grande). Bajo SPT, la tarea más grande soporta más retraso absoluto que bajo cualquier otro calendario.

Demostración. Defínase el retraso absoluto como \Delta_i = C_i - p_i (tiempo de espera, independiente del tamaño propio). Bajo SPT, la tarea más grande está en la posición n con:

\Delta_{\max\text{-task}}^{\text{SPT}} = C_n - p_n = \sum_{i=1}^{n-1} p_i

Esta es la suma de los tiempos de procesamiento de todas las demás tareas — el máximo retraso posible para cualquier tarea individual. Bajo cualquier calendario donde la tarea más grande no está en último lugar, su retraso es estrictamente menor. Mientras tanto, SPT otorga a la tarea más pequeña retraso cero (\Delta_1^{\text{SPT}} = 0). Toda la carga de espera se transfiere de las tareas pequeñas a las grandes. \blacksquare

SPT minimiza el retraso total (bueno para la eficiencia agregada) concentrando el retraso en las tareas más capaces de absorberlo en términos de razón de ralentización. Pero en términos absolutos — horas de espera — la tarea más grande soporta todo el peso.

4.4 Invariancia del rendimiento

Teorema 6 (Invariancia del rendimiento). El trabajo total completado en cualquier horizonte temporal T es idéntico bajo todas las políticas de planificación.

Demostración. El ejecutor procesa trabajo a una tasa fija. En cualquier horizonte T \ge \sum p_i, el trabajo total realizado es exactamente \sum p_i independientemente del orden. Para el caso de estado estacionario con llegadas continuas, el rendimiento a largo plazo está determinado por la tasa de servicio \mu y es completamente independiente de la planificación:

\lim_{T \to \infty} \frac{W(T)}{T} = \mu \quad \text{for all schedules } \sigma

\blacksquare

Corolario 6.1. Un equipo que cambia de cualquier política de planificación a SPT observará una mejora en el tiempo medio de finalización no ponderado con cero cambio en el rendimiento real. La métrica mejora. La producción no.

4.5 El efecto compuesto

Combinando los Teoremas 4, 5 y 6:

Medida Efecto de optimizar la media no ponderada
Rendimiento (trabajo/tiempo) Sin cambio (Teorema 6)
Retraso para tareas pequeñas Minimizado — se aproxima a cero (SPT)
Retraso para tareas grandes Maximizado — soporta toda la carga de espera (Teorema 5)
Tiempo de finalización de la tarea más grande Máximo posible: \sum p_i (Teorema 4)

El efecto neto sobre la calidad percibida es negativo porque:

  1. La aversión a la pérdida es asimétrica [8]. Un cliente cuya tarea de 100 horas es desprioritizada experimenta un impacto negativo grande y prominente. Un cliente cuya tarea de 1 hora es expedida experimenta un beneficio pequeño y frecuentemente inadvertido.

  2. Las tareas de alto esfuerzo se correlacionan con clientes de alto valor. Las tareas grandes provienen desproporcionadamente de clientes importantes, contratos complejos o necesidades empresariales críticas.

  3. La inanición se acumula. En un sistema continuo (Teorema 3), las tareas grandes pueden ser postergadas indefinidamente a medida que siguen llegando nuevas tareas pequeñas.

Teorema 7 (El resultado central). Para un equipo que procesa tareas de tamaño no uniforme, adoptar el tiempo medio de finalización no ponderado como métrica de rendimiento:

(a) Proporciona cero ganancia de productividad (Teorema 6), mientras que (b) Asigna el máximo tiempo de finalización posible a la tarea más grande (Teorema 4), y (c) Concentra todo el retraso de espera en las tareas más grandes, eliminando el retraso de las más pequeñas (Teorema 5).

Esto no es un compromiso. La métrica crea una transferencia pura de calidad de servicio de los clientes de alto esfuerzo a los clientes de bajo esfuerzo, sin trabajo neto ganado. \blacksquare


Parte II: Sistemas de prioridad

5. Colapso bajo clasificación por prioridad

Las secciones anteriores demostraron que el tiempo medio de finalización no ponderado está sesgado cuando las tareas varían en tamaño. Ahora mostramos que la introducción de un sistema de prioridades — como el que prácticamente todos los equipos reales utilizan — hace que la métrica pase de ser meramente sesgada a ser activamente adversarial respecto a los objetivos declarados de la organización.

5.1 Modelo extendido: tareas con prioridad

Sea cada tarea i con tiempo de procesamiento p_i y una clase de prioridad q_i \in \{1, 2, 3, 4\} donde 1 es la prioridad más alta (crítica) y 4 es la más baja (cosmética/mejora). Asígnense pesos de prioridad:

w(q) = \begin{cases} 8 & q = 1 \text{ (Critical)} \\ 4 & q = 2 \text{ (High)} \\ 2 & q = 3 \text{ (Medium)} \\ 1 & q = 4 \text{ (Low)} \end{cases}

Los pesos específicos son ilustrativos; los resultados se mantienen para cualquier función de pesos estrictamente decreciente. La propiedad clave es que la prioridad se asigna por impacto de negocio, no por tamaño de tarea.

5.2 La métrica contradice el sistema de prioridades

Teorema 8 (Inversión de prioridad-tamaño). Cuando la prioridad es independiente del tamaño de la tarea, el calendario que minimiza el tiempo medio de finalización no ponderado (SPT) completará, en expectativa, las tareas de baja prioridad antes que las tareas de alta prioridad de mayor tamaño.

Demostración. SPT ordena las tareas por p_i ascendente, sin importar q_i. Considérense dos tareas:

  • Tarea A: p_A = 40 horas, q_A = 1 (Crítica — p. ej., caída del servidor)
  • Tarea B: p_B = 0.5 horas, q_B = 4 (Baja — p. ej., corrección cosmética de interfaz)

SPT programa B antes que A. La media no ponderada para este par:

\bar{C}^{\text{SPT}} = \frac{0.5 + 40.5}{2} = 20.5 \qquad \bar{C}^{\text{priority}} = \frac{40 + 40.5}{2} = 40.25

La métrica declara que SPT es casi el doble de bueno — a pesar de completar una corrección cosmética mientras un servidor está caído.

En general, cuando q_i es estadísticamente independiente de p_i, el ordenamiento de SPT tiene correlación cero con la prioridad. En la práctica, las tareas Críticas (interrupciones, incidentes de seguridad, pérdida de datos) frecuentemente requieren más trabajo que las tareas Bajas, por lo que la métrica está plausiblemente anti-correlacionada con el sistema de prioridades. \blacksquare

5.3 Destrucción de información

La media no ponderada reduce una tarea tridimensional (p_i, q_i, C_i) a una señal unidimensional (C_i), y luego promedia uniformemente. Esto descarta la prioridad por completo e invierte implícitamente el tamaño.

Teorema 9 (Destrucción de información). Sea I(\sigma) la información mutua entre la clasificación de prioridad implícita del calendario (posición) y la asignación real de prioridad q_i. Para SPT:

I(\sigma_{\text{SPT}}) = 0 \quad \text{when } p_i \perp q_i

Demostración. SPT asigna posiciones basándose únicamente en p_i. Cuando p_i y q_i son independientes, conocer la posición de una tarea en el calendario SPT proporciona cero información sobre su prioridad. \blacksquare

Corolario 9.1. Un equipo que optimiza el tiempo medio de finalización no ponderado opera un sistema de planificación que no contiene información alguna sobre su propia clasificación de prioridades. El campo de prioridad en su sistema de tickets es, con respecto al orden de ejecución, decorativo.

Este es un caso de lo que Austin [18] denomina el problema fundamental de la medición incompleta: cuando el sistema de medición captura solo un subconjunto de las dimensiones relevantes, optimizar la medición degrada sistemáticamente las dimensiones no medidas.

5.4 Coste de retraso ponderado por prioridad

Defínase el coste de retraso ponderado por prioridad de un calendario:

D(\sigma) = \sum_{i=1}^{n} w(q_i) \cdot C_i

Teorema 10 (SPT y coste de retraso ponderado por prioridad). El calendario óptimo para minimizar D(\sigma) es WSJF: ordenar por w(q_i)/p_i descendente [1, 5]. El ordenamiento de SPT — por 1/p_i descendente — ignora la prioridad por completo y produce un D mayor que las alternativas que respetan la prioridad cuando la prioridad está correlacionada con el tamaño de la tarea.

Demostración. Mediante el argumento de intercambio, el intercambio de tareas adyacentes i, j cambia D en:

\Delta D = w(q_j) \cdot p_i - w(q_i) \cdot p_j

El intercambio mejora D cuando w(q_j)/p_j > w(q_i)/p_i pero j está programada después de i. Por lo tanto, el orden óptimo es w(q_i)/p_i decreciente — la regla WSJF. SPT corresponde a WSJF solo cuando w(q_i) = \text{const} (todas las tareas tienen igual prioridad).

Ejemplo. Crítica (w = 8, p = 3) y Baja (w = 1, p = 2):

  • SPT (Baja primero): D = 1 \cdot 2 + 8 \cdot 5 = 42
  • WSJF (Crítica primero): D = 8 \cdot 3 + 1 \cdot 5 = 29

SPT incurre en un 45% más de retraso ponderado por prioridad. En la práctica, las tareas Críticas tienden a ser más grandes (interrupciones, incidentes de seguridad), haciendo que la divergencia sea sistemática. \blacksquare


6. Soluciones propuestas

6.1 Métricas ponderadas por prioridad

Reemplazar el tiempo medio de finalización no ponderado con la Puntuación de Finalización Ponderada por Prioridad (PWCS):

\text{PWCS}(\sigma) = \frac{\sum_{i=1}^{n} w(q_i) \cdot \frac{C_i}{p_i}}{\sum_{i=1}^{n} w(q_i)}

Esta es la media ponderada por prioridad de la razón de ralentización. Mide cuánto esperó cada tarea en relación con su tamaño, ponderado por la importancia de esa tarea. Menor es mejor.

Propiedades:

  1. Respetuosa con la prioridad. Los retrasos en tareas Críticas cuestan 8 veces más que los retrasos en tareas Bajas.
  2. Justa con el tamaño. Utiliza la razón de ralentización C_i / p_i, de modo que las tareas grandes no son penalizadas por ser grandes.
  3. No manipulable por SPT. Reordenar por tiempo de procesamiento no mejora sistemáticamente la puntuación.
  4. Se reduce a la media no ponderada cuando las tareas son uniformes. Es una generalización estricta.

6.2 Política óptima: WSJF

Teorema 11. El calendario que minimiza el tiempo de finalización ponderado por prioridad \text{PWCT}(\sigma) = \sum w(q_i) \cdot C_i / \sum w(q_i) procesa las tareas en orden decreciente de w(q_i)/p_i — la regla de Trabajo Ponderado más Corto Primero (WSJF) [1, 5].

Demostración. Mediante el argumento de intercambio (como en el Teorema 10), el intercambio de tareas adyacentes i, j mejora el PWCT cuando w(q_j)/p_j > w(q_i)/p_i pero j está programada después de i. Por lo tanto, el orden óptimo es w(q_i)/p_i decreciente. \blacksquare

Dentro de una clase de prioridad, esto se reduce a SPT (la más corta primero). Entre clases, una tarea Crítica de 4 horas (w/p = 2.0) supera a una tarea Baja de 1 hora (w/p = 1.0).

Advertencia práctica. El WSJF puro puede colocar tareas diminutas de prioridad Baja por delante de tareas Críticas grandes (una tarea Baja de 15 minutos tiene w/p = 1/0.25 = 4.0, superando a una Crítica de 6 horas con w/p = 8/6 = 1.33). En la práctica, esto se mitiga imponiendo un ordenamiento estricto por clase de prioridad y aplicando WSJF solo dentro de cada clase.

6.3 Ejemplo aplicado: mesa de servicio de TI

Considérese un equipo de TI con la siguiente cola de tickets:

Ticket Prioridad Tipo Horas est.
T1 P1 (Crítica) Servidor de correo caído 6
T2 P2 (Alta) VPN fallando para equipo remoto 4
T3 P3 (Media) Configuración de portátil para nuevo empleado 2
T4 P4 (Baja) Actualizar política de fondo de escritorio 0.5
T5 P3 (Media) Instalar licencia de software 1
T6 P1 (Crítica) Respaldo de base de datos fallando 3
T7 P2 (Alta) Flota de impresoras fuera de línea 2
T8 P4 (Baja) Archivar carpeta antigua de unidad compartida 0.25

Orden SPT (optimizando la media no ponderada): T8, T4, T5, T3, T7, T6, T2, T1

Pos Ticket Prioridad Horas Finalización Ralentización
1 T8 (archivar carpeta) P4 Baja 0.25 0.25 1.0
2 T4 (fondo de escritorio) P4 Baja 0.5 0.75 1.5
3 T5 (software) P3 Media 1 1.75 1.75
4 T3 (portátil) P3 Media 2 3.75 1.875
5 T7 (impresoras) P2 Alta 2 5.75 2.875
6 T6 (respaldos) P1 Crítica 3 8.75 2.917
7 T2 (VPN) P2 Alta 4 12.75 3.188
8 T1 (correo) P1 Crítica 6 18.75 3.125

WSJF práctico (prioridad de clase primero, SPT dentro de cada clase):

Pos Ticket Prioridad Horas Finalización
1 T6 (respaldos) P1 Crítica 3 3
2 T1 (correo) P1 Crítica 6 9
3 T7 (impresoras) P2 Alta 2 11
4 T2 (VPN) P2 Alta 4 15
5 T5 (software) P3 Media 1 16
6 T3 (portátil) P3 Media 2 18
7 T8 (archivo) P4 Baja 0.25 18.25
8 T4 (fondo de escritorio) P4 Baja 0.5 18.75

Comparación:

Métrica SPT WSJF práctico Ganador
Media de finalización no ponderada 6.56 hrs 13.63 hrs SPT
Tiempo medio de resolución P1 13.75 hrs 6 hrs WSJF
Tiempo medio de resolución P2 9.25 hrs 13 hrs SPT
Tiempo para reparar servidor de correo 18.75 hrs 9 hrs WSJF
Tiempo para reparar respaldos de BD 8.75 hrs 3 hrs WSJF
Tiempo para actualizar fondo de escritorio 0.75 hrs 18.75 hrs SPT

Los tiempos de finalización ponderados por prioridad agregados son casi idénticos (PWCT: 10.2 vs 10.17) porque la agregación oculta el daño distribucional. La diferencia real está en el desglose por clase de prioridad: el servidor de correo está caído durante 18.75 horas bajo SPT frente a 9 horas bajo WSJF. Los respaldos de base de datos fallan durante 8.75 horas frente a 3.

La métrica no ponderada reporta con confianza que SPT es más del doble de eficiente (6.56 vs 13.63), premiando al equipo que actualizó el fondo de escritorio mientras el servidor de correo estaba en llamas.

6.4 Conjunto de métricas recomendado

Incluso las métricas agregadas ponderadas por prioridad pueden fallar en distinguir buenos de malos calendarios, porque la agregación oculta el daño distribucional. Ninguna métrica individual es suficiente. Un sistema de medición completo debe rastrear:

Métrica Qué mide Fórmula
Media de finalización por clase de prioridad Capacidad de respuesta por clase \bar{C} filtrado por q
Tiempo medio de resolución P1 Respuesta a incidentes críticos \bar{C} para q = 1
Rendimiento Capacidad bruta de trabajo Horas-trabajo completadas / tiempo calendario
Violaciones por antigüedad Prevención de inanición Tareas que exceden el SLA por prioridad
Tiempo máximo de finalización (P1/P2) Peor caso de respuesta crítica \max(C_i) para q \le 2

La idea clave: las métricas por clase de prioridad exponen fallos de planificación que las métricas agregadas ocultan.


Parte III: Dinámicas organizacionales

7. Cuando la métrica es el producto

Las Secciones 26 suponen que la satisfacción del cliente es una función de la calidad de servicio experimentada. Pero existe un escenario en el que este supuesto falla y todo el argumento se derrumba.

7.1 La métrica autorreferencial

Supóngase que el proveedor reporta la media no ponderada directamente al cliente — en un panel de control, en un informe de SLA, en una página de marketing — y que la satisfacción del cliente se deriva principalmente de ese número:

U_{\text{client}} = f\!\left(\bar{C}(\sigma)\right), \quad f' < 0

Bajo este modelo, SPT genuinamente maximiza la satisfacción del cliente (Teorema 1). El rendimiento no cambia (Teorema 6). El resultado de negocio mejora: mismo trabajo realizado, cliente más satisfecho.

Todos los teoremas de este artículo siguen siendo matemáticamente correctos. Pero la conclusión se invierte. La métrica ya no es un proxy que pueda ser manipulado — ella es la calidad del servicio, porque el cliente ha aceptado evaluar la calidad mediante el número agregado.

7.2 La economía

Esto crea un equilibrio coherente y estable:

Actor Comportamiento Resultado
Proveedor Optimiza la media no ponderada (SPT) La métrica mejora, sin trabajo extra
Cliente Lee el panel de control, ve un promedio bajo Reporta satisfacción
Gerencia Ve cliente satisfecho + buena métrica Recompensa al equipo

El proveedor extrae satisfacción a coste marginal cero, optimizando un número que el cliente ha aceptado como proxy de calidad.

7.3 La fragilidad

Este equilibrio es estable solo mientras el cliente nunca inspeccione su propia experiencia. Se rompe cuando:

  1. El cliente revisa su propio ticket. Un CTO cuyo servidor de correo estuvo caído 18.75 horas no se tranquilizará con "Resolución promedio: 6.56 horas." Los clientes más propensos a inspeccionar son exactamente los que reciben el peor servicio (Teorema 4).

  2. Un competidor ofrece SLAs por ticket. "P1 resuelto en 4 horas" supera a "resolución promedio inferior a 7 horas" para cualquier cliente con necesidades críticas.

  3. El equipo internaliza la métrica. Si el equipo cree que la métrica refleja el rendimiento real, pierde la capacidad de reconocer cuándo se descuida el trabajo crítico. La métrica se convierte en un peligro epistémico.

7.4 El patrón general

Este patrón — el proxy reemplaza la calidad, el proxy se optimiza, la calidad diverge, el sistema es estable hasta que la realidad lo pone a prueba — se repite en múltiples dominios. Muller [19] lo documenta extensamente como "fijación métrica"; Campbell [24] formalizó el efecto corruptor de usar indicadores como objetivos.

Dominio Métrica proxy Calidad subyacente Divergencia
Soporte de TI Tiempo medio de resolución Disponibilidad de sistemas críticos Servidor caído 19 hrs, el promedio dice 6.5
Educación Calificaciones de exámenes Aprendizaje real Enseñar para el examen
Salud Rendimiento de pacientes Resultados de salud Altas más rápidas, mayor reingreso
Finanzas Ganancias trimestrales Valor a largo plazo Recorte de costes infla BPA, erosiona capacidad
Software Velocidad (puntos de historia) Calidad del producto Inflación de puntos, funcionalidades a medio terminar

7.5 Asimetría de información

Modélese el sistema como un juego entre el proveedor (P) y el cliente (C). P observa los \{C_i\} individuales y elige \sigma; C observa únicamente \bar{C}(\sigma). Este es un problema de riesgo moral [10]: la estrategia óptima de P es minimizar la señal observable sin importar la distribución no observable.

El equilibrio es un equilibrio agrupador [9]: la métrica reportada por P es idéntica independientemente del rendimiento ponderado por prioridad subyacente. Es estable hasta que C obtiene acceso a los valores individuales de C_i — mediante un portal de cliente, la transparencia de un competidor, o un incidente suficientemente doloroso.

7.6 La conclusión incómoda

La respuesta honesta a "¿optimizar la media no ponderada perjudica al negocio?" es: no necesariamente, siempre y cuando el cliente nunca mire detrás del número. La respuesta honesta a "¿es esto sostenible?" es: es exactamente tan sostenible como cualquier sistema en el que el vendedor sabe más que el comprador — estable durante períodos prolongados, luego colapso rápido cuando la asimetría se rompe.


8. El coste psicológico de saber

La Sección 7 modeló al proveedor como un actor unitario. Pero los equipos están compuestos por individuos. Cuando un miembro del equipo comprende la demostración — cuando sabe que la métrica es sintética, que el panel de control es teatro, que el servidor de correo sigue caído mientras cierra tickets de fondo de escritorio — aparece un nuevo coste que el modelo de equilibrio omitió.

8.1 La variable oculta: conciencia del equipo

Actor Observa C_i individuales Observa \bar{C} Comprende la demostración
Gerencia Posiblemente Variable
Miembro del equipo (en este escenario)
Cliente No No

El miembro del equipo tiene información completa. Ve la cola de tickets. Sabe que el servidor de correo ha estado caído desde las 7 AM. Sabe que está cerrando un ticket de fondo de escritorio porque mejora el número. Y sabe por qué.

8.2 Disonancia cognitiva bajo información completa

La disonancia cognitiva [11] surge cuando un individuo sostiene cogniciones contradictorias. Sin comprender el por qué, la contradicción puede racionalizarse: "la gerencia sabe más." Comprender la demostración elimina la ambigüedad. El miembro del equipo ahora sostiene:

  • Cognición A: "Soy un profesional competente. Mi trabajo es resolver problemas importantes."
  • Cognición B: "Estoy cerrando un ticket de fondo de escritorio mientras el servidor de correo está caído, porque la métrica es matemáticamente sesgada (Teorema 1), la reordenación produce cero rendimiento (Teorema 6), y el único beneficiario es el panel de control (Sección 7). Puedo demostrarlo."

La disonancia es ahora estructural. Las resoluciones disponibles — abandonar la identidad profesional, rechazar la demostración, abogar por el cambio, o irse — cada una impone costes que no existían antes.

8.3 Teoría de la Autodeterminación: tres necesidades violadas

La Teoría de la Autodeterminación de Deci y Ryan [12, 13] identifica tres necesidades que predicen la motivación intrínseca:

Autonomía. La métrica restringe las decisiones de una manera que el miembro del equipo sabe que es matemáticamente subóptima. Un trabajador que comprende que el proceso es demostrablemente contraproducente no puede sentirse autónomo siguiéndolo.

Competencia. La métrica recompensa la efectividad aparente (bajo \bar{C}) mientras es invariante a la efectividad real (Teorema 6). La competencia genuina — reparar primero el servidor de correo — es castigada por la métrica.

Vinculación. El miembro del equipo sabe que el servidor de correo del cliente está caído. Podría ayudar. En cambio, está actualizando el fondo de escritorio — no porque ayude a alguien, sino porque ayuda a un número. La conexión entre el trabajo y el impacto humano ha sido cortada, y el miembro del equipo puede ver los extremos cortados.

8.4 Daño moral

El daño moral [16, 17] es el perjuicio duradero causado por "perpetrar, no prevenir, presenciar o enterarse de actos que transgreden creencias morales profundamente arraigadas" [17]. Desde entonces se ha extendido a entornos empresariales [25]. La distinción clave respecto al agotamiento: el agotamiento es extenuación por hacer demasiado. El daño moral es perjuicio por hacer lo incorrecto.

Un miembro del equipo que sabe que el servidor de correo está caído, sabe que debería repararlo, cierra un ticket de fondo de escritorio en su lugar, y lo hace porque la métrica lo exige, está experimentando las condiciones estructurales para el daño moral.

8.5 Indefensión aprendida y fatalismo métrico

La indefensión aprendida de Seligman [14, 15] describe cómo la exposición a resultados negativos incontrolables conduce a la pasividad. La secuencia:

  1. La métrica es defectuosa (demostración comprendida).
  2. Abogar por el cambio.
  3. Rechazado ("los números son buenos, no causes problemas").
  4. Repetir con convicción decreciente.
  5. Estado terminal: "La métrica es lo que es. Solo cerraré tickets."

Esto no es pereza. Es la respuesta racional a un sistema que castiga el comportamiento correcto y recompensa el comportamiento incorrecto, cuando el individuo carece de poder para cambiar el sistema.

8.6 La espiral de selección adversa

Combinando el equilibrio de la Sección 7 con la dinámica de rotación:

  1. La organización adopta la media no ponderada. La métrica se ve bien (SPT).
  2. Los miembros del equipo conscientes y competentes experimentan costes psicológicos (8.28.5).
  3. Esos miembros se van. Son reemplazados por miembros que no comprenden los defectos de la métrica o a quienes no les importa.
  4. La métrica sigue viéndose bien — siempre lo hace bajo SPT, independientemente de la competencia del equipo (Corolario 6.1).
  5. La calidad real del servicio se degrada, pero la métrica no puede detectarlo (Corolario 9.1).
  6. Volver al paso 1.

La métrica selecciona en contra de las personas que mejorarían el sistema y a favor de las personas que no lo cuestionarán. El sistema se estabiliza en un nivel inferior de competencia, invisible para su propio aparato de medición.

8.7 El modelo de coste completo

Sección 7 (visible) Sección 8 (oculto)
Cliente satisfecho (buen número) Equipo insatisfecho (mala realidad)
Rendimiento sin cambios Esfuerzo discrecional retirado
La métrica mejora Los miembros competentes se van
Economía de negocio estable La competencia institucional se degrada

Estos operan en escalas temporales diferentes: el equilibrio es visible trimestralmente; la degradación de competencia es visible a lo largo de años. El modelo completo es: la métrica funciona, y es destructiva, y la destrucción es invisible para la métrica. La métrica es pintura fresca sobre acero corrugado corroído.


9. Internalización por parte del gerente: la solución accionable

Las Secciones 26 dicen rechazar la métrica. La Sección 7 dice que la métrica funciona (para el negocio). La Sección 8 dice que destruye al equipo. En la práctica, la mayoría de los gerentes no pueden cambiar unilateralmente la métrica. La mejor solución es la reforma métrica a nivel de toda la empresa. La solución accionable es lo que un solo gerente informado puede hacer ahora mismo.

9.1 La estrategia

Un gerente que comprende la demostración puede internalizar las limitaciones de la métrica sin propagarlas al equipo:

  1. Planificar principalmente por prioridad. El equipo trabaja primero las tareas críticas.
  2. Intercalar tácticamente tareas pequeñas. Cuando una tarea pequeña de baja prioridad puede completarse sin retrasar materialmente el trabajo de alta prioridad, hacerla. No porque la métrica lo exija, sino porque también necesita hacerse y cuesta casi nada.
  3. Nunca revelar la métrica como la motivación. "Despacha esta rápida mientras esperamos la llamada del proveedor por el P1" — no "necesitamos bajar nuestro promedio." La motivación intrínseca del equipo permanece intacta (Sección 8). El gerente absorbe la carga de gestión de la métrica.

9.2 Formalización

El problema del gerente es una optimización restringida:

\min_{\sigma} \sum_{i=1}^{n} w(q_i) \cdot C_i \quad \text{subject to} \quad \bar{C}(\sigma) \le \bar{C}_{\text{target}}

Teorema 12 (Coste métrico acotado de la planificación por prioridad). Un gerente que usa SPT dentro de cada clase de prioridad y ordenamiento por prioridad entre clases producirá una métrica cercana al valor SPT-óptimo — la brecha surge únicamente de las inversiones entre clases.

Bosquejo de demostración. Dentro de cada clase de prioridad, SPT es gratuito (todas las tareas tienen igual prioridad). La única desviación del SPT global es el ordenamiento entre clases. Cada inversión entre clases cuesta a lo sumo p_{\text{large}} - p_{\text{small}} en la suma no ponderada, y estas inversiones están acotadas por el número de clases. En la práctica, la brecha está típicamente dentro del 1020% del óptimo SPT. \blacksquare

9.3 El gerente como barrera de información

Capa Ve la métrica Ve las prioridades Ve la demostración
Organización Nominalmente No
Gerente
Equipo No (protegido) Irrelevante
Cliente Sí (panel de control) Vía SLA No

El gerente es el único actor que posee las tres piezas de información. Esto no es manipulación — están haciendo el trabajo correcto en el orden correcto, y la métrica resulta ser aceptable porque el SPT dentro de cada clase es gratuito.

9.4 El colapso competitivo

Esta estrategia falla cuando la métrica se convierte en competitiva entre equipos.

Caso 1: Cooperativo — Los equipos se miden por paridad, no por clasificación. Cada gerente usa independientemente la estrategia de internalización. La métrica es decorativa pero inofensiva. Este es un juego de coordinación con un equilibrio cooperativo estable.

Caso 2: Competitivo — Los equipos se clasifican por \bar{C}. Este es un dilema del prisionero:

Equipo B: prioridad primero Equipo B: SPT
Equipo A: prioridad primero (Buen trabajo, Buen trabajo) (A se ve mal, B se ve bien)
Equipo A: SPT (A se ve bien, B se ve mal) (Ambos se ven bien, ambos hacen mal trabajo)

El equilibrio de Nash es (SPT, SPT). La estrategia de internalización es un equilibrio cooperativo que no es estable bajo competencia.

9.5 Alcance

Condición Viabilidad
Métrica usada para verificación de salud / paridad Viable
Métrica visible pero no clasificada Viable
Métrica clasificada entre equipos Frágil — requiere que todos los gerentes cooperen
Métrica vinculada a compensación / recursos No viable — el dilema del prisionero domina
Reforma métrica posible a nivel organizacional Innecesaria — corregir la métrica en su lugar

La mejor solución es a nivel de toda la empresa. La solución accionable es un gerente que comprende esta demostración, protege a su equipo de la métrica, planifica por prioridad, y usa SPT solo dentro de las clases de prioridad para mantener el número en un rango razonable.


Parte IV: Evaluación

10. Abogado del diablo

La honestidad intelectual exige reconocer dónde tiene límites el argumento.

10.1 La simplicidad tiene valor real

Argumento. La media no ponderada no requiere pesos de prioridad, ni estimaciones de tamaño de tarea, ni calibración.

Evaluación: Verdadero. Pero la métrica no ponderada no evita supuestos — los oculta al establecer implícitamente todos los pesos en 1 y todos los tamaños en 1. Una estimación de tamaño de tarea conocidamente imprecisa es aún más informativa que el supuesto implícito de que todos los tamaños son iguales.

10.2 Minimizar el número de personas esperando

Argumento. SPT minimiza el total de horas-persona de espera. Si cada tarea representa un cliente, esto es óptimo.

Evaluación: Matemáticamente correcto. Si se opera una oficina de atención y el tiempo de cada persona es igualmente valioso, SPT es la política correcta. Falla cuando las tareas no tienen correspondencia 1:1 con los clientes, el coste de espera no es uniforme, o la métrica se usa para evaluar equipos en lugar de atender una cola literal.

10.3 SPT como heurística de triaje

Argumento. Cuando los tamaños de tarea se agrupan estrechamente, SPT aproxima FIFO y la media no ponderada aproxima la media ponderada.

Evaluación: Correcto. El coeficiente de variación CV = \sigma_p / \bar{p} determina la gravedad de la distorsión:

CV Distribución de tamaños Distorsión
< 0.3 Estrecha (centro de llamadas) Despreciable
0.3 1.0 Moderada (TI mixta) Moderada
> 1.0 Amplia (cola típica de TI) Severa

Una mesa de servicio de TI típica abarca de 15 minutos a más de 40 horas (CV > 2). La distorsión no es un caso marginal — es el caso por defecto.

10.4 La manipulación requiere malicia

Argumento. Los teoremas muestran que la métrica puede ser manipulada, no que será manipulada.

Evaluación: Este es el contraargumento más fuerte. Si la métrica es puramente informacional y nunca influye en el comportamiento, el incentivo de manipulación está ausente. Sin embargo, cualquier métrica reportada a la gerencia, vinculada a OKRs, o discutida en retrospectivas influirá en el comportamiento. Esta es la Ley de Goodhart [6, 7] — y se aplica a equipos bienintencionados con la misma fiabilidad que a los cínicos. La deriva ocurre orgánicamente: completar tres tickets fáciles "se siente productivo" mientras la métrica valida la sensación.

10.5 Cuándo la media no ponderada es defendible

La métrica es defendible solo cuando se cumplen las cuatro condiciones:

  1. Los tamaños de tarea son aproximadamente uniformes (CV < 0.3)
  2. No hay diferenciación de prioridad (todas las tareas igualmente importantes)
  3. Cada tarea representa exactamente un cliente
  4. La métrica no se usa para evaluar, recompensar ni dirigir el comportamiento

Estas condiciones rara vez se cumplen en los sistemas donde la métrica se utiliza con mayor frecuencia.


11. Trabajo relacionado

Este artículo se sitúa en la intersección de varias literaturas que no habían sido conectadas previamente.

11.1 Teoría de planificación y equidad

Smith [1] estableció el resultado de optimalidad de SPT y la regla WSJF en 1956. Conway, Maxwell y Miller [2] proporcionaron el tratamiento de libro de texto exhaustivo. La equidad de las políticas de planificación basadas en tamaño ha sido debatida en la planificación de sistemas informáticos: Bansal y Harchol-Balter [22] investigaron la injusticia de SRPT; Wierman y Harchol-Balter [23] formalizaron clasificaciones de equidad contra Processor-Sharing; Angel, Bampis y Pascual [21] midieron la calidad de los calendarios SPT contra criterios de optimalidad justa.

Este trabajo previo analiza la equidad en la planificación de CPUs y servidores. El presente artículo aplica los mismos resultados matemáticos a la gestión organizacional de tareas, donde el "planificador" es un equipo humano, los "trabajos" son solicitudes de clientes con prioridades de impacto de negocio, y la "función objetivo" es una métrica de gestión. El mecanismo es idéntico; las consecuencias difieren porque la planificación organizacional tiene sistemas de prioridades, relaciones con clientes y costes psicológicos que la planificación de CPUs no tiene.

11.2 Disfunción de la medición

Austin [18] demostró que la medición incompleta — medir solo un subconjunto de las dimensiones relevantes — crea incentivos para optimizar las dimensiones medidas a expensas de las no medidas, y que este efecto no es meramente posible sino inevitable cuando la medición está vinculada a recompensas. Su enfoque de asimetría de información es estrechamente paralelo a la Sección 7. El presente artículo proporciona el mecanismo matemático específico (Teoremas 12) para el caso de la planificación de tareas, y extiende el argumento a través de la psicología (Sección 8) para trazar la cadena completa de daño organizacional.

Muller [19] documentó la "fijación métrica" en educación, salud, policía y finanzas, proporcionando evidencia empírica extensa para los patrones teorizados en la Sección 7.4. Campbell [24] formalizó el efecto corruptor de usar indicadores como objetivos, complementando la observación original de Goodhart [6] y la generalización de Strathern [7].

Bevan y Hood [26] documentaron empíricamente los comportamientos de manipulación en el sistema público de salud inglés — incluyendo los patrones exactos de "cumplir el objetivo y perder el sentido" descritos en nuestra Sección 5.2.

11.3 Costes psicológicos de la disfunción métrica

La aplicación del daño moral (Shay [16], Litz et al. [17]) a entornos empresariales tiene precedente reciente: un estudio de 2024 en el Journal of Business Ethics [25] extendió explícitamente el constructo a lugares de trabajo con fines de lucro, encontrando condiciones estructurales similares a las descritas en la Sección 8.4. Moore [27] analizó el desvinculamiento moral — la reestructuración cognitiva que posibilita el comportamiento poco ético bajo presión organizacional. El presente artículo aborda el fenómeno complementario: el daño a los individuos que se niegan a desvincularse.

11.4 Qué es novedoso

Los componentes individuales — la optimalidad de SPT, la Ley de Goodhart, la disfunción de la medición, el daño moral — todos tienen precedentes. Las contribuciones de este artículo son:

  1. La ley de conservación (Teorema 2) utilizada de forma prescriptiva — como un argumento constructivo de que el tiempo de finalización ponderado por trabajo no puede ser manipulado, en lugar de como un resultado teórico de planificación.

  2. La demostración específica de que las clases de prioridad hacen que la métrica sea algebraicamente adversarial (Teoremas 89) — no meramente empíricamente mala sino estructuralmente contradictoria, con cero información mutua entre el calendario y el sistema de prioridades.

  3. La cadena integrada desde la demostración matemática, pasando por la asimetría de información, el daño psicológico y la espiral de selección adversa — trazando una única métrica desde Smith (1956) hasta el vaciamiento organizacional.

  4. La estrategia de internalización del gerente (Sección 9) con un análisis formal de teoría de juegos de su estabilidad y condiciones de colapso bajo competencia entre equipos.

  5. La aplicación de la teoría de planificación a la crítica de la gestión organizacional — demostrando que una métrica de equipo comúnmente utilizada tiene patologías específicas y cuantificables, en lugar de argumentar desde la anécdota o el principio general.


12. Conclusión

El tiempo medio de finalización no ponderado es un estadístico sesgado que:

  1. Puede ser manipulado mediante la política de planificación (Teorema 1), a diferencia del tiempo de finalización ponderado por trabajo que es invariante respecto al calendario (Teorema 2).
  2. Incentiva la inanición de tareas grandes (Teorema 3).
  3. Degrada la satisfacción del cliente sin ganancia compensatoria de productividad (Teorema 7).
  4. Contradice activamente los sistemas de prioridad al no contener información alguna sobre la clasificación de impacto de negocio (Teorema 9).
  5. Ignora la prioridad por completo en su recomendación de planificación, produciendo un retraso ponderado por prioridad subóptimo siempre que la prioridad y el tamaño no estén perfectamente inversamente correlacionados (Teorema 10).

Una métrica que puede mejorarse reordenando el trabajo — sin realizar ningún trabajo adicional — está midiendo la política de planificación, no la capacidad del sistema. Cuando se combina con un sistema de prioridades, recomienda el calendario que inflige el mayor daño al trabajo de más alta prioridad.

Cuando la métrica se reporta a los clientes, crea una asimetría de información (Sección 7) cuyo equilibrio de negocio es rentable pero frágil. Cuando los miembros del equipo comprenden sus defectos, viola su motivación intrínseca y selecciona la partida de las personas más competentes (Sección 8). Un solo gerente informado puede mitigar parcialmente estos efectos mediante optimización restringida (Sección 9), pero esta estrategia cooperativa no es estable bajo competencia entre equipos.

La media no ponderada es defendible solo bajo condiciones estrechas (Sección 10.5): tamaños de tarea uniformes, sin prioridades, correspondencia uno a uno entre cliente y tarea, y sin influencia conductual. Estas condiciones rara vez se cumplen.

El tiempo medio de finalización no ponderado no es una medida justa ni precisa del rendimiento en la ejecución de tareas. Su adopción como métrica de equipo producirá racionalmente inanición de trabajo complejo, violación de prioridades declaradas, resultados inequitativos para los clientes, y la ilusión de productividad donde no existe ninguna.

La mejor solución es la reforma métrica organizacional. La solución accionable es un gerente que comprende esta demostración.


Referencias

Scheduling Theory

[1] Smith, W. E. (1956). Various optimizers for single-stage production. Naval Research Logistics Quarterly, 3(12), 5966. doi:10.1002/nav.3800030106

Origen del resultado de optimalidad de SPT (Teorema 1), la regla de tiempo de finalización ponderado w_i/p_i descendente (WSJF, Teorema 11), y la técnica de demostración por intercambio de pares adyacentes (argumento de intercambio) utilizada a lo largo del artículo.

[2] Conway, R. W., Maxwell, W. L., & Miller, L. W. (1967). Theory of Scheduling. Addison-Wesley.

Tratamiento de libro de texto estándar de la teoría de planificación de máquina única, extendiendo los resultados de Smith.

[3] Little, J. D. C. (1961). A proof for the queuing formula: L = λW. Operations Research, 9(3), 383387. doi:10.1287/opre.9.3.383

Primera demostración rigurosa de la Ley de Little. Referenciada en la Sección 3.2 para el contexto de la teoría de colas.

[4] Little, J. D. C. (2011). Little's Law as viewed on its 50th anniversary. Operations Research, 59(3), 536549. doi:10.1287/opre.1110.0941

Retrospectiva que discute el alcance, las limitaciones y las aplicaciones erróneas comunes.

[5] Reinertsen, D. G. (2009). The Principles of Product Development Flow: Second Generation Lean Product Development. Celeritas Publishing. ISBN: 978-0-9844512-0-8.

Popularizó WSJF y "Coste de Retraso / Duración" en contextos ágiles/lean. La base matemática es Smith (1956) [1].

Measurement and Incentives

[6] Goodhart, C. A. E. (1984). Problems of monetary management: The U.K. experience. In Monetary Theory and Practice (pp. 91121). Macmillan.

Fuente de la Ley de Goodhart: "Toda regularidad estadística observada tenderá a colapsar una vez que se ejerza presión sobre ella con fines de control."

[7] Strathern, M. (1997). 'Improving ratings': Audit in the British university system. European Review, 5(3), 305321. doi:10.1002/(SICI)1234-981X(199707)5:3<305::AID-EURO184>3.0.CO;2-4

Generalizó la Ley de Goodhart: "Cuando una medida se convierte en un objetivo, deja de ser una buena medida."

Behavioral Economics

[8] Kahneman, D., & Tversky, A. (1979). Prospect theory: An analysis of decision under risk. Econometrica, 47(2), 263292. doi:10.2307/1914185

Estableció la aversión a la pérdida. Referenciada en la Sección 4.5.

Game Theory and Contract Theory

[9] Akerlof, G. A. (1970). The market for "lemons": Quality uncertainty and the market mechanism. The Quarterly Journal of Economics, 84(3), 488500. doi:10.2307/1879431

Asimetría de información y selección adversa. El equilibrio agrupador de la Sección 7.5 es estructuralmente análogo.

[10] Hölmstrom, B. (1979). Moral hazard and observability. The Bell Journal of Economics, 10(1), 7491. doi:10.2307/3003320

Tratamiento formal del riesgo moral. El escenario de reporte de métricas de la Sección 7.5 es un problema de riesgo moral.

Psychology

[11] Festinger, L. (1957). A Theory of Cognitive Dissonance. Stanford University Press. ISBN: 978-0-8047-0131-0.

Teoría fundacional. Referenciada en la Sección 8.2.

[12] Deci, E. L., & Ryan, R. M. (1985). Intrinsic Motivation and Self-Determination in Human Behavior. Plenum Press. ISBN: 978-0-306-42022-1.

Tratamiento original de la Teoría de la Autodeterminación. Referenciada en la Sección 8.3.

[13] Ryan, R. M., & Deci, E. L. (2000). Self-determination theory and the facilitation of intrinsic motivation, social development, and well-being. American Psychologist, 55(1), 6878. doi:10.1037/0003-066X.55.1.68

Resumen de la Teoría de la Autodeterminación que vincula la satisfacción de necesidades con la motivación intrínseca y el bienestar.

[14] Seligman, M. E. P., & Maier, S. F. (1967). Failure to escape traumatic shock. Journal of Experimental Psychology, 74(1), 19. doi:10.1037/h0024514

Demostración original de la indefensión aprendida. Referenciada en la Sección 8.5.

[15] Seligman, M. E. P. (1975). Helplessness: On Depression, Development, and Death. W. H. Freeman. ISBN: 978-0-7167-0752-3.

Tratamiento extendido que conecta la indefensión aprendida con la depresión humana y el comportamiento institucional.

[16] Shay, J. (1994). Achilles in Vietnam: Combat Trauma and the Undoing of Character. Atheneum / Simon & Schuster. ISBN: 978-0-689-12182-3.

Introdujo el concepto de daño moral. Referenciado en la Sección 8.4.

[17] Litz, B. T., Stein, N., Delaney, E., Lebowitz, L., Nash, W. P., Silva, C., & Maguen, S. (2009). Moral injury and moral repair in war veterans: A preliminary model and intervention strategy. Clinical Psychology Review, 29(8), 695706. doi:10.1016/j.cpr.2009.07.003

Formalizó el daño moral como constructo clínico. Definición citada en la Sección 8.4.

Organizational Measurement

[18] Austin, R. D. (1996). Measuring and Managing Performance in Organizations. Dorset House. ISBN: 978-0-932633-36-1.

Demostró que la medición incompleta crea inevitablemente incentivos para optimizar las dimensiones medidas a expensas de las no medidas. El enfoque de asimetría de información es estrechamente paralelo a la Sección 7. El predecesor más importante del argumento de este artículo.

[19] Muller, J. Z. (2018). The Tyranny of Metrics. Princeton University Press. ISBN: 978-0-691-17495-2.

Tratamiento exhaustivo de la "fijación métrica" en educación, salud, policía y finanzas. Evidencia empírica extensa para los patrones teorizados en la Sección 7.4.

Scheduling Fairness

[20] Coffman, E. G., Shanthikumar, J. G., & Yao, D. D. (1992). Multiclass queueing systems: Polymatroid structure and optimal scheduling control. Operations Research, 40(S2), S293S299.

Leyes de conservación en planificación. La invariancia respecto al calendario del tiempo de finalización ponderado por trabajo (Teorema 2) es un caso de estas leyes de conservación.

[21] Angel, E., Bampis, E., & Pascual, F. (2008). How good are SPT schedules for fair optimality criteria? Annals of Operations Research, 159(1), 5364. doi:10.1007/s10479-007-0267-0

Mide directamente la calidad de los calendarios SPT contra criterios de equidad. El predecesor más cercano en la teoría de planificación al análisis de equidad de la Sección 4.

[22] Bansal, N., & Harchol-Balter, M. (2001). Analysis of SRPT scheduling: Investigating unfairness. ACM SIGMETRICS Performance Evaluation Review, 29(1), 279290. doi:10.1145/384268.378792

Investiga la creencia de que SRPT penaliza injustamente a los trabajos grandes en la planificación informática. Argumenta que la injusticia es menor de lo que se creía pero reconoce la tensión fundamental.

[23] Wierman, A., & Harchol-Balter, M. (2003). Classifying scheduling policies with respect to unfairness in an M/GI/1. ACM SIGMETRICS Performance Evaluation Review, 31(1), 238249.

Formaliza las definiciones de equidad para políticas de planificación mediante comparación con Processor-Sharing.

Additional References

[24] Campbell, D. T. (1979). Assessing the impact of planned social change. Evaluation and Program Planning, 2(1), 6790. doi:10.1016/0149-7189(79)90048-X

Ley de Campbell: "Cuanto más se utilice cualquier indicador social cuantitativo para la toma de decisiones sociales, más sujeto estará a presiones de corrupción y más propenso será a distorsionar y corromper los procesos sociales que pretende monitorear." Complementa la Ley de Goodhart [6].

[25] Ferreira, C. M., et al. (2024). It's business: A qualitative study of moral injury in business settings. Journal of Business Ethics. doi:10.1007/s10551-024-05615-0

Extiende el daño moral a lugares de trabajo con fines de lucro. Valida la aplicación de la Sección 8.4 de Shay/Litz más allá de entornos militares y de salud.

[26] Bevan, G., & Hood, C. (2006). What's measured is what matters: Targets and gaming in the English public health care system. Public Administration, 84(3), 517538. doi:10.1111/j.1467-9299.2006.00600.x

Documenta empíricamente los comportamientos de manipulación, incluyendo "cumplir el objetivo y perder el sentido." Proporciona evidencia del mundo real para la contradicción métrica-prioridad de la Sección 5.2.

[27] Moore, C. (2012). Why employees do bad things: Moral disengagement and unethical organizational behavior. Personnel Psychology, 65(1), 148. doi:10.1111/j.1744-6570.2011.01237.x

Analiza el desvinculamiento moral — la reestructuración cognitiva que posibilita el comportamiento poco ético. La Sección 8 aborda el fenómeno complementario: el daño a los individuos que se niegan a desvincularse.


Esta demostración fue desarrollada de forma conversacional y formalizada el 28-03-2026.