artículo4

Los secretos que la analítica de datos te puede revelar sobre tu gestión de los Recursos Humanos

Compartir en facebook
Facebook
Compartir en twitter
Twitter
Compartir en linkedin
LinkedIn
Compartir en whatsapp
WhatsApp
Compartir en email
Email
Compartir en facebook
Compartir en twitter
Compartir en linkedin
Compartir en whatsapp
Compartir en email

Imaginemos una empresa, dedicada a la arquitectura y a la construcción. El director general está preocupado por el alto grado de rotación de los arquitectos e ingenieros. La compañía tiene dos sedes (Norte y Sur). En el último año un nuevo jefe de Sede se incorporó a la Sede Norte con el mandato expreso de reducir el índice de abandono voluntario. 

El programa estrella del nuevo jefe de sede es un plan integral de gestión de experiencia del empleado para incrementar la fidelidad a la empresa. Al departamento de recursos humanos nos encargan realizar un informe de evaluación de la eficacia de su labor al frente de la Sede Norte. Así que realizamos una sencilla estadística de la tasa de abandono de esta Sede, analizando también la Sede Sur que funciona como grupo de control.

Los datos arrojan un saldo desfavorable para el nuevo director y su programa, puesto que la Sede Norte presenta una tasa de abandono mayor que la Sede Sur (un 22% frente a un 18%).

Ante los datos, el primer impulso del director general es despedir al nuevo jefe de la Sede Norte. Pero puede ser prematuro dar por por sentadas relaciones de causalidad ante una mera asociación estadística. Así que intentamos falsar la hipótesis de partida (la nueva dirección de la Sede Norte incrementa la rotación) mediante el estudio de otras variables ocultas que pudieran ser significativas.

No encontrado significación estadística en las características personales de los trabajadores (edad, titulación, experiencia, retribución, residencia, situación familiar, etc.), así que analizamos el ámbito de trabajo desarrollado en los meses anteriores a la salida (en el caso de los que abandonan) o al momento presente (en el caso de los que permanece). La actividad de la empresa se divide básicamente en dos áreas: proyectos y obras.

Analizamos primero los resultados de los trabajadores que en los últimos meses han estado asignados a proyectos.

Y nos llevamos una primera sorpresa. En el caso de los trabajadores asignados a proyectos la cuestionada Sede Norte tiene un índice de rotación menor (5% frente a 8%).

Podemos pensar entonces que los malos datos de la Sede Norte deben de concentrarse en el grupo de trabajadores que han estado asignado a obra en los meses anteriores. Pero al recopilar los datos, se observa lo siguiente:

¡La Sede Norte también obtiene un ratio más bajo de rotación en el grupo de trabajadores asignados a obra! Un 30% frente a un 40%.

¿Cómo es esto posible? ¡La Sede Norte tiene peores resultados en los datos globales y sin embargo al desagregarlos en dos categorías ¿muestra mejores resultados en AMBAS?! ¿Y qué le vamos a decir al director general? ¿Qué el funcionamiento de la Sede Norte es peor para todos los trabajadores pero mejor para los dos grupos de trabajadores (que siguen siendo todos los trabajadores)?

Estamos ante un ejemplo de la Paradoja de Simpson, descubierta en Edward Simpson en 1951 y que ha desconcertado a varias generaciones de estudiosos desde entonces.

Para solucionar el problema lo primero que debemos entender es que los cálculos matemáticos para los datos agregados y para los desagregados no son contradictorios ni atentan contra la lógica matemática. Nuestra sorpresa deriva de una generalizada, intuitiva y errónea creencia sobre las propiedades de las fracciones (y los porcentajes son fracciones). Tendemos a creer que si una fracción A/B es mayor que otra a/b, y que otra fracción C/D es mayor que otra c/d, entonces una nueva fracción (A+C)/(B+D) será necesariamente mayor que otra (a+c)/(b+d). Parece del todo razonable, pero es falso.

Por aclararlo y siguiendo nuestro ejemplo:

  • 3/40 (la tasa de abandono de proyectos en la Sede Sur) es mayor que 1/20 (la misma tasa en la Sede Norte)
  • 8/20 (la tasa de abandono de obras en la Sede Sur) es mayor que 12/40 (la misma tasa en la Sede Norte)
  • SIN EMBARGO, (3+8)/(20+40) (tasa de abandono global en la Sede Sur) NO ES MAYOR que (1+12)/(20+40) (tasa de abandono global en la Sede Norte).

Hemos dado un primer paso pero descifrar el pequeño enigma matemático no nos ayuda a tomar una decisión sobre la eficacia de la gestión de la Sede Norte. Mirando solamente los datos no podremos tomar una decisión. Tenemos que entender las posibles relaciones de causalidad entre las diferentes variables implicadas:

En cualquiera de las dos sedes la la tasa de abandono de los trabajadores asignados a obra es muy superior a la de proyectos. De la totalidad de abandonos, el 83%  era personal asignado a obras.

Por tanto podemos concluir que el ámbito de trabajo anterior (proyectos u obras) es una de las variables explicativas del abandono.

Por tanto debemos de comprobar si hay diferencias en su incidencia en cada una de las sedes. Si es mayor en una que en otra puede estar ocultando los efectos de la variable que queremos evaluar (la incidencia del nuevo jefe y su programa). Efectivamente las hay: la Sede Norte tiene el doble de empleados asignados a obra y por lo tanto unas expectativas de abandono mucho mayores que la Sede Sur. Por tanto el ámbito de trabajo estaba actuando como factor de confusión.

Por tanto la comparación de resultados agregados entre las dos sedes carece de sentido, puesto que no permite aislar variable objeto de estudio (incidencia de nuevo jefe y programa) de la contaminación causada por el ámbito de trabajo.

Para aislar este efecto de confusión, los datos han de compararse para cada uno de las dos áreas de trabajo de forma independiente.

La Sede Norte gana. Los datos conseguidos por el nuevo jefe de delegación y su programa arrojan un saldo positivo en ambas áreas de trabajo.

Un nuevo ejemplo con variables cuantitativas nos ayudará a tener una visión más gráfica y clara de los efectos de esta paradoja.

En una empresa de desarrollo de aplicaciones tecnológicas el controller llama la atención sobre la gran cantidad de tiempo que los jefes de proyecto y los consultores invierten en las reuniones de coordinación y apoyo. Queremos saber por tanto si el tiempo invertido por contribuye o no a mejorar el desempeño de los trabajadores.

Para averiguarlo podemos comparar dos variables:

  • El tiempo que cada empleado dedica a las reuniones de coordinación y apoyo.
  • El desempeño de los empleados medido a través de un índice de eficiencia.

Analizamos la relación de ambas variables a través de un diagrama de dispersión:

La distribución de la línea de puntos y la línea de tendencia muestra una correlación negativa entre ambas variables. A medida que aumenta el número de horas invertidas en reuniones desciende el índice de eficiencia de los empleados. ¿Debemos considerar por tanto que las reuniones de coordinación y apoyo de los jefes de proyecto son excesivas o demasiado largas?. Parece que sí, pero comprobemos si hay otras variables ocultas que nos ayuden a entender este efecto aparentemente perverso.

Decidimos desagregar los datos en función de la antigüedad de los trabajadores asignados a los proyectos y comprobamos que la gráfica de dispersión anterior queda así:

Es la misma nube de puntos, pero al segmentar los datos en función de la antigüedad de los empleados comprobamos como la correlación se invierte y pasar a ser positiva. Es decir, dentro de cada agrupación (en función de la experiencia en la empresa), las horas asignadas a reuniones parecen tener una incidencia favorable en el índice de eficiencia.

De nuevo nos encontramos ante un caso en el que el análisis agregados no permite identificar un factor de confusión (tiempo en la empresa) que funciona también como variable explicativa de las horas dedicadas a reuniones. A mayor antigüedad en la empresa, los trabajadores asignados a proyectos tienen más experiencia, son más autónomos y requieren por tanto de menos horas y sesiones de coordinación y apoyo. Al mismo tiempo, la experiencia incrementa su desempeño medido a través del índice de eficiencia. Ambos factores pueden ocasionar la falsa percepción de que existe una relación de causalidad entre el incremento del tiempo en reuniones y el descenso del índice de eficiencia.

No es así. Las nubes parciales correspondientes a cada segmento muestran inequívocamente una correlación positiva entre la cantidad de tiempo en reuniones y el grado de eficiencia.

La analítica de datos es sin duda una herramienta maravillosa y cada vez más imprescindible en departamentos de recursos humanos competitivos, pero su utilidad debe descansar siempre en el análisis e identificación de relaciones causales a través de la formulación de hipótesis y su contrastación.

Bibliografía

Pearl, J. Y Mackenzie, D. (2020). El libro del porqué: la nueva ciencia de la causa y el efecto. Editorial Pasado y presente. Barcelona

Compartir en facebook
Compartir en twitter
Compartir en linkedin
Compartir en whatsapp
Compartir en email
Compartir en facebook
Facebook
Compartir en twitter
Twitter
Compartir en linkedin
LinkedIn
Compartir en whatsapp
WhatsApp
Compartir en email
Email

Deja un comentario

Suscríbete