Si hay un misterio mayor que la construcción de las pirámides, la existencia de la Atlántida, el primer segundo del Big Bang o la naturaleza de la materia oscura, ese misterio es por qué a la gente le gusta tanto usar gráficos de tarta. Bien podrían investigar sobre ello Iker Jiménez, Giorgio Tsoukalos, el gordo mierda de Mundo desconocido y demás troleros conspiranoicos.

Quizás es porque nos gustan las cosas redondas, o porque nos recuerdan los pasteles de cumpleaños de nuestra infancia, o se trate de una fijación a la freudiana fase anal, pero jamás comprenderé el atávico abuso del gráfico de sectores, cuando es el tipo de gráfico más inútil e inadecuado para interpretar datos. Primera regla: casi siempre puede sustituirse un gráfico de sectores por otro tipo de gráfico que presente mejor la información.

Se atribuye la introducción de este tipo de gráfico a William Playfair, estadístico escocés pionero de la interpretación gráfica de datos, a principios del s.XIX. La idea de este tipo de representación es comparar la proporción de los componentes de un todo; así, se podría graficar el porcentaje de agua, grasa, proteína y hueso en un determinado mamífero, pero no se podrían comparar, por ejemplo, el porcentaje de grasa en la carne de diferentes especies.

El gran inconveniente: la comparación de áreas

Para construir un gráfico de tarta se distribuyen los 360º de una circunferencia en proporción con la frecuencia relativa de cada serie. Por ejemplo, si la serie A representa un 30 % (fi = 0,3) su quesito será 360º × 0,3 = 108º. Luego se toma el transportador y se traza el sector correspondiente… bueno, ya todo lo hace el Excel.

gráficos de tarta 1

Como nuestra apreciación de áreas es equívoca, en este gráfico de sectores solo podemos asegurar que el área del linezolid es más pequeña y la del imipenem más grande, pero los demás sectores son dudosos. En cambio, los mismos datos en un gráfico de barras no dejan lugar a engaños.

La cosa es que nuestra percepción para comparar áreas no es ni de lejos tan buena como cuando se compran longitudes. Ello queda demostrado por el hábito periodístico de expresar la extensión de una superficie en «campos de fútbol», o los pifostios que puede generar una inexacta división en porciones de una pizza o bizcocho.

Allí está el problema: calculamos mal las áreas y nuestra percepción para comparar dos o más áreas puede ser engañosa. Eso no pasa con un buen gráfico de barras, donde nadie dudará en detectar cuál columna es más alta. Incluso una tabla puede ser más explícita que un gráfico sectorial en ciertos casos.

comparacion tartas

Comparar varios gráficos de tarta es bastante incómodo. En este caso es mucho más demostrativo un gráfico de columnas apiladas.

bannerpresentaciones

Ni pocas ni muchas series

Otra limitación de los gráficos de tarta es que son inútiles para pocas series e imprácticos para muchas. El típico gráfico mónguer para comparar la distribución por sexos de una muestra es absolutamente prescindible. Para decir que había un 35 % de varones no hace falta un gráfico, basta ponerlo en texto y ya. Así que si hay solamente dos o tres series no tiene mucho sentido usar gráficos circulares —y quizás de ningún otro tipo—.

gráficos de tarta 2

El gráfico de la izquierda es prescindible pues, cuando hay dos categorías únicas excluyentes, el % que no sea de una serie automáticamente corresponde a la otra, y ello basta expresarlo en una línea de texto. La tarta de la derecha es inútil, pues si se ha distribuido una muestra equitativamente según una característica basta con indicarlo en el texto: «la población fue distribuida al 25 % para los siguientes grupos étnicos…»

En el otro extremo, cuantas más series se quieran meter en un gráfico de tarta más pequeños serán los quesitos y más arduo será compararlos. La profusión de series da al gráfico un aspecto perfectamente anal, un círculo plagado de rayos que simula un ojete.

gráfico de tarta 3

Un gráfico de sectores con muchas series es confuso e inútil. Aquí se muestra un gráfico tipo «ano», plagado de radios que delimitan pequeños sectores difíciles de comparar; apenas se ve que alanina y glicina son los residuos más frecuentes y poco más. En cambio, el gráfico de la derecha sí muestra claramente la información.

Efectos 3D para empeorar lo que ya es malo

En un post pasado comenté que prácticamente ningún gráfico gana nada por adornarlo con efectos tridimensionales, los cuales añaden ruido visual y llegan a estorbar en la interpretación de los datos. Esto es especialmente terrible en los gráficos de sectores, pues la perspectiva inducida reduce el tamaño aparente de los sectores más alejados respecto a los de adelante, añadiendo un factor de confusión adicional. Mientras más sesgado esté el pastel mayor será la deformación.

graficos tarta 4

Si los «pie chart» ya son chungos, sesgarlos mediante 3D los convierte en infames. En el de la izquierda ¿qué sector es mayor, el azul o el amarillo? Parecen iguales y también similares al verde, pero en realidad hay una diferencia considerable entre el amarillo y el azul si el gráfico se ve de frente. La leyenda colocada al pie obliga al observador a emparejar por colores mirando arriba y abajo, mientras que los rótulos incluidos dentro del sector facilitan la interpretación.

Rótulos y leyendas

Cuando se usa un gráfico de sectores lo ideal es que el título de cada serie esté señalado dentro de cada quesito o adyacente al mismo, en vez de colocar una leyenda aparte con el código de colores, pues ello también entorpece la lectura del gráfico, especialmente si hay muchas series y los colores se prestan a confusión.

Conviene que dentro del rótulo de cada sector se incluya la frecuencia absoluta o porcentual de su respectiva serie.

Entonces, ¿nunca jamás se deben usar?

Casi, casi, casi. Repito: prácticamente siempre habrá mejores opciones gráficas para presentar unos datos. Puntualmente podría ser pasable recurrir a una tarta, por ejemplo dentro de una infografía compleja donde se quiera reducir texto.

Hay variantes del gráfico de sectores, como las tartas divididas, tartas dentro de tartas, sectores multinivel o con segmentos de sector anidados. La mayoría de estas variantes no se usan en ciencias y en realidad son versiones más complicadas de entender.

pie chart

¿Hasta qué punto puede complicarse un gráfico de sectores para hacerlo más repelente? En este ejemplo, extraído de la web de IBM, se ha fabricado un intrincado gráfico de anillos concéntricos y divididos por sectores, con sesgo 3D, leyenda absurdamente repetitiva y rótulos con porcentajes que se montan en el sector adyacente, para rematar la confusión. Madre mía.

Quizás la única variante de la que se puede sacar provecho sea el gráfico anular o de rosquilla, donde se elimina el área central de un gráfico de tarta y ello convierte la comparación de áreas de círculo en comparación de longitud de segmentos de una corona circular. Siempre nos será más fácil comparar longitudes, aunque éstas sean curvadas.

grafico de anillo

Los gráficos de anillo o rosquilla son una alternativa a la clásica tarta que facilita la interpretación al convertir áreas en longitudes de segmentos de una corona de círculo. Aquí aparecen dos ejemplos de gráficos mostrados más arriba.

Estos gráficos de rosquilla son una opción aceptable mientras no se abuse de series y no se adulteren con cutres efectos tridimensionales.

graficoanal

«Ceterum censeo Podemus esse delenda»

Anuncios

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

Conectando a %s