Introducción
Las aplicaciones utilizadas por las organizaciones cada vez generan mayores cantidades de información. Esta información se maneja en tiempo real o casi real. Generar conocimiento y tomar decisiones son las principales razones por las que las organizaciones almacenan la información, además de soporte a las operaciones y para cumplir las obligaciones legales. Ambas razones dependen del criterio de las personas, que deben extraer de la visualización de la información presentada aquellos aspectos clave que permitan reconocer patrones o tendencias ocultas. La visualización se convierte así en la interficie entre los ordenadores y las mentes de las personas. Las capacidades cognitivas de los humanos tienen limitaciones, por visualización se entiende el proceso de transformación de datos, información y conocimiento en una representación para ser usada de manera afín a las capacidades cognitivas de los humanos.
Ejemplos de la historia de la visualización de información
Diversos autores han investigado sobre la historia de la visualización de la información. Entre ellos destaca Tufte [1]. Desde tres autores distintos, se han seleccionado tres ejemplos correspondientes a tres representaciones con el fin de mostrar tanto las bondades como los inconvenientes del uso de la visualización de la información.
En 1786, el ingeniero escocés William Playfair se dió cuenta de que las transacciones económicas se podían representar fácilmente de manera gráfica. Además, según su opinión, la representación en series temporales y en diagramas de barras simplificaba su comprensión y retención. El autor publicó el "Commercial and Political Atlas" donde se representaba el comercio exterior de Inglaterra; libro que, además y por primera vez, incluía un nuevo tipo de gráfico: el diagrama de pastel. En la figura 1 se muestra un gráfico de las exportaciones e importaciones entre Inglaterra y Dinamarca junto con Noruega [2]. En éste claramente se señala el momento en que el signo del saldo de la balanza comercial entre los países junto con el crecimiento del saldo a favor de Inglaterra cambia.
Figura 1. Exportaciones e Importaciones de y para Dinamarca y Noruega desde 1700 a 1780.
Fuente: W. Playfair
Uno de los ejemplos más famosos de presentación de información pertenece a Charles Minard, un ingeniero civil francés que usó la visualización para mostrar la historia de la trágica marcha a Moscú de Napoleón1 en 1812. En la gráfica de la figura 2, mostró en una barra de color (en sombreado claro para el lector de esta revista), cuyo grosor indicaba el tamaño del ejército (originalmente de 422.000 efectivos), cómo este se iba reduciendo a medida que se acercaba a la capital rusa. A la vez, otra barra, de color negro, indicaba las tropas que regresaron de Moscú (a la llegada eran tan solo 10.000 efectivos). En la base del gráfico se anotaron las temperaturas al aire libre, que fueron el principal problema de los soldados. En el medio del gráfico, se puede observar cómo la barra de color negro se ensancha, debido a la incorporación de unas tropas rezagadas que habían intentado avanzar por el flanco izquierdo, así como la dramática disminución del grosor al cruzar un río con aguas heladas. Al final del retorno, se puede comparar el grueso de las dos barras: la de color, los que partieron; y la negra, los que regresaron. Un simple gráfico nos enseña, de una forma muy potente, la historia. Robert Spence [3] se pregunta si se podría escuchar la obertura no 1812 de Tchaikovsky2 combinada con la visualización del gráfico.
Figura 2. Mapa de las fuerzas de Napoleón en la campaña de Rusia.
Fuente: Charles Minard, 1861
En 1954, Darrell Huff publicó "How to Lie with Statistics" [4] en el que exponía cómo se podía manipular la representación gráfica de las estadísticas para evidenciar diferentes intereses, algunas veces contrapuestos. Evidentemente su gran aportación fue enseñarnos a hacerlo correctamente. En la figura 3 ofrecemos un ejemplo de la representación de un gráfico de líneas muy útil para mostrar tendencias o predicciones. En el eje de las abscisas (el horizontal) se indican los meses del año; mientras que en el de las ordenadas (el vertical) se señala el volumen, por ejemplo, de ventas en billones de dólares. En el gráfico de la izquierda la representación de la información es la correcta, el eje de las ordenadas comienza en 0 y las distancias entre los valores de los dos ejes son equivalentes; por su parte, en el gráfico de la derecha, el eje de las ordenadas comienza en 20, con lo que la expresión del personaje que aparece en el gráfico se vuelve de profunda admiración por los resultados obtenidos.
Figura 3. Gráfico en el que se muestra como cambia la figura al cambiar la escala del eje.
Fuente: Darrell Huff
Al repasar tres de los ejemplos históricos de la visualización de la información se ha subrayado, en el primer caso, la importancia de la representación de la información para comprender qué sucede; en el segundo, que una buena representación de la información nos permite comprender mejor una realidad; y en el tercero, que si la representación de la información está manipulada, intencionadamente o no, nos puede llevar a una interpretación errónea de los hechos. Si la representación es la adecuada podremos tomar decisiones pero, ¿qué sucedería si alguien hubiera manipulado la representación con otros fines?
Visualizando información
La visualización de la información se utiliza en distintos campos, desde la medicina, pasando por la ingeniería, la estadística, los negocios, o incluso en el deporte. De este último, hemos elegido la figura 4, publicada en un reconocido periódico nacional3 , con el fin de demostrar la dificultad que la presentación de la información en un gráfico alberga o puede albergar. En el gráfico publicado se muestran los récords de los 100 metros a lo largo de la historia: los atletas, su nacionalidad, la fecha en la que se consiguieron y las marcas obtenidas. En el gráfico aparecen también unas barras grises junto a la representación de un corredor. El lector se puede sorprender al ver que la barra más larga está junto al menor tiempo. A mí me ocurrió lo mismo.
Figura 4. Gráfico de la evolución de los récords de los 100 metros.
Fuente: El País, 15/06/2005
Después de analizar el gráfico durante un tiempo me di cuenta de que lo que el autor intentaba representar era cómo hubiera sido la llegada si en la carrera hubieran participado los 10 corredores que ostentan el récord del mundo de los 100 metros (Carl Lewis y Leroy Burrell lograron dos récords, por lo tanto deberían correr en dos calles).
Trabajando sobre el gráfico anterior, se podrían proponer algunas mejoras, como por ejemplo añadir la línea de llegada en el gráfico y modificar la posición de los tiempos de las marcas para facilitar su lectura y comprensión. En la figura 5 se propone una posible solución.
Figura 5. Propuesta de gráfico de la evolución de los récords de los 100 metros.
Fuente: Elaboración propia
En el supuesto de que la representación propuesta facilite la interpretación de la información, podríamos cuestionarnos ahora si la distancia representada entre los corredores corresponde a la real. A partir de la información proporcionada podemos calcular que la distancia entre el primer y el décimo récord sería de 1,81 metros, es decir, en el tiempo de 9,77 segundos en que Asafa Powell recorre 100 metros, Jim Hines hubiera recorrido 98,19 metros. Así pues, ¿la distancia entre el corredor y la línea de meta corresponde a 1,81 metros? Para responder a esta pregunta recurrimos a representar las distancias valiéndonos de los gráficos4 de una hoja de cálculo. En la figura 6 se muestra el resultado obtenido.
Figura 6. Gráfico de la evolución de los récords de los 100 metros, comenzando en 0 metros.
Fuente: Elaboración propia
A simple vista parece que las distancias entre los corredores han decrecido en relación con el gráfico original. ¿Qué ha sucedido? En el gráfico original no se presentan los valores del eje de abscisas, por lo que podríamos preguntarnos en qué valor comienza. En la figura 7 se muestran dos gráficos. El de la izquierda comienza en 97 metros, y el de la derecha en 95 metros.
Figura 7. Gráfico de la evolución de los récords de los 100 metros, comenzando en 97 y de 95 metros.
Fuente: Elaboración propia
Si cambiamos el límite inferior de las abscisas, al visualizar las gráficas, la persona que las está analizando puede interpretarlas de forma distinta, lo que le podría llevar a tomar una decisión diferente.
También cabe preguntarse si la distancia recorrida es, efectivamente, la mejor variable para representar las diferencias entre los distintos récords del mundo de los 100 metros lisos. O, si bien, podemos recurrir a la velocidad, es decir, a los metros por segundo para evidenciar la diferencia entre los distintos corredores. En la figura 8 se muestra la gráfica de las velocidades que se obtuvieron en los 10 récords. En este caso solo se presenta la gráfica en la que el eje de abscisas comienza con el valor 0, ya que si comenzara por otros valores nos sucedería lo mismo que en el caso anterior. La diferencia en metros por segundo es de tan solo 0,19 entre el primero y el último.
Figura 8. Gráfico de la velocidad de los récords de los 100 metros.
Fuente: Elaboración propia
Vayamos un poco más allá en el análisis. Si retomamos la perspectiva histórica nos podríamos preguntar ¿cuál ha sido la evolución de los 10 mejores récords del mundo de los 100 metros lisos a lo largo del tiempo?5 Podemos recurrir para ello a un gráfico que nos indique los valores a lo largo del tiempo. El que nos propone por defecto la hoja de cálculo es el mostrado en la figura 9.
Figura 9. Gráfico de la evolución de los récords de los 100 metros, comenzando en 9,65 segundos.
Fuente: Elaboración propia
De nuevo, una lectura rápida nos podría llevar a una conclusión errónea: ha mejorado mucho ya que la pendiente es pronunciada. Pero si representamos en el eje de las ordenadas el valor 0, el gráfico cambia significativamente (ver figura 10).
Figura 10. Gráfico de la evolución de los récords de los 100 metros, comenzando en 0 segundos.
Fuente: Elaboración propia
Nos podría parecer que en el gráfico anterior no se ha representado ninguna marca. Sin embargo, si se observa con atención puede percibirse que hay una línea entre los valores de 9 y 10 segundos, con una pendiente negativa pequeña a lo largo de aproximadamente unos 37 años. Es decir, se han tardado casi 37 años en reducir la marca a 18 centésimas de segundo, lo que equivaldría a unas 5 milésimas de segundo por año. Parece que la segunda gráfica representa mejor esta realidad que la primera. En el límite, dos representaciones diferentes de los mismos datos nos pueden llevar a dos conclusiones que incluso se pueden contradecir entre ellas.
Hemos conseguido, con la representación gráfica, que aquellas personas que estaban interesadas en el hecho a analizar hayan comprendido realmente lo que ha sucedido en los últimos 10 récords del mundo de 100 metros lisos hasta el año 2005, las pocas diferencias que hay entre ellos y la dificultad por mejorarlos. Tal vez, hubiera sido mejor echar mano de otro tipo de representación gráfica: la tabla con los valores y los cálculos utilizados para representarlos gráficamente. En la tabla 1 se han añadido tres nuevas columnas: la de la mejora del tiempo en porcentaje respecto al mejor récord, la velocidad en metros por segundo, y la de la distancia que habrían recorrido el resto de corredores en el tiempo que Asafa Powell habría llegado a la meta.
Tabla 1. Evolución de los récords de los 100 metros. Fuente: Elaboración propia
Si la conclusión es que la mejor forma de comprender esta realidad es la tabla con los valores, entonces resulta la mejor representación. Esta decisión probablemente se relacione con una elección personal, a la vez que se encuentra influida por el conocimiento que la persona disponga sobre los resultados de las pruebas de 100 metros lisos. Es decir, no depende tan solo del que representa la información, sino también del que la visualiza. Nos podríamos preguntar si siempre tiene sentido establecer un formato de informe invariable a lo largo del tiempo, como deciden la mayoría de organizaciones, basándose en que al no cambiar el formato facilita su interpretación o deberíamos modificarlo para conseguir una mejora en la visualización si quisiéramos representar mejor algunos cambios que se han producido en los datos.
Information Visualization
Según Card et al. [5], la visualización de la información se define como: "El uso de representaciones visuales basadas en ordenadores e interactivas de información abstracta para amplificar la cognición".
Los autores la diferencian de la visualización científica, normalmente basada en información física.
Los mismos autores han llevado a cabo una revisión de la literatura6 , a la vez que justifican cómo la visualización amplifica la cognición, o dicho de otra manera, que el concepto de cognición (del latín: cognoscere,"conocer") hace referencia a la facultad de los seres de procesar información a partir de la percepción, el conocimiento adquirido y las características subjetivas que permiten valorarla.
Debemos señalar que en la definición propuesta se añade el término "interactivas", ya que en la actualidad, normalmente, las representaciones siempre se basan en el uso de ordenadores que permiten la interacción entre el usuario y la aplicación del ordenador.
Para aquellos lectores que quieran profundizar en la definición de "visualización", en las distintas tecnologías que la soportan o en la relación entre las teorías cognitivas y las tareas de la resolución de problemas, así como en las representaciones visuales, pueden hacerlo en el artículo de Tegarden [6].
En dicho artículo, Tegarden resume los seis objetivos que todo gráfico debería cumplir según Tufte [1][7]. En la tabla 2, dichos objetivos se relacionan con el gráfico original de los récords de los 100 metros lisos que hemos utilizado como ejemplo:
Objetivos de los gráficos | Gráfico original de los récords de los 100 metros lisos | |
---|---|---|
1 | Sugiere que solo debemos mostrar la información. Algunas veces los que diseñan los gráficos tienden a mostrar agregaciones de información en lugar de la información en sí misma. | Los países de los corredores están junto a los nombres. Si se les hace aparecer en una columna separada facilita la lectura y se muestra mejor la preponderancia de los corredores de EEUU. |
2 | Sugiere que debemos asegurarnos de que el usuario piense en lo esencial del gráfico, y no en el gráfico en sí mismo. | Para interpretar el gráfico era necesario reconocer que se intentaba representar la llegada a la meta de una carrera hipotética entre los corredores de los 10 últimos récords. Se debería indicar la posición del récord. |
3 | Evitar todas aquellas decoraciones innecesarias. | La representación de los corredores no es necesaria. |
4 | Comprimir tanta información como sea posible en el menor espacio posible. | Se hubieran podido incluir los metros recorridos o la velocidad de cada récord. |
5 | Los gráficos deben ser diseñados para animar al usuario a hacer comparaciones entre las distintas informaciones. | Las marcas, al no estar alineadas, dificultan su comparación. |
6 | Los gráficos deben proveer vistas de la información a distintos niveles de detalle. | Al ser un único gráfico y no interactivo, no aplica. |
Tabla 2. Principios de Tufte y análisis del gráfico de los récords. Fuente: Elaboración propia
Business Information Visualization
Los directivos necesitan información para la toma de decisiones, y necesitan que se represente de forma que facilite su interpretación. Normalmente, las organizaciones desarrollan proyectos de Business Intelligence. Uno de los aspectos clave de estos proyectos es la correcta representación de la información. En el presente artículo, no nos vamos a referir a los conceptos básicos de la representación de la información. Para ello, se adjuntan referencias bibliográficas de distintas obras que tratan amplia y profundamente este tema. No obstante, sí que vamos a incidir en las nuevas tendencias y necesidades sobre la visualización.
Figura 11. Cuadro de mando. Fuente: Ejemplo de QlikView.
Entre los autores cabe destacar a Stephen Few [8]. Según él, la visualización de información del futuro conlleva nuevas necesidades, entre ellas:
- Dashboards o Scorecards: los directivos necesitan acceder a información que en poco tiempo les permita analizar cuál es la situación, de manera que una vez detectado el problema, mediante unas pocas pulsaciones con el ratón, puedan descender al nivel de detalle suficiente para poder comprender qué sucede y tomar las medidas correctoras. En los scorecards se representan perspectivas de áreas estratégicas, objetivos, medidas y indicadores semafóricos, mientras que en los dashboards la información presentada puede variar mucho y se suelen incluir representaciones gráficas. En los dashboards o cuadros de mando la complejidad de la visualización de la información aumenta, ya que pueden presentarse informaciones o gráficos interrelacionados. Normalmente se debe, además, presentar una gran cantidad de información en un espacio muy limitado (ver figura 11).
- Geo espacial: cuando la información se basa en el territorio, su visualización sobre el terreno se hace cada vez más necesaria. Desde los conocidos Geographic Information Systems (GIS), hasta Google Earth o distintos web services encontramos medios que nos permiten relacionar, por ejemplo, las ventas o los gastos con el territorio.
- Scatterplots o gráficos animados: en algunos casos necesitamos comparar dos magnitudes, por ejemplo, inversiones en publicidad y ventas a lo largo del tiempo. Para ello es necesario valerse de un nuevo tipo de representación que incluye animaciones en el transcurso temporal. Uno de los mejores ejemplos de representación animada de información es el caso de www.GapMinder.org, en el que, por ejemplo, se puede ver la relación entre los ingresos de los países y su tasa de mortalidad infantil a lo largo del tiempo.
- Treemaps: un ejemplo de representación de este tipo de gráficos es el volumen de operaciones de la bolsa de Nueva York, agregado por industria y de forma que permite comparar los precios y sus cambios desde el día anterior (puede verse en www.SmartMoney.com).
- Sparklines: son un tipo de representación gráfica caracterizada por su pequeño tamaño y la densidad de información que contiene. Normalmente se utilizan varias a la vez representando distinta información que en algunos casos puede ser complementaria. El termino sparkline fue propuesto por Edward Tufte, que las describe7 como "pequeños gráficos, simples, de elevada resolución y del tamaño de una palabra". En la figura 12 se muestra un ejemplo de un sparkline.
Figura 12. Tabla de evolución de las cotizaciones
Fuente: https://www.edwardtufte.com
- Representación de relaciones: en algunos casos, necesitamos representar relaciones entre entidades, como en el caso de las Web sites. Cada una de ellas actúa como nodo en una red, y tiene vínculos con otras. Un ejemplo de uso es Vizster de redes entre personas.
Conclusión
Las necesidades de visualización de información han ido cambiando a lo largo de la historia. El tiempo del que disponen los directivos y directivas para tomar decisiones cada vez es menor. Además, han aparecido nuevas necesidades con lo que los investigadores han propuesto y propondrán nuevas soluciones para cubrirlas. Una correcta representación de la información debería facilitar su interpretación y disminuir el tiempo que los directivos invierten en ella, y este se presenta como el principal objetivo de la visualización de información.
Si la visualización de la información no es la correcta puede llevar a los directivos y directivas a tomar decisiones equivocadas. A lo largo del artículo se han presentado distintos ejemplos en los que la representación de información de una forma "manipulada" podría llevar a interpretaciones erróneas, con lo que el riesgo que los directivos y las directivas se equivoquen aumenta. En todo proyecto de Business Intelligence deberíamos asegurar que la representación gráfica es la más adecuada, por ello necesitamos especialistas que nos lo aseguren minimizando la visualización de información. Sin una correcta representación, no conseguiríamos aportar el valor que se espera, y difícilmente retendremos el interés de los directivos y las directivas en el uso de esta solución.
* Este artículo fue publicado previamente en la revista Novática (Nº 211, mayo-junio 2011 págs. 8-15) y se reproduce aquí con permiso del autor
Josep Lluís Cano Giner
Profesor del Departamento de Dirección de Sistemas de Información, ESADE, Universidad Ramon Llull
Josep Lluís Cano Giner es profesor del Departamento de Dirección de Sistemas de Información de ESADE desde el año 1989. Licenciado en Ciencias Empresariales y máster en Dirección de Empresas (ESADE). Licenciado en Administración y Dirección de Empresas (Universidad Politécnica de Catalunya). Obtuvo el Diploma de Estudios Avanzados (DEA) por la UPC.
En la actualidad, investiga en el campo de los factores que inciden en el aumento del uso de los Sistemas de Información Directivos por parte de los directivos. Es consultor de empresas con una dilatada experiencia en la planificación estratégica de sistemas de información y en selección de soluciones, especialmente en Business Intelligence.
Entre sus publicaciones académicas se encuentran artículos y diversos Business Case, entre ellos: "Goverment Intelligence en las universidades públicas catalanas", "Aventis", "Aguirre&Newman", "Bodegas Torres", "Raventos i Blanc at a crossroad". También es el autor del libro "Business Intelligence: Competir con Información".
Referencias
[1] E.R. Tufte. The Visual Display of Quantitative Information. Cheshire: Graphics Press, 1983.
[2] W. Playfair, H. Wainer, I.Spence. The Commercial and Political Atlas and Statistical Breviary. New York: Cambridge University Press, 2005.
[3] R. Spence. Information Visualization. Essex: ACM Press, 2001.
[4] D. Huff. How to Lie with Statistics. Penguin; New Ed edition, 1991.
[5] S.K. Card, J.D. Mackinlay, B. Shneiderman. Readings in Information Visualization: Using Vision to Think. San Francisco: Morgan Kaufmann Publishers, 1999.
[6] D. P. Tegarden. “Business Information Visualization”. Comunications of AIS, vol.1, art. 4, enero, 1999.
[7] E.R. Tufte. Envisioning Information. Cheshire: Graphics Press, 1990.
[8] S. Few. Data Visualization, Past, Present, and Future. Percentual Edge, 2007.
Bibliografía
J. Best. Damned Lies and Statistics: Untangling Numbers from the Media, Politicians, and Activists. Berkeley and Los Angeles: University of California Press, 2001.
J. Best. More Damned Lies and Statistics: How Numbers Confuse Public Issues. Berkeley and Los Angeles: University of California Press, 2004.
W.S. Cleveland. The Elements of Graphing Data. Summit: Hobart Press, 1994.
S. Few. Show Me the Numbers: Designing Tables and Graphs to Enlighten. Oakland: Analytics Press, 2004.
S. Few. Information Dashboard Design: The Effective Visual Communication of Data. Sebastopol, CA: O’Reilly Media, Inc., 2006.
S. Few. Now You See It: Simple Visualization Techniques for Quantitative Analysis. Oakland: Analytics Press, 2009. J.G.
Koomey. Turning Numbers into Knowledge: Mastering the Art of Problem Solving. Oakland: Analytics Press, 2001.
D. Niederman, D. Boyum. What the Numbers Say: A Field Guide to Mastering Our Numerical World. New York: Broadway Books, 2003.
N.B. Robbins. Creating More Effective Graphs. Hoboken: John Wiley and Sons, Inc., 2005.
T. Segaran, J. Hammerbacher. Beautiful Data. O’Reilly Media, 2009.
E.R. Tufte. Visual Explanations. Cheshire: Graphics Press, 1997.
E.R. Tufte. Beautiful Evidence. Cheshire: Graphics Press, 2005.
C. Ware. Information Visualization: Perception for Design, second edition. San Francisco: Morgan Kaufmann Publishers, 2004.
D.W. Wong. The Wall Street Journal Guide to Information Graphics: The Dos and Don’ts of Presenting Data, Facts, and Figures. New York: W. W. Norton & Company, 2010.
Notas
1 https://www.math.yorku.ca/SCS/Gallery/images/minard.gif
2 El lector puede hacer el ejercicio accediendo a https://www.youtube.com/watch?v=k-vQKZFF-9s (último acceso 5.1.2011). Esta obertura, Op. 49, fue compuesta para rememorar la victoriosa resistencia rusa en 1812 frente al avance de la Grande Armée de Napoleón Bonaparte. La obertura fue estrenada en Moscú el 20 de agosto de 1882. La obra es reconocida por su final triunfal, que incluye una salva de disparos de cañón y repique de campanas.
3 Artículo “Huracán Powell” aparecido en El País el miércoles 15 de junio de 2005. Al pie del gráfico se indica el literal “elaboración propia”.
4 En todos los gráficos se ha omitido la presenta- ción de los valores para facilitar la comprensión del efecto que se quiere mostrar con el gráfico.
5 Sobre la pregunta, debemos señalar que no nos estamos preguntando ¿cuál ha sido la evolución de los récords del mundo de los 100 metros lisos a lo largo de la historia? Para responder a esta pregunta deberíamos disponer de todos los récords del mundo, y no es el objetivo de este artículo analizarlos.
6 Tabla 1.3 de la página 16 del libro citado en la referencia [5].
7 El lector puede acceder a más ejemplos en: https://www.edwardtufte.com/bboard/q-and-a-fetch-msg?msg_id=0001OR