Recursos: Catalogue Data Visualization
Fundamentos de la visualización de datos
Qué es la visualización de datos?
- Son representaciones simbólicas de conceptos complejos.
- Input:
- Es donde iniciamos el proceso de visualización de datos.
- Output:
- Nos ayuda a representar los datos de manera visual.
- Para reconocer fácilmente patrones.
- Al usar más de un sentido podemos facilitar el entendimiento de los datos.
- Estamos en la era de información, así que hay más datos que nunca.
Importancia de la visualización de datos
- Reduce la carga cognitiva para retener y entender los datos.
- Nos ayuda a entregar un mensaje de una manera clara y eficiente.
Visualization gives you answers to questions you didn't know you had.
- Nos ayuda a comunicar mejor a una audiencia.
Buenas prácticas para visualización de datos
- Define una audiencia y un motivo (mensaje).
- Utiliza la percepción visual.
- Para disminuir la carga cognitiva.
- Estandarizar.
- Utilizar medidas.
- No cortar los axis.
- Alinear todo siempre.
- Todo para evitar confundir los números.
- Simplificar pero no recortar.
- Disminuir el sesgo (bias), no
cherry-picking. - Principios Gestalt
Conflictos de ética en la ciencia de datos y Big data
- Nuestro papel ante la audiencia es evitar el sesgo y el bias en la visualización.
- Siempre el mensaje debe de ser sin preferencias personales.
Elige la gráfica correcta para tus reportes
Data vizes el termino con el que se refiere a una representación gráfica
Gráfica de barras
- Existen verticales, horizontales y stackeadas.
- Debemos usar un color distinto para cada categoría
- Debemos representar las cosas de menor a mayor.
Gráfica de pie
- Para menos de 6 categorías de preferencia para mantener la claridad.
- No usar gráficas en 3D porque afectan la visualización.
- Pueden ser de pie o de dona.
- Si no se alcanza a ver las diferencias entre categorías, procurar usar otro tipo de gráfica.
Gráfica de dispersión (scatter plot)
- los colores son importantes.
- Necesitamos buscar correlaciones ya sea positiva o negativa o que no haya alguna.
- Tener cuidado al poner anotaciones para que no dificulte la lectura del gráfico.
Gráfica de Burbujas
- El tamaño de la burbuja nos puede mostrar una variable más para la visualización.
- Pueden ser como una gráfica de dispersión o solo usar el tamaño de la burbuja para denotar una cantidad.
- Tener cuidado con el tamaño de las anotaciones.
- Colores diferentes.
- No gráficos 3D.
Gráfica de mapas
- Es una representación gráfica de datos ubicados geográficamente.
- Puede ser complicado para ubicar los datos.
- Los mapas pueden ser una representación sencilla y no tan precisa.
Tipos de mapas:
Mapas de Isolíneas
- Utilizan líneas para pode unir áreas que determinen cierta similitud.
- Estos espacios suelen colorearse para mostrar distinción entre ellos.
- Son muy utilizados en el aspecto metereológico.
- Ejemplos
Mapas Coroplágticos
- Son mapas que representan con color los lugares donde ocurrieron ciertos sucesos.
- Ejemplo
Mapas de diagramas
- Estos pueden considerarse mapas combinados, ya que por lo general utilizan el color para hacer una distinción variable y alguna otra visualización.
- Son utilizados en estadística, geografía, reportes económicos, salud, etc.
Mapas Antártico
- Utilizan distintos tipos de figuras geométricas para identificar sucesos en determinadas ubicaciones.
Gráfica de heap map
- Nos permiten sobreponer una paleta de colores para representar la frecuencia de los datos que queremos representar.
- Nos permite ver las zonas en las que más se repiten nuestros datos.
- Debemos estar al pendiente de la calibración de la paleta de colores.
- Debe de ser clara para representar los cambios de frecuencia.
Gráfica de tablas
- Se utiliza junto con otro elemento de data visualización.
- No utilizar datos extensos ya que afecta la claridad y la carga cognitiva.
- Podemos utilizar colores para denotar ciertos valores.
Importancia del storytelling en la visualización de datos
- El storytelling es la técnica de comunicación en la cual hilamos historias para comunicar un mensaje.
- Nos ayuda a retener la atención y entregar el mensaje de manera más efectiva.
- Siempre es bueno tener técnicas de storytelling en nuestros reportes.
Data Visualization para Business Intelligence
Cómo afecta la visualización de datos en tu negocio?
- Nos ayudan a que dirección y gerencia entiendan claramente el mensaje que buscamos transmitirles.
- Nos permite que nuestro mensaje sea claro y fácil de interpretar.
- Nos permite poner en palabras conclusiones a las que no podríamos llegar sin verlas plasmadas en una forma visual.
Agregar valor con los datos
- Ofrecer información relevante.
- Explora, descubre, pregunta.
- Trabajar en equipo.
Flujo de trabajo y etapas del business Intelligence
Recolección de datos
- La primera etapa del proceso.
- Bases públicas y privadas.
- Publicas:
- data.nasa.gov
- www.makeovermonday.co.uk/data/
- maxar.com
- podaac.jpl.nasa.gov/datasetlist
- science.nasa.gov/citizenscience
- kaggle.com/datasets
- developers.google.com/earth-engine/datasets
- Puede venir de manera estructurada o no estructurada.
- Publicas:
Limpieza de datos
- Antes de interpretar los datos necesitamos que estos tengan un formato estandarizado.
- Garbage in garbage out.
- Entre mejor sea nuestra información mejores serán nuestros resultados.
- El producto final depende de la calidad de los datos.
- Es entre el 60/70% del trabajo de un data scientist.
Exploración de datos
- Descubre, pregunta, reformula, analiza.
- Los datos sin historias son sólo números.