Del curso: Python para data science y big data esencial

Introducción al Matplotlib

Vamos a ver una breve introducción a qué es Matplotlib, qué puede ofrecernos y cuáles son las bases de la sintaxis más básica. Empiezo mostrándote la web del paquete, donde voy a orientarte a encontrar la información más importante. En primer lugar, te ofrece información y soporte para la instalación. Si estás usando alguna de las utilidades de Anaconda, como Jupyter Notebook o Spyder, no vas a tener que preocuparte, porque ya viene instalado por defecto. En la pestaña de Tutoriales podemos encontrar algunas guías para introducirnos a los principales tipos de gráficos y posibilidades que nos ofrece el paquete. Personalmente recomiendo este, donde podemos ver una galería de las opciones que nos ofrece. Aparte de este tutorial, te recomiendo explorar la galería de ejemplos que podemos encontrar aquí. Aunque el código de alguno de ellos puede resultar muy avanzado o confuso al principio, permite hacerse una idea general de todo lo que podríamos llegar a realizar usando las funcionalidades propias del paquete. A continuación, vamos a ver un ejemplo de sintaxis concreto para introducir los conceptos básicos. Vamos a cargar los paquetes Pandas y Numpy, así como el Matplotlib Pyplot. La anotación estándar para hacerlo es esta, lo que nos va a permitir encontrar ayuda más fácilmente y que nuestro código sea más leíble. Vamos a leer las 100 000 primeras filas de nuestra base de datos de aerolíneas. Para empezar, vamos a crear una tabla resumen de los vuelos cancelados con esta sintaxis y vamos a pedirle que nos devuelva 'return_counts' y vamos a mostrar. Lo que acabamos de obtener aquí es una tabla de resumen de todos los casos que tenemos, 0 y 1, y cuántas veces aparecen en nuestra base de datos. Con esta breve tabla resumen vamos a crear un diagrama de sectores, el típico gráfico de quesito. Depende de dos parámetros: 'x', que son los valores, y las etiquetas. Ya tenemos el gráfico hecho, pero si ejecutamos esto, no nos lo va a mostrar. Lo que vamos a tener que hacer es decirle que lo haga explícitamente. Aquí tenemos nuestro primer gráfico con Matplotlib. Es muy sencillo y vamos a ver que podemos irlo mejorando añadiéndole nuevos parámetros. Un primer cambio que podemos realizar es cambiarle los colores. Por ejemplo, vamos a hacer un cambio bastante radical y vamos a ponerle rojo y verde. Ejecutamos y obtenemos este nuevo gráfico. Vamos a ver algunas de las otras principales opciones que nos ofrece. Podemos añadirle una sombra. No es un parámetro que personalmente me guste mucho, pero puede ser interesante dependiendo del tipo de visualización que queramos. Podemos cambiar dónde empieza a contar los ángulos. Recomiendo este cambio de parámetros especialmente, ya que es mucho más sencillo de leer si empezamos a contar desde arriba los sectores. Y también podemos, por ejemplo, modificar el radio de nuestro gráfico. Y así obtenemos una visualización más clara. Estos son solo algunos de los parámetros que podemos añadir y modificar de nuestro gráfico. Te animo a explorar la documentación de la función Pie para ver qué otros cambios puedes realizar sobre este gráfico.

Contenido