Tutorial de Python Seaborn: ¿Qué es Seaborn y cómo usarlo?



Tutorial de Python Seaborn junto con la diferencia entre seaborn y matplotlib. Conozca también las diversas funciones y personalizaciones disponibles en seaborn.

Python es un almacén de numerosas bibliotecas y marcos inmensamente poderosos. Entre ellos, es Seaborn, que es un dominante Visualización de datos biblioteca, otorgando otra razón más para que los programadores completen . En este Tutorial de Python Seaborn, aprenderá todos los trucos de la visualización de datos con Seaborn.

Antes de continuar, veamos todos los temas de discusión en este artículo:





Así que comencemos primero por razonar la importancia de Python Seaborn.

cómo configurar classpath en linux

¿Por qué utilizar Python Seaborn?

Como se mencionó anteriormente, la biblioteca Python Seaborn se utiliza para facilitar la desafiante tarea de visualización de datos y se basa en . Seaborn permite la creación de gráficos estadísticos a través de las siguientes funcionalidades:



  • Una API que se basa en conjuntos de datos que permiten la comparación entre múltiples variables

  • Admite cuadrículas de múltiples parcelas que a su vez facilitan la creación de visualizaciones complejas

  • Visualizaciones univariadas y bivariadas disponibles para comparar entre subconjuntos de datos



  • Disponibilidad de diferentes paletas de colores para revelar varios tipos de patrones.

  • Estimaciones y parcelas automáticamente

Entonces, si se preguntaba por qué usar Seaborn cuando ya tiene Matplotlib, aquí está la respuesta.

Python Seaborn contra Matplotlib:

“Si Matplotlib“ intenta facilitar las cosas fáciles y hacer posibles las cosas difíciles ”, seaborn intenta facilitar también un conjunto bien definido de cosas difíciles” - Michael Waskom (Creador de Seaborn).
De hecho, Matplotlib es bueno pero Seaborn es mejor. Básicamente, hay dos defectos de Matplotlib que Seaborn corrige:

  1. Matplotlib se puede personalizar, pero es difícil determinar qué configuraciones se requieren para hacer que los gráficos sean más atractivos. Por otro lado, Seaborn viene con numerosos temas personalizados e interfaces de alto nivel para resolver este problema.

  2. Al trabajar con Pandas , Matplotlib no funciona bien cuando se trata de tratar con DataFrames, mientras que las funciones de Seaborn realmente funcionan en DataFrames.

¿Cómo instalar Seaborn?

Para instalar la biblioteca de Python Seaborn, puede utilizar los siguientes comandos según la plataforma que utilice:

pip instalar seaborn

o

conda instalar seaborn

Una vez que esté instalado, asegúrese de instalar los paquetes y bibliotecas de los que seaborn depende.

Instalación de las dependencias de Python Seaborn:

Las dependencias obligatorias para los marineros son:

También hay una dependencia recomendada que es:

  • modelos estatales

Para instalar estas bibliotecas, puede usar los mismos comandos que se muestran anteriormente para Seaborn con sus respectivos nombres. Una vez instalados, se pueden importar fácilmente. Seaborn le permite cargar cualquier conjunto de datos desde utilizando la load_dataset () función. También puede ver todos los conjuntos de datos disponibles usando la función get_dataset_names () de la siguiente manera:

EJEMPLO:

importar seaborn como sns sns.get_dataset_names ()

Esto devolverá una lista de todos los conjuntos de datos disponibles.
Ahora que ha configurado su entorno para trabajar con seaborn, sigamos adelante para ver cómo usar sus funciones de trazado en .

Funciones de trazado de Seaborn

Visualización de relaciones estadísticas:

El proceso de comprender las relaciones entre las variables de un conjunto de datos y cómo estas relaciones, a su vez, dependen de otras variables se conoce como análisis estadístico. Echemos ahora un vistazo más profundo a las funciones necesarias para esto:

relplot ():

Esta es una función a nivel de figura que hace uso de otras dos funciones de ejes para visualizar relaciones estadísticas que son:

  • gráfico de dispersión()
  • lineplot ()

Estas funciones se pueden especificar usando el parámetro 'kind' de relplot (). En caso de que se proporcione este parámetro, toma el predeterminado que es scatterplot (). Antes de comenzar a escribir su código, asegúrese de importar las bibliotecas requeridas de la siguiente manera:

importar numpy como np importar pandas como pd importar matplotlib.pyplot como plt importar seaborn como sns sns.set (style = 'darkgrid')

Tenga en cuenta que el atributo de estilo también es personalizable y puede tomar cualquier valor, como darkgrid, ticks, etc., que discutiré más adelante en la sección de estética de la trama. Veamos ahora un pequeño ejemplo:

EJEMPLO:

f = sns.load_dataset ('vuelos') sns.relplot (x = 'pasajeros', y = 'mes', datos = f)

SALIDA:

Vuelos1-Tutorial de Python Seaborn-Edureka

Como puede ver, los puntos están trazados en 2 dimensiones. Sin embargo, puede agregar otra dimensión utilizando la semántica 'tono'. Veamos un ejemplo de lo mismo:

EJEMPLO:

f = sns.load_dataset ('vuelos') sns.relplot (x = 'pasajeros', y = 'mes', hue = 'año', datos = f)

Verá el siguiente resultado:

SALIDA:

Sin embargo, hay muchas más personalizaciones que puede probar, como colores, estilos, tamaño, etc. Permítame mostrarle cómo puede cambiar el color en el siguiente ejemplo:

EJEMPLO:

sns.set (style = 'darkgrid') f = sns.load_dataset ('vuelos') sns.relplot (x = 'pasajeros', y = 'mes', hue = 'año', palette = 'ch: r = - .5, l = .75 ', datos = f)

SALIDA:

lineplot ():

Esta función le permitirá dibujar una línea continua para sus datos. Puede utilizar esta función cambiando el parámetro 'tipo' de la siguiente manera:

EJEMPLO:

a = pd.DataFrame ({'Día': [1,2,3,4,5,6,7], 'Supermercado': [30,80,45,23,51,46,76], 'Ropa' : [13,40,34,23,54,67,98], 'Utensilios': [12,32,27,56,87,54,34]}, índice = [1,2,3,4,5 , 6,7]) g = sns.relplot (x = 'Día', y = 'Ropa', tipo = 'línea', datos = a) g.fig.autofmt_xdate ()

SALIDA:

El valor predeterminado para el diagrama de líneas es y en función de x. Sin embargo, se puede cambiar si lo desea. Hay muchas más opciones que puedes probar.

Ahora echemos un vistazo a cómo trazar datos categóricos.

Graficar con datos categóricos:

Este enfoque entra en escena cuando nuestra variable principal se divide en grupos discretos (categóricos). Esto se puede lograr usando la función catplot ().

catplot ():

Esta es una función a nivel de figura como relplot (). Puede caracterizarse por tres familias de funciones de nivel de ejes, a saber:

  1. Diagramas de dispersión: incluyen stripplot (), swarmplot ()

  2. Gráficos de distribución, que son boxplot (), violinplot (), boxenplot ()

  3. Estimateplots - es decir, pointplot (), barplot (), countplot ()

Tomemos ahora algunos ejemplos para demostrarlo:

EJEMPLO:

importar seaborn como sns importar matplotlib.pyplot como plt sns.set (style = 'ticks', color_codes = True) a = sns.load_dataset ('tips') sns.catplot (x = 'day', y = 'total_bill', datos = a)

SALIDA:

Como puede ver, en el ejemplo anterior no configuré el parámetro 'tipo'. Por lo tanto, ha devuelto el gráfico como diagrama de dispersión predeterminado. Puede especificar cualquiera de las funciones de nivel de ejes para cambiar el gráfico según sea necesario. Tomemos también un ejemplo de esto:

EJEMPLO:

importar seaborn como sns importar matplotlib.pyplot como plt sns.set (style = 'ticks', color_codes = True) a = sns.load_dataset ('tips') sns.catplot (x = 'day', y = 'total_bill', kind = 'violín', datos = a)

SALIDA:

La salida anterior muestra la trama de violín para el conjunto de datos de puntas. Ahora intentemos encontrar cómo visualizar la distribución de un conjunto de datos.

Visualización de la distribución de un conjunto de datos:

Básicamente, se trata de comprender los conjuntos de datos con contexto para que sean univariados o bivariados. Antes de comenzar con esto, solo importe lo siguiente:

importar numpy como np importar pandas como pd importar seaborn como sns importar matplotlib.pyplot como plt de scipy import stats sns.set (color_codes = True)

Una vez hecho esto, puede continuar trazando distribuciones univariadas y bivariadas.

Trazado de distribuciones univariadas:

Para trazarlos, puede hacer uso de la función distplot () de la siguiente manera:

EJEMPLO:

a = np.random.normal (loc = 5, size = 100, scale = 2) sns.distplot (a)

SALIDA:

Como puede ver en el ejemplo anterior, hemos trazado un gráfico para la variable a cuyos valores son generados por la función normal () usando distplot.

Trazar distribuciones bivariadas:

Esto entra en escena cuando tienes dos variables independientes aleatorias que dan como resultado algún evento probable. La mejor función para trazar este tipo de gráficos es jointplot (). Tracemos ahora un gráfico bivariado usando jointplot ().

EJEMPLO:

x = pd.DataFrame ({'Día': [1,2,3,4,5,6,7], 'Supermercado': [30,80,45,23,51,46,76], 'Ropa' : [13,40,34,23,54,67,98], 'Utensilios': [12,32,27,56,87,54,34]}, índice = [1,2,3,4,5 , 6,7]) y = pd.DataFrame ({'Day': [8,9,10,11,12,13,14], 'Grocery': [30,80,45,23,51,46, 76], 'Ropa': [13,40,34,23,54,67,98], 'Utensilios': [12,32,27,56,87,54,34]}, índice = [8,9 , 10,11,12,13,14]) media, cov = [0, 1], [(1, .5), (.5, 1)] datos = np.random.multivariate_normal (media, cov, 200 ) con sns.axes_style ('blanco'): sns.jointplot (x = x, y = y, kind = 'kde', color = 'b')

SALIDA:

Ahora que ha entendido las diversas funciones en Python Seaborn, pasemos a construir cuadrículas estructuradas de múltiples parcelas.

Cuadrículas de múltiples parcelas:

Python Seaborn le permite trazar múltiples cuadrículas una al lado de la otra. Estos son básicamente diagramas o gráficos que se trazan utilizando la misma escala y ejes para ayudar a la comparación entre ellos. Esto, a su vez, ayuda al programador a diferenciar rápidamente entre los gráficos y obtener grandes cantidades de información.

Considere el siguiente ejemplo de la función facetgrid () para trazar estos gráficos.

EJEMPLO:

sns.set (style = 'darkgrid') a = sns.load_dataset ('iris') b = sns.FacetGrid (a, col = 'especie') b.map (plt.hist, 'sepal_length')

SALIDA:

El resultado anterior muestra claramente la comparación entre los consejos que se dan durante el almuerzo y la cena. También puede trazar usando la función PairGrid cuando tiene un par de variables para comparar. Considere el siguiente ejemplo.

EJEMPLO:

sns.set (style = 'ticks') a = sns.load_dataset ('vuelos') b = sns.PairGrid (a) b.map (plt.scatter)

SALIDA:

Como puede ver, el resultado anterior se compara claramente entre el año y el número de pasajeros de diferentes maneras.

Seaborn también permite personalizaciones con respecto a la estética, que se analiza más a fondo.

Estética de la trama:

Este segmento del tutorial de Python Seaborn trata de hacer nuestras parcelas más atractivas y encantadoras.

Estética de la figura de Python Seaborn:

La primera función que discutiré es set (). He estado usando el parámetro 'estilo' de esta función antes. Este parámetro trata básicamente con temas marineros. En la actualidad, hay cinco de ellos disponibles: darkgrid, ticks, whitegrid, white y dark.

Considere el siguiente ejemplo que demuestra el tema blanco.

EJEMPLO:

importar seaborn como sns importar matplotlib.pyplot como plt sns.set (style = 'white', color_codes = True) a = sns.load_dataset ('tips') sns.boxplot (x = 'day', y = 'total_bill', datos = a)

SALIDA:

En la salida anterior, puede notar que el tema cambia a blanco. Puede explorarlos más a fondo utilizando los otros temas también. Si observa en la salida anterior, hay ejes presentes alrededor del gráfico. Sin embargo, esto también se puede personalizar usando la función despine (). Mira el ejemplo de abajo.

EJEMPLO:

importar seaborn como sns importar matplotlib.pyplot como plt sns.set (style = 'white', color_codes = True) a = sns.load_dataset ('tips') sns.boxplot (x = 'day', y = 'total_bill', data = a) sns.despine (offset = 10, trim = True)

SALIDA:



Note la diferencia entre las dos salidas anteriores. Sin embargo, hay muchas más opciones que puedes explorar por ti mismo.

Paletas de colores de Python Seaborn:

El color es básicamente la característica que se acerca al ojo humano más allá de cualquier otra característica. Seaborn te permite jugar con colores usando varias funciones como color_palette (), hls_palette (), husl_palette (), etc. Echa un vistazo a los colores que están presentes actualmente en seaborn.

EJEMPLO:

importar numpy como np importar seaborn como sns importar matplotlib.pyplot como plt sns.set () presentcolors = sns.color_palette () sns.palplot (presentcolors)

SALIDA:

La imagen de arriba muestra los colores que están presentes en seaborn. Lo he hecho usando la función palplot (). Para variaciones más profundas, puede usar hls_palette (), husl_palette (), etc.

Esto nos lleva al final del Tutorial de Python Seaborn. Espero que hayas entendido todo claramente. Asegúrate de practicar tanto como puedas .

Tienes una pregunta para nosotros? Menciónelo en la sección de comentarios de este blog “Tutorial de Python Seaborn” y nos comunicaremos con usted lo antes posible.

Para obtener un conocimiento profundo de Python junto con sus diversas aplicaciones, puede inscribirse en Live con soporte 24/7 y acceso de por vida.