Gráficos de caja múltiples en R
Contenidos
Los boxplots pueden crearse para variables individuales o para variables por grupo. El formato es boxplot(x, data=), donde x es una fórmula y data= denota el marco de datos que proporciona los datos. Un ejemplo de fórmula es y~grupo donde se genera un boxplot separado para la variable numérica y para cada valor de grupo. Añada varwidth=TRUE para que el ancho de los boxplots sea proporcional a la raíz cuadrada del tamaño de las muestras. Añada horizontal=TRUE para invertir la orientación del eje.
La función boxplot.matrix( ) del paquete sfsmisc dibuja un boxplot para cada columna (fila) de una matriz. La función boxplot.n( ) del paquete gplots anota cada boxplot con su tamaño de muestra. La función bplot( ) del paquete Rlab ofrece muchas más opciones para controlar la posición y el etiquetado de las cajas en la salida.
La función bagplot(x, y) del paquete aplpack proporciona una versión bivariante del boxplot univariante. La bolsa contiene el 50% de todos los puntos. Se aproxima la mediana bivariada. La valla separa los puntos dentro de la valla de los puntos fuera de ella. Se muestran los valores atípicos.
¿Cómo se crea un boxplot en R?
Boxplots en el lenguaje de programación R
Los boxplots se crean en R utilizando la función boxplot(). Parámetros: x: Este parámetro establece como un vector o una fórmula. data: Este parámetro establece el marco de datos.
¿Cuál es la fórmula de un boxplot en R?
El formato es boxplot(x, data=), donde x es una fórmula y data= denota el marco de datos que proporciona los datos. Un ejemplo de fórmula es y~grupo, donde se genera un boxplot separado para la variable numérica y para cada valor de grupo.
Ggplot boxplot
Podemos ver que tenemos un marco de datos con tres columnas (variables) de datos. La primera columna contiene el nombre del aeropuerto, mientras que la segunda y la tercera contienen los porcentajes de llegadas y salidas a tiempo del aeropuerto en cuestión.
Supongamos que queremos comparar los porcentajes de llegadas y salidas puntuales utilizando boxplots uno al lado del otro. Es muy sencillo. Basta con introducir los nombres de las columnas individuales en el comando boxplot. Aquí está la técnica del signo de dólar para acceder a las columnas del marco de datos que queremos.
En primer lugar, tenemos 20 observaciones (filas) de seis variables (columnas). Eso son 120 datos que no hemos tenido que teclear nosotros mismos. Menos mal. Tres de las variables (sujeto, edad y dosis) tienen clase entera, dos (inicio y fin) tienen clase numérica. Sin embargo, fíjese en la clase de la variable sexo. Es un “factor”. Esto significa que es una variable categórica.
Podemos utilizar el comando boxplot de R para aprovechar el vector factor (categórico) género. Supongamos, por ejemplo, que queremos crear gráficos de caja de la variable edad, pero basados en la variable categórica género. Así es como se hace.
Boxplot r
¿Qué es el boxplot en la programación de R? Un boxplot en R, también conocido como box and whisker plot, es una representación gráfica que permite resumir las principales características de los datos (posición, dispersión, asimetría, …) e identificar la presencia de valores atípicos. En este tutorial repasaremos cómo hacer un boxplot en R básico.
La caja de un boxplot comienza en el primer cuartil (25%) y termina en el tercero (75%). Por lo tanto, la caja representa el 50% de los datos centrales, con una línea dentro que representa la mediana. A cada lado de la caja se dibuja un segmento hasta el dato más lejano sin contar los outliers del boxplot, que en caso de existir, se representarán con círculos.
Un valor atípico es aquella observación que está muy alejada del resto de los datos. Se dice que un punto de datos es un outlier si es mayor que Q_3 + 1,5 \cdot IQR (outlier derecho), o es menor que Q_1 – 1,5 \cdot IQR (outlier izquierdo), siendo Q_1 el primer cuartil, Q_3 el tercer cuartil e IQR el rango intercuartil (Q_3 – Q_1) que representa el ancho de la caja para los boxplots horizontales.
Múltiples boxplots en una figura r
> boxplot(x)He aquí una simple ilustración de la función boxplot(). Aquí los valores de x están distribuidos uniformemente. Si ejecuta este código, verá un gráfico boxplot equilibrado.# cómo hacer boxplot en r estudio
> boxplot(y)Aquí hay una ilustración simple de la función boxplot() con los valores de x concentrados hacia el centro. Si ejecuta este código, verá un gráfico boxplot con la caja un poco aplastada en comparación con el anterior.AplicacionesLas aplicaciones de crear un boxplot usando R son numerosas. Aquí hay una ilustración del código para comparar el rendimiento de la gasolina de los coches de 4 cilindros con los de 8 cilindros.# cómo hacer un boxplot lado a lado en r