P2P modulo 2. Estadística
Marieliz Rodriguez
PLANTEAMIENTO Y OBJETIVO:
Tomamos datos de la siguiente publicación:
"Using Cigarette Data for an Introduction to Multiple Regression", by Lauren Mcintyre in Volume 2, Number 1, of the Journal of Statistics Education.
La primera parte del objetivo lo cubriremos con esta tarea p2p, y la segunda parte, lo cubriremos en la segunda tarea p2p al finalizar el módulo 4.
Estudios realizados con anterioridad ponen de manifiesto que incrementos en el contenido de alquitrán y nicotina de los cigarrillos vienen acompañados por incrementos en el monóxido de carbono emitido al fumar. Partimos de estos datos y nos planteamos el siguiente objetivo:
OBJETIVO: Hacer el estudio descriptivo de los datos y …ver más…
Parte 3. Analice los Box plot (diagramas de caja) que se adjuntan y saque las conclusiones más relevantes. Debe escribir, al menos, sobre la posible asimetría y la existencia, o no, de outliers
Para el box-plot de la variable de monóxido de carbono podemos afirmar que la distribución es simétrica, ya que la mediana se sitúa prácticamente en el centro del rectángulo, también indica que el rango de valores es amplio, indicando una elevado valor de dispersión y que la mediana es la mejor que se va ajustar. El valor 16 se encuentra fuera del rango de valores que cubre desde el 10 al 90%, por lo que se corresponde con un outlier.
Para el box plot de la variable alquitrán podemos afirmar que la distribución es asimétrica positiva porque la mediana se posiciona en 12.800 mg de alquitrán, los datos están dispersos, se observa que el bigote de debajo es más largo que el de arriba, lo que significa que el 25% de la cantidad de alquitrán está más disperso que el otro 25% que está más concentrado. Esto quiere decir que la mitad de los datos ha obtenido 12.800 mg o menos de alquitrán y la otra mitad un 12.800 mg o más. El rango intercuartílico = Q3 - Q1 = 6.500; es decir, el 50% de los datos está comprendido en 6.500 mg de alquitrán.
Se han detectado dos valores que se encuentran por debajo del valor mínimo y