Intervalos de confianza en poblaciones normales

Una población

Si la variable a analizar es numérica, el objetivo principal de la inferencia por intervalos de confianza es alguna medida de posición (media o mediana), de dispersión (varianza) o algún otro parámetro poblacional. Así, si se cuenta con información muestral sobre el número de horas diarias que un individuo está viendo la televisión, trataremos de estimar, puntualmente y por intervalo, el promedio de horas en la población.

En principio, si hacemos inferencia sobre un resumen de la variable podemos considerar que dicha variable sigue una distribución y plantear el problema desde la óptica paramétrica. Esa distribución puede ser cualquiera de las muchas distribuciones tipo (binomial, Poisson, normal, uniforme, gamma,...). Ahora bien, por distintos motivos (variables, originales o transformadas, con distribución más o menos campaniforme, teorema del límite central, simplicidad en los procedimientos, ...), lo más habitual es la suposición de normalidad. Entonces, suponiendo que la variable X sigue una distribución normal de media y desviación , estimaremos mediante intervalos de confianza y .

Dos poblaciones

En este caso, el objetivo fundamental es comparar la distribución de una variable cuantitativa X en las dos poblaciones (subpoblaciones) determinadas por las modalidades de una característica cualitativa dicotómica o, lo que es lo mismo, estudiar si la variable cuantitativa (variable respuesta) presenta diferencias significativas en cada uno de los dos niveles de la variable cualitativa (factor). Esta comparación se realizará a partir de la información parcial que proporcionan dos muestras. Denotaremos por y a la variable cuantitativa en cada una de las dos situaciones.

Si podemos aceptar normalidad, el objetivo general de comparar dos poblaciones se traduce en comparar las medias de la variable en cada una de ellas; aunque suele tener únicamente un interés instrumental, también se pueden comparar las varianzas.

Para poder realizar estas comparaciones se utilizan dos muestras provenientes de individuos diferentes (estudiar las posibles diferencias salariales en función del sexo a partir de una muestra de hombres y una muestra de mujeres); en este caso hablaremos de muestras independientes. A veces se puede utilizar una muestra con los mismos individuos para las dos situaciones de la variable (comparar la valoración de dos detergentes a partir de los datos que sobre uno y otro proporciona una única muestra de consumidores); en este caso hablaremos de muestras apareadas o relacionadas. Siempre que se puedan considerar muestras relacionadas, este procedimiento proporciona en principio mejores inferencias.

Poblaciones normales Una población I. de C. sobre la media
I. de C. sobre la varianza
 
Dos poblaciones Muestras independientes I. de C. sobre la diferencia de medias
I. de C. sobre el cociente de varianzas
Muestras relacionadas I. de C. sobre la diferencia de medias

Intervalo de confianza sobre la media poblacional

Sea X una variable con distribución normal de media y desviación y una muestra de tamaño n, .

A partir del estadístico

se construye el siguiente intervalo:

siendo el valor que en una distribución t de Student con n-1 grados de libertad deja a su derecha una probabilidad de .

Véase en la hoja adjunta un ejemplo de este intervalo.

A partir del estadístico

se puede construir el intervalo

siendo el valor que en una distribución normal estándar deja a su derecha una probabilidad de . Para ello se requiere del conocimiento de , algo en principio poco realista. A veces se utiliza cuando n es grande para variables normales, estimando previamente , o para variables no normales, en base al teorema del límite central.

Intervalo de confianza sobre la varianza poblacional

Sea X una variable con distribución normal de media y desviación y una muestra de tamaño n, .

A partir del estadístico

se construye el intervalo

siendo y los valores que en una distribución con n-1 grados de libertad dejan a su derecha una probabilidad de y , respectivamente.

Véase en la hoja adjunta un ejemplo de este intervalo.


Muestras independientes

Intervalo de confianza sobre la diferencia de medias poblacionales

Sean y variables normales, de media y y de varianza y , respectivamente, e independientes, disponiéndose de sendas muestras aleatorias de tamaño y :

El estadístico

si las varianzas se pueden suponer iguales, y el estadístico

en caso contrario, permiten construir los siguientes intervalos:

 

siendo el valor que en una distribución t de Student con n-1 grados de libertad deja a su derecha una probabilidad de .

Véase en la hoja adjunta un ejemplo de intervalo sobre la diferencia de medias.

Muestras independientes

Intervalo de confianza sobre el cociente de varianzas poblacionales

Sean y variables normales, de media y y de varianza y , respectivamente, e independientes, disponiéndose de sendas muestras aleatorias de tamaño y :

El estadístico


permite construir el intervalo de confianza

siendo y los valores que en una distribución F con y grados de libertad dejan a su derecha una probabilidad de y, respectivamente.

Véase en la hoja adjunta un ejemplo de intervalo sobre el cociente de varianzas.

Muestras relacionadas

Intervalo de confianza sobre la diferencia de medias poblacionales

Sean y variables, de media y , respectivamente, disponiéndose de sendas muestras aleatorias de tamaño n relativas a los mismos individuos (o individuos gemelos). Entonces se puede considerar la variable , de la que se dispone de una muestra aleatoria simple, , donde , variable que se supone normal de media y de varianza :

El estadístico

permite construir el intervalo de confianza

siendo el valor que en una distribución t de Student con n-1 grados de libertad deja a su derecha una probabilidad de .

Véase en la hoja adjunta un ejemplo de este intervalo.