Estadísticos y distribuciones
Cuando todas las posibles muestras de cierto tamaño tienen las mismas posibilidades de ser seleccionadas diremos que nos encontramos ante un muestreo aleatorio simple, m.a.s.
Una variable aleatoria n-dimensional es una muestra aleatoria simple si las n variables aleatorias
son independientes y tienen la misma distribución. Los valores que toma la muestra se llama realización de la muestra y se denota por Se llama tamaño de la muestra a |
Este método constituye la base de gran parte de los métodos de muestreo aleatorio.
Sea una m.a.s. de una población:
Así, la distribución de la muestra la obtenemos de la de la población.
Dada una m.a.s de una
población,
se llama estadístico a
una función de la muestra que sea variable aleatoria |
Un estadístico es clave para el estudio de características desconocidas de la población, no obstante podría producirse pérdida de parte de la información ya que el estadístico resume la información de la muestra.
Suma muestral | Media muestral | |||
Varianza muestral | Desviación típica muestral | |||
Cuasivarianza muestral | ||||
Covarianza muestral | Correlación muestral |
Un caso especial es el del estadístico ordenado, resultado de ordenar la muestra de tamaño n. Así, se llama muestra ordenada a las n variables aleatorias
donde
representa el mínimo y
el máximo de toda la muestra.
Asimismo, podríamos plantearnos el estadístico diferencia entre el máximo y el mínimo, llamado Recorrido,
,
o la mediana muestral, que se define como
Puede observarse que todos los estadísticos aquí recogidos son variables aleatorias unidimensionales, tendrán, por tanto, una función de distribución pudiéndose calcular sus principales momentos, por ejemplo, su media y varianza.
Así, si tenemos una m.a.s., es decir, , n variables aleatorias independientes e igualmente distribuidas con media m y desviación típica s, entonces, los momentos de los principales estadísticos son
Esperanza |
Varianza |
|
Suma muestral | ||
Media muestral | ||
Varianza muestral
|
||
Cuasivarianza muestral |
Ejemplo 1: Se lanzan 3 veces una moneda trucada, donde la probabilidad de cara es 2/3. Obtener la distribución de la muestra y de los principales estadísticos.
Ejemplo 2: Dada una población de 5 personas, se escogen muestras de tamaño 2, o de tamaño 3 o de tamaño 4. En cada una de las situaciones obtener las distribución muestral y de los principales estadísticos y comparar los resultados.
Distribución del máximo y del mínimo:
Tienen especial interés el estudio de la variable aleatoria máximo y de la variable aleatoria mínimo, de una m.a.s. de variables.
En cuanto a la distribución del mínimo (recuérdese que la función de distribución se expresa como la probabilidad acumulada hasta el punto):
y teniendo en cuenta que el suceso "ser el mínimo mayor que x",, equivale a que las n variables lo sean,, en consecuencia, la función de distribución es
y como las n variables son independientes, la probabilidad conjunta es el producto de las probabilidades y todas ellas son iguales al tener la misma distribución. Por tanto, la función de distribución del mínimo es:
Es inmediato obtener de aquí o bien su función de densidad, si la muestra es de una variable continua, o su función de probabilidad, si la muestra es de una variable discreta. En efecto,
o bien,
Por su parte la del máximo es:
tengamos ahora en cuenta que el "ser el máximo mayor que x",, equivale a que las n variables lo sean, en consecuencia, y como las n variables son independientes, la función de distribución es el producto de las probabilidades y todas ellas son iguales al tener la misma distribución. Por tanto, la función de distribución del máximo es:
Como en el caso anterior, es inmediato obtener de aquí o bien su función de densidad, si la muestra es de una variable continua,
o su función de probabilidad, si la muestra es de una variable discreta. En efecto,
Distribuciones exactas y distribuciones asintóticas del estadístico media muestral:
Sea una m.a.s. de una población, nos plantearemos qué distribución tiene exactamente la media muestral ,, de algunas de las variables más conocidas y utilizadas. Dicha distribución será función de la que tenga la población de partida. Así,
|
Para la distribución asintótica utilizaremos los conceptos que se derivan del Teorema del Límite Central. Sea una sucesión de variables aleatorias independientes e igualmente distribuidas,
|
En definitiva, y abreviadamente:
Además, si la variable tiene una distribución normal, coincide la distribución exacta y la asintótica. En efecto, si entonces y la media es . La misma que asintóticamente.
Para calcularla, observemos que despejando de la definición de varianza, podemos poner
.
Por tanto, también se tiene que
Luego la esperanza de la varianza muestral, , resulta ser
Se lanza una moneda 3 veces. La moneda está trucada a favor de las caras con el doble de probabilidad. Así, la variable es
La distribución de la muestra, donde "p" es la probabilidad de cara, es
Luego en nuestro ejemplo, donde p es 1 /3, la distribución de la muestra es
La distribución de la media muestral es
con lo que podemos obtener sus momentos
Por su parte, la distribución de la varianza muestral es
de donde obtenemos su media, 4 / 27, y su varianza, 8 / 729, como puedes comprobar.
Un ejercicio algo más complicado puede ser calcular la distribución conjunta de media y varianza, para ello las disponemos en una tabla de doble entrada:
0
|
1/3
|
2/3
|
1
|
|
0
|
0
|
0
|
||
2/9
|
0
|
0
|
y aquí podemos ejercitarnos en el cálculo de la covarianza o del coeficiente de correlación. Puede comprobarse que
y así, la covarianza es , y el coeficiente de correlación .
En cuanto al mínimo, , sus valores posibles son el 0 y el 1. Basta observar que cuando el mínimo es 1, lo es porque las tres variables lo son también, siendo ésta la única ocasión en que sucede este hecho, así,
y, por tanto, el estadístico mínimo muestral es
siendo su media 8 / 27 y su varianza 152 / 729.
El máximo, tiene un comportamiento similar, cuando el máximo es 0 es porque todas las variables lo son, es decir,
y, por tanto, el estadístico máximo muestral es
siendo inmediata su media y varianza.