Conceptos fundamentales
La inferencia estadística se desarrolla en tres niveles complementarios:
La inferencia estadística presenta dos enfoques
A continuación desarrollaremos el procedimiento de los contrastes de hipótesis paramétricos si bien los primeros conceptos e intuiciones son válidos también para los no paramétricos.
Establecidas dos hipótesis
sobre el valor de un parámetro,
se construye una regla de decisión sobre dichas
hipótesis a partir de los datos muestrales. Así, se plantea
una hipótesis (y su alternativa) sobre una característica
de la población. Un contraste es una regla
de decisión
sobre dicha hipótesis (se acepta / no se rechaza o se rechaza
/ no se acepta) a partir de la información incompleta que proporciona
una muestra. Los contrastes también se denominan test o pruebas
estadísticas. Si la población
sigue una cierta distribución, las hipótesis se concretan
en valores de los parámetros: contrastes de hipótesis paramétricas;
en caso contrario, contrastes de hipótesis no paramétricas. |
Supongamos que tratamos de tomar una decisión
sobre la probabilidad de cara, p, en una moneda, utilizando
la información que proporcionan
20 lanzamientos. Planteamos como hipótesis a contrastar el que la ''moneda
es normal'', hipótesis que se puede concretar en términos del parámetro
de una distribución
de Bernouilli, ;
se trata, por tanto, de un contraste de hipótesis paramétricas.
Las
hipótesis pueden ser simples o compuestas según incluyan
una especificación única ()
o múltiple (
)
de la característica
poblacional.
La hipótesis nula, ,
es la hipótesis a contrastar. Habitualmente incluye una especificación única
de la característica poblacional. Es la hipótesis ''normal'',
la que nos queremos creer, y sólo rechazaremos si existen evidencias
significativas en su contra.
La hipótesis alternativa, ,
es la hipótesis complementaria. Puede incluir una especificación única
de la característica
poblacional (contrastes de hipótesis simples sin interés
práctico) o múltiples especificaciones (contrastes de hipótesis
compuesta). Según incluyan especificaciones a los ''dos lados'' o sólo
a ''un lado'' de la
especificación de la hipótesis nula (
)
hablaremos de contrastes bilaterales o contrastes unilaterales. En el ejemplo,
(moneda
cargada), se trata de un contraste bilateral; si fuese es
(moneda
cargada hacia caras), sería unilateral.
El estadístico de la prueba permite
obtener la probabilidad de que ocurra la muestra obtenida bajo la hipótesis
nula (a veces también bajo la alternativa); en el ejemplo, S, "número
de caras obtenidas". Da una
medida de la discrepancia entre lo esperado bajo (en el ejemplo, mitad de caras y mitad de cruces) y lo observado (el número
de caras, s, obtenido), discrepancia medida
en términos de probabilidad.
La región crítica o
de rechazo,
R.C., es el conjunto de valores muestrales para los cuales se rechaza .
Su complementario es la región de aceptación, R.A.,
conjunto de valores muestrales para los cuales se acepta
.
Determinada una de ellas queda
determinada la regla de decisión, el contraste. Su determinación
se realiza con el criterio de equivocarse lo menos posible. En el ejemplo,
![]() ![]() |
donde y
son los valores o puntos
críticos,
las fronteras entre la aceptación y el rechazo en términos del
estadístico.
Al tomar una decisión se pueden producir dos tipos de errores:
Las probabilidades de ambos errores son:
Dado que ''apostamos'' por ,
trataremos de encontrar una regla de decisión
(una región crítica) cuya probabilidad de error de tipo I no
supere un cierto umbral y que la probabilidad de error de tipo II, cumplida
la anterior
condición, sea mínima.
El límite máximo de la probabilidad de error de tipo I es el nivel
de significación,
,
habitualmente 0.10, 0.05 o 0.01. Fijado un nivel de significación, se
determinarán
los puntos críticos, con lo cual quedará
concretada la regla de decisión.
Un concepto que simplifica la toma de decisión es el p-valor, definido e interpretado en los siguientes términos:
En la hoja adjunta se ilustran todos estos conceptos.