Ejemplo 4. Se quiere estimar
la proporción de clientes de un hipermercado que están satisfechos
del trato recibido. Para ello, se encuesta a 10 clientes a la salida de la
línea de cajas; entre ellos, 7 están satisfechos, 2 no lo están
y otro dice que se lo tiene que pensar. Se trata, pues, de una población
de Bernoulli, ,
donde p representa la proporción de clientes satisfechos
con el trato recibido, y X representa un cliente genérico,
tomando el valor 1 si está satisfecho y 0 si no lo está.
En este caso, la información es parcial, porque sabemos que hemos obtenido 7 éxitos (7 unos), 2 fracasos (2 ceros), pero el décimo resultado ignoramos si es éxito o fracaso (desconocemos también el orden de los resultados, pero esa información sabemos que no es información útil para estimar p). En definitiva, ha ocurrido un suceso
S="7 u 8 éxitos en 10 tiradas independientes de Bernoulli de parámetro p"
y, como el número de éxitos es una variable binomial, B(10,p), podemos escribir simbólicamente
con lo que
y la ecuación de verosimilitud resulta, tras operar un poco,
Las soluciones son, por un lado, p=0
y p=1 (que son mínimos; de hecho, para esos valores la probabilidad
vale cero) y por otro las soluciones de la ecuación de segundo grado.
Una de ellas es p=1.4866, que no consideramos por estar fuera del
intervalo [0,1], y la segunda p=0.7534. Se comprueba (la comprobación
no es difícil, pero sí pesada) que para este valor la segunda
derivada es negativa, con lo cual, para ese valor existe un máximo.
En definitiva, la estimación máximo verosímil de la proporción
de clientes satisfechos es .
Obsérvese que no se obtiene el mismo
resultado eliminando ese indeciso. En ese caso, tendríamos 7 éxitos
y dos fracasos en 9 tiradas de Bernoulli independientes, con lo que estimaríamos
p como la proporción muestral de éxitos, ,
una estimación más alta.
Algunos expertos en tratamiento de encuestas
sugieren desdoblar los indecisos en dos encuestados, uno a favor y otro en
contra. Los que están a favor se desdoblarían en dos, ambos a
favor, y los que están en contra en dos, ambos en contra. Nuestros 10
encuestados se desdoblarían en 20, 15 a favor y 5 en contra. La estimación
de p sería ahora ,
la más baja de las 3.