Distribuciones de frecuencia bidimensionales

Las técnicas estadísticas bivariantes permiten el análisis conjunto de dos características de los individuos de una población con el propósito de detectar posibles relaciones entre ellas. La naturaleza (nominal, ordinal o numérica) de las características objeto de estudio determinará las herramientas más adecuadas para su análisis.

Genéricamente designaremos por A y B a las dos características y por y , las correspondientes modalidades. La distribución conjunta de frecuencias viene dada por:
la frecuencia absoluta,

= número de individuos que presentan el par de modalidades

y la frecuencia relativa

= proporción de individuos que presentan el par de modalidades.

La tabla de doble entrada (tabla de contingencia) recoge, en términos absolutos o relativos, esta distribución conjunta:

Distribución de frecuencias conjunta de A y B
A / B

La última columna recoge la distribución marginal de A,

= número de individuos que presentan la modalidad ,

y la última fila, la distribución marginal de B,

= número de individuos que presentan la modalidad.


Dividiendo por cada uno de los valores de la tabla, obtendremos la distribución conjunta y las distribuciones marginales, en términos relativos:

, y

Si nos quedamos con los individuos que presentan la modalidad de B y analizamos en ellos la característica A, obtendremos la distribución condicionada de A cuando B vale ; esto es, obtenemos la distribución de A en la subpoblación formada por los individuos que presentan la modalidad de B.

A / B =
Frecuencia absoluta
Frecuencia relativa
1


Igualmente podíamos obtener la distribución condicionada de B cuando A vale . Del mismo modo podemos condicionar a más de una modalidad.
Las características A y B pueden ser independientes (no se influyen) o dependientes. Formalmente, A y B son independientes si se verifica cualquiera de las siguientes condiciones equivalentes:
- La distribución conjunta, en términos absolutos, es:

para todo .

- La distribución conjunta, en términos relativos, es el producto de las marginales:

para todo .

- La distribución condicionada, en términos relativos, coincide con la marginal:

para todo .

Existen distintos coeficientes que miden el grado de dependencia o asociación entre dos características cualitativas. La medida básica es el estadístico:

,

donde es la frecuencia absoluta observada del par de modalidades,

=,

y es la frecuencia absoluta esperada si y fuesen independientes,

.

En la medida en que se acerque a cero, la dependencia o asociación será débil, en la medida en que se aleje, la dependencia o asociación será más fuerte. A partir del coeficiente se obtienen otros (Phi, V de Cramer y Coeficiente de contingencia) que se interpretan de forma análoga.