MEDIDAS DE CONCENTRACIÓN
Para resumir la información de un conjunto de datos,
la Estadística Descriptiva proporciona una serie de medidas que se
clasifican de acuerdo con el tipo de características que se quieran
poner en evidencia. Así, hablamos de medidas de posición, dispersión,
forma y, por último, de medidas de concentración.
Mientras
que las primeras se pueden aplicar a cualquier variable estadística,
estas últimas, que desarrollaremos en el presente tema, sólo
pueden ser aplicadas a las variables que toman valores positivos. La condición
anterior es necesaria desde el punto de vista formal, pero insuficiente en
cuanto a su significado.
Las medidas de concentración han de aplicarse
a variables en las que tenga sentido plantearse la consideración del
grado de reparto entre cada uno de los individuos de la suma total de los
valores de la variable (como siempre en Estadística, entenderemos
la palabra individuo de forma genérica, es decir, las unidades de
las cuales se observa una cierta característica).
Las medidas de concentración
son medidas de reparto del total de la variable. Trataremos de estudiar si
el reparto es más o menos equitativo (el total se reparte de forma
más o menos igualitaria entre los individuos) o desigual (unos pocos
individuos concentran en sí gran parte del total).
De lo anterior ya podemos deducir qué variables serán aquellas
susceptibles de ser medidas desde el punto de vista de la concentración:
rentas de personas, regiones o países, ingresos y gastos familiares,
ventas de las empresas de un sector económico, propiedades agrícolas,
población provincial o regional, etc.
Situemos el problema en su génesis histórica. Desde sus orígenes,
la Economía ha tratado de explicar el porqué de las desigualdades
entre las distintas naciones o entre los individuos de una de ellas. En este
afán una de las primeras tareas ha consistido en la medición
de esa desigualdad manifiesta. Los enfoques han sido y son múltiples.
El que aquí vamos a ver y que se conoce en toda la literatura estadística
con el nombre de medidas de concentración, recoge técnicas
de medición del reparto de la renta (y por extensión de otro
tipo de variables) que tienen su origen en la curva de Lorenz. En 1905, el
estadístico americano Max Lorenz propone un método gráfico
para medir el grado de concentración (o de distribución) del
total de la renta de un país entre sus ciudadanos.
La idea es muy simple: para un cierto nivel de renta, se compara el porcentaje
de individuos con rentas iguales o inferiores a la dada y el porcentaje de
renta que dichos individuos detentan. Realizada esta comparación para
distintos niveles de renta, si los pares de porcentajes obtenidos son parecidos,
la renta estará distribuida más o menos equitativamente; si,
por el contrario, estos pares de porcentajes difieren sustancialmente, la
renta presenta una distribución poco igualitaria, concentrándose
en manos de unos pocos.
Acudiendo al símil vulgar, pero siempre esclarecedor, de la tarta,
las medidas de concentración calibran el buen o mal reparto del pastel.
Planteemos el problema con un ejemplo que recoja la distribución del
salario mensual, en euros, de los empleados de la empresa LOGISA.
Salarios |
Empleados |
Desde 500 hasta 700 |
60 |
Desde 700 hasta 1000 |
95 |
Desde 1000 hasta 1500 |
70 |
Desde 1500 hasta 2500 |
35 |
Desde 2500 hasta 5000 |
15 |
Organizaremos en una tabla los cálculos para hallar (proporción
de empleados con salarios iguales o inferiores a uno dado) y
(proporción
de masa salarial acumulada por dichos empleados). Si los datos de la variable,
referidos a N individuos, están agrupados en k intervalos (cuando
los datos estén sin agrupar el planteamiento es idéntico) dicha
tabla incluirá:
,
intervalo de valores de la variable X (salarios, rentas,...).
, marca de
clase (valor medio del intervalo), que representará a
todos los valores incluidos en el mismo.
, número de individuos para los cuales la variable X toma valores
en el intervalo.
,
número de individuos para los cuales X toma valores iguales
o inferiores al extremo superior del intervalo,
.
, valor anterior expresado en proporción sobre el total de
individuos.
,
suma total de los valores de X para los individuos del intervalo.
,
suma total de los valores de X para los individuos en los que X toma valores
inferiores o iguales a
.
, valor anterior expresado en proporción sobre la suma total
S de la variable.
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
Para los datos salariales de la empresa LOGISA, el cuadro obtenido será:
![]() |
La tabla se interpretará de la siguiente forma. Si nos fijamos, por ejemplo,
en la fila correspondiente al tercer intervalo salarial, sabremos que el
82% de los empleados de salarios inferiores (los 225 que no superan los 1.500
€) acumulan el 62% de la masa salarial (en concreto 204.250 euros).
La observación de la discrepancia entre las columnas con los valores
y
nos
puede dar una primera idea del grado de reparto del "pastel",
en este caso, de los 330.500 euros que constituye la masa salarial mensual
de la empresa LOGISA. Pero la observación, sin más, puede llevar
a distintas interpretaciones. Un observador puede decir que dichas columnas
se parecen mucho, mientras que otro puede opinar lo contrario. La Estadística
proporciona medidas objetivas de la discrepancia entre
y
,
es decir, medidas objetivas del reparto de la masa salarial.
A continuación se muestran dos de estas medidas: una gráfica, la curva de
Lorenz y otra geométrica, el índice de Gini.
Max Lorenz propuso la primera medida, de la que se deduce el resto. Sobre
un sistema de ejes cartesianos se representan los pares de valores ,
,
,...
,
donde el último par será siempre
(1,1). La poligonal obtenida al unir dichos puntos mediante segmentos recibe
el nombre de curva de Lorenz. Para resaltar más la representación
se enmarca el sistema de ejes en un cuadrado de lado unidad con uno de los
vértices en el origen (obsérvese que todos los
y
están
comprendidos entre 0 y 1), trazando la diagonal del mismo.
Para los valores de la empresa LOGISA la curva de Lorenz será:
![]() |
Cuando los salarios presenten una distribución más
o menos igualitaria, los valores de y
serán similares. Por tanto, la
curva de concentración tenderá a acercarse a la diagonal (los
puntos de la diagonal tienen el mismo valor de abscisa y ordenada).
Cuando los salarios presenten una distribución muy desigual, tendiendo
a concentrarse la masa salarial en unos pocos empleados, los valores de y
serán muy dispares. Entonces la curva se alejará de
la diagonal.
Veamos qué ocurre en los dos casos extremos:
Equidistribución
El total de valores de la variable S, se distribuye en partes iguales entre
los N individuos, correspondiendo S/N a cada uno. Entonces el cuadro quedará:
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
S/N
|
N
|
N
|
1
|
S
|
S
|
1
|
La curva de Lorenz coincidirá con la diagonal:
![]() |
Máxima concentración
Uno de los individuos acapara el valor total S de la variable.
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
0
|
N-1
|
N-1
|
(N-1)/N
|
0
|
0
|
0
|
S
|
1
|
1
|
1
|
S
|
S
|
1
|
Entonces la curva quedará "casi" pegada a los lados del recuadro:
![]() |
Por tanto, en la medida en que la curva se acerque a la diagonal,
hablaremos de equidistribución, y en la medida en que se aleje, hablaremos
de concentración.
La curva de Lorenz, como medida de concentración, presenta un problema
debido a su naturaleza gráfica. Cuando se interpreta para una única
distribución entramos en valoraciones subjetivas en relación
al acercamiento o alejamiento de la curva a la diagonal; cuando comparamos
dos distribuciones, a veces es difícil apreciar cuál de las
dos curvas se "pega" más a la recta de equidistribución.
Para evitar este inconveniente se desarrolla otro tipo de medidas, unas
geométricas y otras analíticas.
En el año 1912 el estadístico y demógrafo italiano
Corrado Gini propone una medida de concentración en base a la curva
de Lorenz, que consiste en una medición numérica del grado
de acercamiento de la curva a la recta de equidistribución: el área
entre dicha curva y la diagonal, que llamaremos área de concentración,
Ac. Entonces se define el índice de Gini como el doble de dicho área:
El cálculo de este índice, en concreto del área de
concentración, se realiza de forma sencilla teniendo en cuenta las áreas
del triángulo y trapecios que quedan por debajo de la curva de Lorenz.
Para los salarios de LOGISA, este índice vale 0,285.
De cara a interpretar dicho valor consideremos de nuevo los casos extremos:
Equidistribución
(En buena lógica no estaría definido).
Máxima concentración
Dicho valor será prácticamente uno cuando el número
de individuos N sea lo suficientemente grande.
De esta forma, valores del índice próximos a cero indican repartos
igualitarios y valores próximos a uno repartos desiguales.
La mediala
A partir de la curva de concentración de Lorenz se puede definir una
característica que, comparándola con la mediana, permite medir
el grado de reparto de la suma total de valores de la variable (S).
La mediala (Md) es el valor de la variable tal que la suma de los valores
de los individuos que individualmente toman un valor inferior o igual a la
mediala, es igual a la suma de los valores de los individuos que individualmente
toman un valor mayor que la mediala. Así, la mediala es el valor de
la variable para el cual toma
el valor 0.5. Si, cuando calculamos los pares de puntos (
,
)
que determinan la curva de concentración,
existe un valor de
exactamente igual a 0.5, la mediala será el
extremo superior del intervalo correspondiente. Si no es así, y al
igual que ocurría con la mediana, la mediala se obtendrá por
interpolación lineal entre los extremos del intervalo medial (aquel
al que le corresponda el valor de
inmediatamente superior a 0.5).
En el caso extremo de equidistribución, la mediala coincidirá con
la mediana: "la mitad de los individuos se lleva la mitad del pastel".
En los demás casos, la mediala será superior a la mediana: "la
mitad de los individuos, los que toman los valores inferiores de la variable,
se reparte menos de la mitad del pastel". La discrepancia entre la mediana
y la mediala da una idea del grado de concentración de las dos mitades
del total de valores de la variable.
Cálculo de la mediala para la empresa LOGISA
Como se observa en la tabla que recoge los cálculos realizados para
la determinación de la curva de Lorenz para la empresa LOGISA, no
existe ningún valor de igual
a 0.5. El intervalo (1000, 1500] es aquel al que le corresponde un valor
de
inmediatamente superior a 0.5;
esto es, se trata del intervalo medial. Interpolando en él, calcularemos
la mediala:
De acuerdo con el resultado anterior, los trabajadores que individualmente
reciben un salario menor o igual a 1277,14 euros, se llevan conjuntamente
la mitad de la masa salarial, esto es, 165.250 euros.
Una vez determinada la mediala podremos conocer qué porcentaje de individuos
gana menos que la mediala, o lo que es lo mismo, se reparte el 50% de la
masa salarial.
En nuestro ejemplo,
Este valor indica que el 70% de los trabajadores que menos ganan se llevan el 50% de la masa salarial, mientras que el 30% restante (los mejor pagados) se reparte la otra mitad.
Para ver resolución
del ejemplo LOGISA pulsa aquí. Para ver otro ejemplo pulsa
aquí.