En esta unidad nos haremos algunas consideraciones sobre otros promedios, menos conocidos que la media, mediana y la moda, pero que merecen su estudio, ya que en algunos casos específicos, se requiere de su aplicación
Esta medida se simboliza por M2. Se define como la raíz cuadrada de la media aritmética de los cuadrados de la variable.
Para datos no agrupados:
Para datos agrupados:
Este promedio raramente se usa como medida de posición. Se aplica en algunos casos tales como en problemas de probabilidad o cuando se hace indispensable trabajar con los cuadrados de los valores
Su mayor importancia la tiene, cuando se requiere promediar una variable que toma valores positivos y negativos, como ocurre, por ejemplo, al trabajar con desviaciones respecto a la media, siendo su suma igual a cero (propiedad de la media), y que al ser elevada al cuadrado cada desviación, el resultado será positivo. Como se observa, este promedio está definido rígidamente por una fórmula matemática. Al igual que la media, se deja influenciar demasiado por los valores extremos.
Ejercicio 1. Consideremos arbitrariamente 5 valores, con los cuales calcularemos la media cuadrática:
5 6 10 12 7
Como se trata de datos no agrupados, aplicamos la fórmula respectiva:
Este valor promedio es superior al de la media aritmética:
Ejercicio 2. Utilicemos la Tabla 4.15 correspondiente a una variable continua y calculemos con esos datos la media cuadrática.
Tabla 4.15
y’i-1 – y’i | ni | yi | yi2 | yi2 ni |
46,1 - 54 | 3 | 50 | 2.500 | 7.500 |
54,1 - 62 | 6 | 58 | 3.364 | 20.184 |
62,1 - 70 | 10 | 66 | 4.356 | 43.560 |
70,1 - 78 | 6 | 74 | 5.476 | 32.856 |
78,1 - 86 | 3 | 82 | 6.724 | 20.172 |
86,1 - 94 | 2 | 90 | 8.100 | 16.200 |
Σ | 30 | - | - | 140.472 |
Li – Ls | fi | Xi | Xi2 | Xi2fi |
La media aritmética de esta distribución es 67,6, valor inferior al obtenido al calcular la media cuadrática.
Su uso es mucho más limitado que el de la media cuadrática, por tal razón es un promedio casi desconocido; se simboliza por M3 y se define como la raíz cúbica de la media aritmética de los cubos de los valores de la variable.
Para datos no agrupados: | |
Para datos agrupados: |
Este promedio, al igual que los demás, exceptuando la media, está definido rígidamente por una fórmula matemática. Además, queda influenciado por valores extremos, más que en la media cuadrática.
Ejercicio 3. Consideremos los mismos 5 datos, que fueron utilizados para calcular la media cuadrática, y ahora obtengamos el valor de la media cúbica.
El valor de la media cúbica es mayor que el de la media cuadrática, y éste a su vez es mayor que el de la media aritmética.
Ejercicio 4. Utilicemos los datos de la Tabla 4.15 para calcular la media cúbica.
Tabla 4.15
y’i-1 – y’i | yi | ni | yi3 | yi3ni |
46,1 - 54 | 50 | 3 | 125.000 | 375.000 |
54,1 - 62 | 58 | 6 | 195.112 | 1.170.672 |
62,1 - 70 | 66 | 10 | 287.496 | 2.874.960 |
70,1 - 78 | 74 | 6 | 405.224 | 2.431.344 |
78,1 - 86 | 82 | 3 | 551.368 | 1.654.104 |
86,1 - 94 | 90 | 2 | 729.000 | 1.458.000 |
Σ | - | 30 | - | 9.964.080 |
Li – Ls | Xi | fi | Xi3 | Xi3fi |
La media geométrica es un promedio que también se encuentra definido rígidamente por una fórmula matemática. Se utiliza cuando se quiere dar importancia a valores pequeños de la variable o cuando se desea obtener el promedio de una serie de valores que están dados en progresión geométrica o aproximadamente geométrica.
Su empleo en el campo industrial y comercial es bastante restringido y su utilidad se limita a la obtención de promedios sobre el crecimiento o decrecimiento en una variable. Como por ejemplo: un capital colocado a una tasa de interés compuesto, durante un período determinado.
Los resultados de la media geométrica, al igual que el de la media, pueden ser usados en trabajos estadísticos posteriores, tal el caso de obtenerse submuestras y se desee al final calcular la media geométrica de la muestra.
La media geométrica se simboliza por Mg o Mo. Se define como la raíz enésima de la productoria de los n valores de la variable.
Para su cálculo se presentan dos casos:
a) Cuando son datos no agrupados u originales. El promedio geométrico se calcula hallando el producto de todos los elementos de la serie, y luego extrayendo la raíz del orden del número de observaciones consideradas.
El signo π (letra mayúscula del alfabeto griego, denominada pi) se lee “ productoria de”.
La fórmula de la media geométrica, tal como se ha visto, presenta el inconveniente de que tanto el producto de las xi así como su raíz, pueden ser de un valor demasiado alto que dificulte las operaciones; por otra parte, si un valor de xi es cero, el producto también será cero. Para obviar las dificultades anteriores se usan los logaritmos.
Observemos el cálculo de la media geométrica y la forma de aplicar su fórmula en datos no agrupados.
Ejercicio 5. $1.000 se colocan a un interés del 24% anual, el 31 de diciembre de 2014. Si el interés se capitaliza anualmente los días 31 de diciembre, calcular el promedio de dinero invertido entre el 31 de diciembre de 2014 y el 31 de diciembre de 2017.
Solución:
1.000 (1,24) = 1.240
1.240 (1,24) = 1.537,60
1.537,60 (1,24) = 1.906,62
Tabla 7.1
AÑOS | xi | log xi |
2014 | 1.000,00 | 3,00000 |
2015 | 1.240,00 | 3,09342 |
2016 | 1.537,60 | 3,18684 |
2017 | 1.906,62 | 3,28026 |
Σ | - | 12,56052 |
Ejercicio 6. Un país tiene en 2007 una población de 14 millones, la que sube a 22 millones en el 2017. Se pregunta por la población media en dicho período.
Solución: habitantes
Si examinamos la fórmula anterior, notaremos que, si uno o varios valores de la variable son negativos, de tal forma que el producto sea negativo la media geométrica no tiene sentido, porque da origen a una raíz imaginaria y no nos dará ninguna explicación al problema planteado.
b) Cuando son datos agrupados. La media geométrica se define como la raíz enésima de la productoria de los valores de la variable, elevadas cada una de ellas a una potencia, la cual está dada por la frecuencia absoluta.
Al igual que en datos no agrupados, las operaciones se simplifican si trabajamos con logaritmos:
Ejercicio 7. Consideremos los datos de la Tabla 4.15 para calcular la media geométrica.
Tabla 4.15
y’i-1 – y’i | yi | ni | log yi | ni log yi |
46,1 - 54 | 50 | 3 | 1,69897 | 5,09691 |
54,1 - 62 | 58 | 6 | 1,76343 | 10,58058 |
62,1 - 70 | 66 | 10 | 1,81954 | 18,19540 |
70,1 - 78 | 74 | 6 | 1,86923 | 11,21538 |
78,1 - 86 | 82 | 3 | 1,91381 | 5,74143 |
86,1 - 94 | 90 | 2 | 1,95424 | 3,90848 |
Σ | - | 30 | - | 54,73818 |
Li – Ls | Xi | fi | logXi | fi log Xi |
El promedio geométrico es siempre menor que la media aritmética, la cuadrática y cúbica.
Es muy común escribir erróneamente la fórmula dada para calcular la media geométrica:
En la fórmula correcta de la media geométrica, se multiplica cada frecuencia absoluta por el logaritmo del respectivo valor de la variable, en cambio, en la fórmula incorrecta se da a entender que es el logaritmo del producto de la variable por la frecuencia.
Ejercicio 8. La media aritmética de tres números es 8, la mediana es 8 y su media geométrica es . Se pide calcular los valores de esos tres números.
Solución
El promedio armónico se simboliza por M-1 o MH Este promedio se define diciendo que el recíproco de la media armónica es igual a la media aritmética del recíproco de los valores de la variable:
Observemos la aplicación de la fórmula, en un ejercicio trabajando con datos simples.
Ejercicio 9. Consideremos los índices de producción de cierto artículo, en los últimos cinco años, de acuerdo con los datos publicados por la empresa, y calculemos la media armónica.
Tabla 7.2
AÑOS | INDICE xi | 1/xi |
2013 | 128 | 0,0078 |
2014 | 135 | 0,0074 |
2015 | 141 | 0,0071 |
2016 | 152 | 0,0066 |
2017 | 163 | 0,0061 |
Σ | - | 0,0350 |
Ejercicio 10. Se sabe que dos obreros, A y B, gastan 50 y 40 minutos respectivamente en remontar un par de zapatos. ¿Cuál es el tiempo medio requerido para remontar un par de zapatos?
Solución
es el tiempo medio requerido.
Si se trata de datos agrupados o tablas de frecuencias, el recíproco de la media armónica estará dado:
de donde
Si necesitáramos utilizar la frecuencia relativa, la fórmula se convierte en:
Ejercicio 12. En la aplicación de la fórmula para calcular la media armónica utilizaremos los datos de la Tabla 4.15.
Puede observarse que la media armónica es menor que la media geométrica. En una distribución cualquiera, los valores de los diferentes promedios guardarán la siguiente relación:
Tabla 4.15
y’i-1 – y’i | yi | ni | ni / yi |
46,1 - 54 | 50 | 3 | 0,060 |
54,1 - 62 | 58 | 6 | 0,103 |
62,1 - 70 | 66 | 10 | 0,152 |
70,1 - 78 | 74 | 6 | 0,081 |
78,1 - 86 | 82 | 3 | 0,037 |
86,1 - 94 | 90 | 2 | 0,022 |
Σ | - | 30 | 0,455 |
Li–Ls | Xi | fi | fi / Xi |
La media armónica, al igual que la mayoría de los promedios, se encuentra rígidamente definida por una fórmula matemática y también se ve influenciada por datos extremos, especialmente por los más pequeños.
Se aplica cuando se desea promediar datos de una variable dada en forma de tasas, esto es, tantas unidades de un tipo por cada unidad de otra especie; pero también se utiliza para promediar datos inversamente proporcionales.
Pero su mayor uso se realiza en el cálculo de la velocidad promedio a saber:
S = espacio V = velocidad t = tiempo S = V · T
Supongamos dos espacios:
Si dividimos por t1 + t2 se tendrá:
Reemplazando se tendrá que:
Ejercicio 13. Supongamos que la distancia entre dos ciudades, A y B, es de 80 kilómetros, y entre B y C de 120 kilómetros. Si un automovilista cubre cada una de las etapas en tiempos iguales, ¿cuál es la velocidad promedio?
Solución: Si el tiempo permanece constante pero varía la distancia, utilizamos la media aritmética:
Modifiquemos el anterior ejercicio y observemos lo siguiente:
Ejercicio 14. Supongamos que un automovilista recorre la distancia de 80 kilómetros que hay entre A y B a una velocidad de 100 km/h. y los restantes 120 kilómetros a una velocidad de 80 km/h. ¿Cuál es la velocidad promedio?
Un promedio incorrecto sería aplicar la media aritmética.
La forma correcta será aplicar la media armónica:
Ahora, si el problema se plantea de la siguiente forma:
S1 = 80 S2 = 120 V1 = 80 V2 = 120
Al aplicar la media armónica se obtendrá:
tal como aparece en el ejercicio 13. Otra aplicación errónea de la media aritmética, se puede observar en el ejercicio siguiente, en el cual se debe utilizar la media armónica.
Ejercicio 15. Un grupo de trabajadores hace 120 papeleras para escritorio con una productividad de 12 papeleras diarias; una vez terminado ese contrato se dedican a producir otras 120 papeleras a razón de 18 por día. Se desea determinar la productividad diaria en la elaboración de las 240 papeleras.
Solución: Si se calcula la media aritmética, se tendrá un resultado erróneo:
Sabemos que las primeras 120 papeleras las hacen en 10 días 120 ÷12 = 10 y las siguientes 120 papeleras en 6,67 días 120 ÷18 = 6, 67 ; es decir que el total de las 240 las harían en 16,67 días; y el rendimiento por día es de 15 por lo tanto se tendría: 16,67 × 15 = 250 papeleras, cantidad diferente a 240, que teníamos inicialmente.
Ahora, si en vez de la media, utilizamos la media armónica, se tiene:
Siendo el promedio de 14,4 papeleras por día, para un total de 16,67 días se tendrá que el número total de papeleras para escritorio, producido en ese tiempo es:
14,4 × 16,67 = 240.
Con lo anterior se confirma que la media armónica es útil cuando se presenta una relación inversa entre las variables implícitas.
Ejercicio 16. Tres amas de casa, A, B y C, fueron a hacer mercado a tres partes diferentes. Cada una gastó $10.000 en la compra de naranjas. A compró 4 docenas; B compró 6 docenas; C compró 3 docenas. ¿Cuál es el precio promedio por docena?
Solución: Utilizando la media aritmética se tendría
Precio por docena:
para para par
El precio promedio sería:
Si la docena valiera en promedio $2.500, las 13 docenas costarían 2.500 × 13 = 32.500, cuando en realidad costaron $30.000.
Calculemos el precio promedio utilizando la media armónica:
Si el precio por docena es de $2.307,7 las 13 docenas costarán: 2.307, 7×13 = 30.000
Se vio en el capítulo 6, que la mediana es el valor correspondiente a la observación central, en tal forma que supere la mitad y sea superada por la otra mitad de las observaciones. En otras palabras, la distribución se divide en dos partes iguales, ubicándose la mediana en el centro. Algo parecido sucede con los cuartiles, deciles y percentiles. Veámoslos:
Para calcular los cuartiles se divide la distribución en cuatro partes, de tal manera que cada una contenga igual número de observaciones, es decir, el 25% de las observaciones. Se denominan cuartiles a los tres valores que separan a la frecuencia total de la distribución, dividida en cuatro partes iguales. El valor central es igual a la mediana y corresponde al segundo cuartil.
Los cuartiles, deciles y percentiles se emplean con más frecuencia en variables continuas, siempre que el número de intervalos sea grande y se desee obtener un promedio que corresponda a una determinada parte de la distribución.
El cuartil inferior (Q1) es aquel valor de la variable que supera al 25% de las observaciones y a la vez, es superado por el restante 75%.
El segundo cuartil (Q2) es aquel valor de la variable que supera al 50% y a la vez es superado por el otro 50% de las observaciones. (Igual a la mediana).
El tercer cuartil (Q3) es aquel valor de la variable que supera al 75% y es superado por el restante 25% de las observaciones.
Datos sin agrupar. Con los siguientes datos, los cuales deben ser ordenados de menor a mayor, calcular el Tercer Cuartil.
2 2 5 8 12 12 16 18 21 21 24 30 32 32 36 40 44 50 (n = 18)
Los pasos que se siguen en el cálculo de estos promedios son muy parecidos a los aplicados para calcular la mediana, a saber:
Si en vez de dividir la distribución en cuatro partes iguales, la dividimos en 10 partes, se tendrá uno de los nueve valores que dividen la frecuencia total en diez partes iguales.
Datos sin agrupar. Con los 18 datos que se dieron para calcular el Q3, utilicémoslo para calcular el D3 (tercer decil) y D7 (séptimo decil).
La posición para el tercer décil será: . El valor 12 está ubicado en la posición 5ª y con el 0,70, se utilizará para multiplicarlo por la diferencia entre la posición 5ª y 6ª, es decir: 0,7 (12-12) = 0 por lo tanto: D3 = xj = 12
En el caso del séptimo decil, la posición será:
La posición 13ª lo tiene el valor 32 y luego 0,3 (32-32) = 0
Siendo: D7 = xj = 32
El primer decil (D1) es igual al valor que supera al 10% de las observaciones y a la vez es superado por el restante 90%.
El proceso que se sigue en su cálculo, es muy parecido al desarrollado en los cuartiles, con la diferencia de que n se divide entre 10 y no entre cuatro.
También se tendrá dos casos:
Así se procederá para los demás deciles.
Si deseamos dividir la distribución en cien partes con igual número de observaciones, se tendrán 99 valores de la variable que separan a la frecuencia total de la distribución divididas en 100 partes iguales.
Datos sin agrupar. Con los mismos datos sin agrupar utilizados para calcular los Q3, D3 y D7 , calculemos los percentiles: 22; 46 y 82
Percentil Es la posición donde ubicaremos dicho percentil La posición 4ª la ocupa el valor 8 y el restante estará dado por 0,18 (12-8) = 0,72
Siendo: P22 = 8,72
Percentil Nos indica la posición, así:
la posición 8ª corresponde al valor 18, más 0,74 (21-18) = 2,22 → P46 = 20, 22
Percentil Siendo:
la posición 15ª igual a 36, más 0,58 (40-36) = 2,32 → P82= 36 + 2,32 = 38,32
El percentil 26 se calculará así:
Se diría que el percentil 26 corresponderá a aquel valor de la variable, que supera al 26% y a la vez es superado por el 74% de las observaciones.
Ejercicio 17. Utilizando los datos de la siguiente distribución, se pide calcular: a) el tercer cuartil, b) el cuarto decil y c) el percentil sesenta.
Solución:
y’i−1 − y’i | ni | Ni |
30,1 - 38 | 9 | 9 |
38,1 - 46 | 16 | 25 |
46,1 - 54 | 31 | 56 |
54,1 - 62 | 42 | 98 |
62,1 - 70 | 23 nj | 121 |
70,1 - 78 | 15 | 136 |
78,1 - 86 | 9 | 145 |
86,1 - 94 | 5 | 150 |
Σ | 150 | - |
X’i−1 −X’i | fi | Fi |
• Cuarto decil → (D4) (posición)
Nj-1 = 56 será valor inmediatamente inferior a 60.
Nj = 98 será el valor inmediatamente superior a 60.
Siendo: ; se aplicará la siguiente fórmula:
• Percentil sesenta → (P60) (posición)
Nj-1 = 56 será el valor inmediatamente inferior a 90.
Nj = 98 será el valor inmediatamente superior a 90.
Siendo: ; se tendrá que:
Es un promedio raramente utilizado debido a su poca representatividad, especialmente cuando es aplicado en datos agrupados. Este promedio se define como la media aritmética de sus valores extremos.
Las fórmulas utilizadas en el cálculo del centro recorrido son:
De acuerdo con las fórmulas anteriores, se podrá comprender el por qué hemos denominado a este promedio como centro recorrido, al ser el punto medio del rango.
También es bueno observar, que al no ser tenidas en cuenta las frecuencias para el cálculo del promedio, lo sitúa en la mayoría de los casos, como un promedio poco típico de la distribución.
Ejercicio 18. Calcular el centro recorrido para cada una de las siguientes distribuciones:
a) Los salarios semanales de 10 vendedores son:
$ 325.000 | 456.000 | 336.800 | 528.500 | 413.000 |
383.000 | 492.400 | 315.000 | 603.200 | 380.000 |
b)
yi | ni |
50 | 3 |
58 | 6 |
66 | 10 |
74 | 6 |
82 | 3 |
90 | 2 |
Σ | 30 |
Xi | fi |
c)
y’i−1 − y’i | ni |
46,1 - 54 | 3 |
54,1 - 62 | 6 |
62,1 - 70 | 10 |
70,1- 78 | 6 |
78,1 - 86 | 3 |
86,1 - 94 | 2 |
Σ | 30 |
X’i-1 – Xi’ | fi |
a)
La media de esos 10 valores es:
Moda, no hay en este ejercicio
La mediana será:
b)
c)
Calculadora CASIO fx–5000F
Primero: oprimir las teclas MODE X y debe aparecer en pantalla, en la parte superior SD.
Segundo: si se desea borrar la información obtenida en cálculos anteriores, se oprime SHIFT DEL EXE ojalá dos veces; no importa si en la pantalla aparece algún número después de realizado el procedimiento
Tercero: entrada de datos:
Ejemplo 1. xi = 5; 10; 20; 13; 27. Se oprime el número correspondiente a x, consideremos 5 luego la tecla que corresponde a DATA; así se prosigue con el 10, luego con el 20 y así sucesivamente
Ejemplo 2. Si los datos estan agrupados
yi: | 2 4 6 8 10 |
ni: | 8 6 10 12 9 = 55 |
La entrada de los datos se hará así:
2 SHIFT | ; 3 | luego será: |
4 SHIFT | ; 16 | DATA y así sucesivamente. |
La obtención de resultados para el primero y segundo ejemplo se utilizará las mismas teclas.
Los resultados en el ejemplo 1, son:
En el ejemplo 2, son:
Calculadora CASIO fx 30MS
Primero: Al oprimir MODE aparece en pantalla tres operadores:
COMP | SD | REG |
1 | 2 | 3 |
se oprime el 2 y se obtiene SD, con el cual trabajamos; el 1 se emplea para normalizar la calculadora, una vez realizada las operaciones estadísticas, y el 3 para trabajar simultáneamente con dos variables
Segundo: borramos cualquier información que se tenga con SHIFT MODE (CLR) y aparecen varias operadores, escogiendo el SCL oprimiendo la tecla 1 , con lo cual queda lista para iniciar los cálculos
Tercero: la entrada de los datos, es igual al de la calculadora anterior
Cuarto: la salida de los datos calculados se hace:
Los resultados se interpretan igual que en la calculadora anterior.
Casio fx–570 MS
Primero: iniciamos oprimiendo las teclas MODE y nos da dos opciones:
1 COMP 2 CMPLY ; luego oprimimos otra vez MODE, presentando otras tres opciones: , seleccionamos SD, luego oprimimos la tecla 1
Segundo: capturamos la información tal como se hizo con la primera calculadora, es decir:
Se debe oprimir SHIFT para que aparezca ; la salida de los datos es exactamente igual al anterior.
1 |
Calculadora CASIO fx – 350 TL
Con MODE aparece 1 COMP 2 SD 3 REG
Se oprime el 2 para trabajar con la función estadística, los datos se capturan como en todos los casos anteriores y la salida de los datos se hará así:
→ Media aritmética |
→ Desviación típica |
→ Desviación típica corregida |
Ahora con RCL y las letras A B C se obtienen datos para:
RCL A ∑ X2 RCL B ∑ X RCL C n
Ubiquémonos en la barra de MENU, con el MOUSE haciendo CLIC en HERRAMIENTAS debe aparecer la siguiente Figura 1:
Figura No. 1. Microsoft Excel
Al hacer CLIC en el submenú ANÁLISIS DE DATOS , debe aparecer la siguiente Figura 2:
Si en el despliegue, en la parte final, no aparece el submenú ANÁLISIS DE DATOS, deberá ubicarse en el submenú COMPLEMENTOS, con el cual se logra su obtención.
Figura No. 2. Funciones para análisis
Con la Figura No. 2, correspondiente a ANÁLISIS DE DATOS, procederemos a seleccionar una de las funciones, en nuestro caso la opción identificada como ESTADÍSTICA DESCRIPTIVA, luego al hacer CLIC en ésta y ACEPTAR debe aparecer la figura siguiente:
Figura No. 3. Estadística Descriptiva
Cuadro No. 4
SEXO | ESTADO CIVIL | PROFESIÓN | EDAD | SALARIO | LECTURA | Nª DE HERMANOS | ESTATURA |
1 | 1 | 2 | 28 | 1 | 5 | 0 | 158 |
1 | 2 | 2 | 36 | 2 | 2 | 0 | 162 |
2 | 2 | 1 | 25 | 2 | 6 | 1 | 170 |
1 | 6 | 1 | 28 | 2 | 10 | 1 | 172 |
2 | 3 | 3 | 19 | 1 | 4 | 1 | 165 |
1 | 3 | 1 | 32 | 3 | 4 | 2 | 148 |
1 | 1 | 5 | 29 | 2 | 2 | 2 | 146 |
1 | 1 | 1 | 48 | 2 | 3 | 1 | 155 |
2 | 3 | 1 | 53 | 1 | 5 | 1 | 164 |
1 | 6 | 4 | 26 | 4 | 10 | 0 | 172 |
1 | 4 | 3 | 32 | 6 | 6 | 4 | 183 |
2 | 3 | 3 | 19 | 2 | 8 | 1 | 178 |
2 | 4 | 1 | 19 | 2 | 2 | 1 | 164 |
2 | 1 | 4 | 28 | 1 | 2 | 0 | 166 |
1 | 1 | 4 | 31 | 1 | 5 | 0 | 154 |
2 | 5 | 6 | 48 | 6 | 2 | 2 | 146 |
1 | 4 | 7 | 62 | 7 | 4 | 6 | 180 |
2 | 3 | 1 | 58 | 6 | 6 | 2 | 172 |
1 | 2 | 8 | 43 | 1 | 4 | 1 | 165 |
1 | 1 | 6 | 29 | 2 | 2 | 0 | 155 |
1 | 5 | 5 | 19 | 5 | 5 | 1 | 150 |
2 | 5 | 1 | 28 | 4 | 2 | 1 | 149 |
1 | 6 | 1 | 63 | 3 | 2 | 8 | 161 |
2 | 2 | 3 | 26 | 2 | 4 | 1 | 163 |
2 | 1 | 3 | 26 | 2 | 4 | 1 | 165 |
1 | 1 | 4 | 37 | 1 | 5 | 2 | 168 |
2 | 3 | 1 | 41 | 5 | 4 | 2 | 171 |
2 | 2 | 7 | 52 | 6 | 2 | 0 | 164 |
1 | 1 | 8 | 49 | 7 | 10 | 1 | 165 |
2 | 4 | 1 | 28 | 2 | 6 | 2 | 170 |
1 | 6 | 8 | 23 | 7 | 1 | 0 | 180 |
2 | 1 | 7 | 25 | 1 | 6 | 0 | 174 |
2 | 1 | 6 | 36 | 2 | 7 | 1 | 162 |
2 | 1 | 6 | 45 | 2 | 2 | 1 | 149 |
1 | 1 | 6 | 21 | 3 | 2 | 3 | 158 |
Teniendo en cuenta la Figura No. 3 ESTADÍSTICA DESCRIPTIVA, se comienza el procesamiento de los datos. Recordemos que el RANGO DE ENTRADA es el correspondiente a la variable estatura registrados en el cuadro No. 4.
En la misma figura anterior, aparecen unas opciones de salida, con alternativa de ser una HOJA NUEVA o en un LIBRO NUEVO.
Además, aparecen: RESUMEN DE ESTADÍSTICAS; NIVEL DE CONFIANZA PARA LA MEDIA: 95% o cualquier otro valor establecido; K-ÉSIMO MAYOR y, finalmente, K-ÉSIMO MENOR, activando o haciendo CLIC en cada uno de ellos. En caso de considerar la obtención de un mayor número de resultados para el análisis.
Al hacer CLIC en ACEPTAR, se obtiene la información, tal como puede observarse en la Figura No. 4.
Figura No. 4. Resultados obtenidos con 35 datos, correspondiente a la estatura de cada uno de ellos en el cuadro anterior
Medidas | Resultados |
Media | 163.542857 |
Error típico | 1,69047895 |
Mediana | 164 |
Moda | 165 |
Desviación estándar | 10,0010084 |
Varianza de la muestra | 100,020168 |
Curtosis | 0,61873584 |
Coeficiente de asimetría | 0,7293699 |
Rango | 37 |
Mínimo | 146 |
Máximo | 183 |
Suma | 5724 |
Cuenta | 35 |
Mayor (1) | 183 |
Menor (1) | 146 |
Nivel de confianza(95.0%) | 3,43546655 |
Para lograr los anteriores resultados en todas y cada una de las opciones (Resumen de estadísticas; nivel de confianza para la media, K-ésimo mayor y K-ésimo menor), deben señalarse. El total de la información que aparece en el cuadro No. 4.
Los resultados de la Figura No. 4, nos muestran un cuadro resumen con los valores de la: Media, Error Típico; Mediana; Asimetría; Mínimo; Máximo; Suma; Conteo para la variable ESTATURA.
Este procedimiento lo podemos aplicar a las demás variables y éstos son los resultados.
Cuadro No. 5. Resultados para cada una de las columnas del cuadro No. 4, con datos sin agrupar
MEDIDAS | SEXO | ESTADO CIVIL | PROFESIÓN | EDAD | SALARIO | LECTURA | Nª DE HERMANOS | ESTATURA |
Media | 1,48571429 | 2,74285714 | 3,74285714 | 34,6285714 | 3,02857143 | 4,4 | 1,42857143 | 163,542857 |
Error típico | 0,08571429 | 0,29941921 | 0,41675589 | 2,15924268 | 0,34173486 | 0,41646774 | 0,28487271 | 1,69047895 |
Mediana | 1 | 2 | 3 | 29 | 2 | 4 | 1 | 164 |
Moda | 1 | 1 | 1 | 28 | 2 | 2 | 1 | 165 |
Desviación estándar | 0,50709255 | 1,77138791 | 2,46556111 | 12,7742519 | 2,02173068 | 2,46385637 | 1,68532968 | 10,0010084 |
Varianza de la muestra | 0,25714286 | 3,13781513 | 6,0789916 | 163,181513 | 4,08739496 | 6,07058824 | 2,84033613 | 100,020168 |
Curtosis | -2,12121212 | -0,93324066 | -1,28946709 | -0,41831475 | -0,67911041 | 0,23938769 | 7,11286648 | -0,6187358 |
Coeficiente de asimetría | 0,05975838 | 0,61675703 | 0,32683883 | 0,7826408 | 0,86478149 | 0,87194364 | 2,43773765 | -0,072937 |
Rango | 1 | 5 | 7 | 44 | 6 | 9 | 8 | 37 |
Mínimo | 1 | 1 | 1 | 19 | 1 | 1 | 0 | 146 |
Máximo | 2 | 6 | 8 | 63 | 7 | 10 | 8 | 183 |
Suma | 52 | 96 | 131 | 1212 | 106 | 154 | 50 | 5724 |
Cuenta | 35 | 35 | 35 | 35 | 35 | 35 | 35 | 35 |
Mayor (1) | 2 | 6 | 8 | 63 | 7 | 10 | 8 | 183 |
Menor(1) | 1 | 1 | 1 | 19 | 1 | 1 | 0 | 146 |
Nivel de confianza(95,0%) | 0,17419239 | 0,60849303 | 0,84694987 | 4,38810905 | 0,69448878 | 0,84636427 | 0,578931 | 3,43546655 |
Observe cuidadosamente los errores que se pueden cometer en el análisis de resultados. En primer lugar las características cualitativas: SEXO, ESTADO CIVIL, PROFESIÓN, solo sería válido el MODO, pero las medidas a aplicar son proporciones, para luego presentarlas como porcentajes. Las 3 caraterísticas anteriores más salarios, en ellos fueron empleados códigos y con ellos no se pueden aplicar las medidas anteriores
Se podrá calcular en forma independiente, cada una de las medidas denominadas de TENDENCIA CENTRAL y de DISPERSIÓN. Para ello solo se va a tomar una de las variables, en este caso será la ESTATURA, de acuerdo con la información del cuadro No. 4.
El proceso de cálculo es el siguiente:
Seleccionamos la CELDA, es decir, la activamos en el lugar donde deseamos que aparezca el resultado.
Con el MOUSE nos movemos al ICONO y le damos CLIC dos veces a fx y aparecerá la figura, correspondiente a PEGAR FUNCIÓN:
Figura No. 5. Pegar función
Luego de haber activado fx, se debe escoger la categoría ESTADÍSTICA y luego el NOMBRE DE LA FUNCIÓN que vayamos a estimar, para el caso seleccionamos MEDIA ACOTADA, después vamos a la opción ACEPTAR, al hacerle CLIC, debe aparecer la Figura No. 6.
Figura No. 6. Media
En esta Figura No. 6 se nos pide en la primera celda la Matriz. Se debe ir al cuadro No. 4 y sombrear todos los datos de la columna ESTATURA donde está nuestra variable sin soltar el botón izquierdo.
En la casilla que dice PORCENTAJE se le da el valor de cero (0) y se observará que el resultado de la MEDIA es de 163,7058824, siendo el mismo resultado que se obtuvo por el procedimiento anterior, tal como lo muestra la Figura No. 7.
Figura 7. Cálculo de la media (estatura)
Nota: el procedimiento anterior es aplicado igualmente para las diferentes medidas de POSICIÓN y de DISPERSIÓN, sólo cambia cuando nos ubicamos en el nombre de la función, es decir, la medida que se requiere calcular.
A continuación del uso del EXCEL y de los ejercicios para resolver, se expone la TEORIA de varias medidas de posición y de tendencia central, entre otros, la Mediana, Moda, y Media geométrica.
En datos sin agrupar hay dos maneras de estimarla:
a) Número de observaciones IMPAR. En este caso se ordenan los datos de menor a mayor o viceversa, luego seleccionamos como MEDIANA al valor central.
Ejemplo: | 3 5 12 16 30 |
Me |
b) Número PAR de observaciones. También se ordenan de mayor a menor o de menor a mayor; se tiene dos valores en el centro, por lo tanto se promedian.
Ejemplo: |
Figura No. 8 Mediana
Nota: nos ubicamos en AUTOSUMA y luego seleccionamos MAS FUNCIONES haciendo clic en selección UNA CATEGORIA que puede ser: Mediana, Moda, Media geométrica o aquella que usted desee
Obsérvese, que para el cálculo de la MEDIANA y DEMÁS MEDIDAS, aparece en las primeras casillas la palabra NÚMERO 1, en ésta se debe copiar el rango de los valores que aparecen en las columnas del cuadro No. 4, con sólo establecer el rango aparece el resultado, que al compararlo con el obtenido en el anterior método, la MEDIANA sigue siendo igual a 164,5. NOTA: Este resultado se localiza en la celda que se escoja y así sucesivamente. Lo invito a que estime los demás valores de las otras variables que aparecen en el cuadro No. 4.
Se define como aquel valor de la variable que más se repite. Para algunos no es aconsejable calcularla mediante la utilización de EXCEL en caso de que haya más de una MODA, es decir, que sea BIMODAL o PLURIMODAL. Sólo se debe aplicar si es unimodal, es decir, cuando hay una sola MODA.
Cuando es BIMODAL o PLURIMODAL solo se reconoce la primera MODA de la lista.
Los pasos son los mismos utilizados para el cálculo de la MEDIA y MEDIANA es decir,
Figura No. 9. Moda
Figura No. 10. Estimación moda (estatura)
Obsérvese, que el valor que más se repite en la muestra es 165, siendo el mismo valor registrado en el Cuadro No. 5.
Se define como “la raíz enésima del producto de los valores de la variable”
Fórmula
Nuevamente se sigue los mismos pasos aplicados para calcular la Media, Mediana, y Moda. Se hace CLIC en la parte izquierda correspondiente a CATEGORÍA ESTADÍSTICA, luego, a la derecha seleccionamos el renglón MEDIA GEOMÉTRICA, finalmente hacemos CLIC en ACEPTAR.
Para utilizar el excel en el cálculo de la media, se realiza el siguiente procedimiento.
Tomemos ahora como ejemplo, la tabla que aparece en el cuadro siguiente, correspondiente a la variable (yi) ESTATURA, y su frecuencia absoluta, siendo (ni) el número de veces que se repite cada valor de la variable. Para ello vamos a tener presente una tabla de datos agrupados, aplicando la fórmula que deberá ser digitada:
=SUMAPRODUCTO(A2:A9;B2:B9)/SUMA(B2:B9)
Este capítulo sirvió para presentar otros promedios, diferentes a la media, mediana y moda, que pueden ser aplicados en casos especiales, atendiendo a ciertas caracterís-ticas que presenta la variable.
El uso de la media cuadrática es adecuado cuando se requiere calcular un promedio para lo cual deben ser elevados los valores de la variable al cuadrado, como en algunos casos de probabilidad y en aquellas variables que toman valores positivos y negativos, cuya suma puede ser igual a cero. Este promedio se deja influenciar por valores extremos especialmente por los más grandes.
La media geométrica es utilizada para promediar crecimientos geométricos, también cuando se quiere dar importancia a valores pequeños y en aquellos casos en que se requiere determinar el valor medio para un conjunto de porcentajes.
Este promedio presenta el inconveniente de su inestabilidad en el muestreo, su cálculo es bastante complicado, y está definido por una fórmula rígida. Además, el valor del promedio geométrico queda influenciado por todos los valores de la distribución.
La media armónica, al igual que la mayoría de los promedios, está definida rígidamente por una fórmula matemática; se deja influenciar por valores extremos, especialmente los más pequeños; no puede ser calculada si algunos de los datos de la distribución son iguales a cero, ya que el valor de este promedio depende de cada uno de los elementos de la distribución. Se utiliza de preferencia para promediar velocidades.
La media cúbica tiene un uso restringido y por lo engorroso de su cálculo casi nunca se aplica, además, se deja influenciar demasiado por valores extremos, en especial por los más altos.
Los cuartiles, deciles y percentiles, generalmente, se aplican en variables continuas, cuando se tiene un número grande tanto de intervalos, como de observaciones, y se desea examinar tan sólo una parte de la distribución que presenta una característica especial a ser estudiada.
Las relaciones numéricas entre los promedios, en cualquier distribución tienen el siguiente comportamiento:
Por su parte la media aritmética, la mediana y la moda, tienen la siguiente relación:
M1 = Me = Md en la distribución simétrica.
M1 < Me < Md en la distribución asimétrica negativa.
M1 > Me > Md en la distribución asimétrica positiva.
Centro recorrido | Media geométrica |
Cuartiles | Media armónica |
Deciles | Percentiles |
Media cuadrática | Promedio |
Media cúbica | Productoria |
Fórmulas:
Centro recorrido (datos no agrupados) | Centro recorrido, variable discreta |
Centro recorrido variable continua |
Zi ,, | Zi ,,ni |
1 | 2 |
2 | 20 |
3 | 75 |
4 | 100 |
5 | 75 |
6 | 18 |
32 | 68 | 72 | 32 | 32 |
70 | 103 | 65 | 74 | 69 |
38 | 42 | 56 | 72 | 94 |
39 | 51 | 88 | 76 | 70 |
66 | 100 | 94 | 62 | 47 |
53 | 61 | 42 | 56 | 65 |
yi | 3 | 6 | 9 | 12 | 15 |
ni | 8 | 20 | 7 | 3 | 2 |