La descripción cuantitativa de los datos

 

2.1.             Frecuencias y  proporciones

2.1.1.          Frecuencias absolutas. Es la lista de los valores de cada variable, con el número de veces en que se da cada valor.

2.1.2.          Frecuencias relativas y  proporciones.  La proporción es la razón de cada frecuencia sobre el total de casos. Por ejemplo, porcentajes, tasa de natalidad, tasa de suicidios. Se les llama “frecuencias relativas”.

2.1.3.          Ejemplos de Wonnacott, Encuestas de Valores 1993 y 2000, y de Salida de las Urnas ese año. También:

                   Personal académico de la UNAM

                   Escolaridad del Personal académico de Tiempo Completo en escuelas y facultades de la UNAM.

2.1.4.          Barras y pasteles en Excel y en SPSS.

 

2.2.            Medidas de centralización

2.2.1.         Media aritmética. Es la suma de los valores definidos dividida entre el número total de los casos comprendidos.

Fórmula para muestras:

 

 

 

 

                   Propiedad fundamental: la suma algebraica de un conjunto de números de su media aritmética es cero. Otra manera de decir lo mismo es que la suma de las distancias a la media de las observaciones encima de ella es igual a la suma de las distancias a la media de las observaciones abajo de ella. Una tercera forma de decir lo mismo es que es el centro de gravedad de las observaciones.

2.2.2.          Mediana. En una colección de datos ordenados en orden de magnitud es la medida que cae en el medio. Cuando más de una medida cae en el medio, la mediana es la media de esas medidas. Otra manera de decir lo mismo es que divide al histograma en dos partes de igual área.

2.2.3.          Moda. Es el valor más frecuente, la frecuencia más grande.

2.2.4.          Ejemplos de Wonnacott, Encuestas de Valores 1993 y 2000, y de Salida de las Urnas ese año.

2.2.5.          Propiedades:

       - Para distribuciones simétricas, la media, la mediana y la moda son idénticas.

       - Para distribuciones sesgadas, la media queda hacia la dirección del sesgo (la cola más larga) con respecto a la mediana.

 

2.3.             Medidas de dispersión

2.3.1.          Varianza. Es el promedio del cuadrado de las desviaciones individuales con respecto de la media. Siempre es positiva debido a la elevación al cuadrado.

               

       Fórmula para muestras:

 

 

 

 

2.3.2.        Desviación Típica. Es la raíz cuadrada de la varianza.

 

 

 

2.3.3.         Ejemplos de Wonnacott, Encuestas de Valores 1993 y 2000, y de Salida de las Urnas ese año.

2.3.4.         Regla empírica: si una variable tiene una distribución aproximadamente normal:

     -Aproximadamente 68% de los casos caen entre la media menos una desviación típica y entre la media más una desviación típica.

     -Aproximadamente 95% de los casos caen entre la media menos dos desviaciones típicas, y entre la media más dos desviaciones típicas.

     -Todos o casi todos los casos caen entre la media menos tres desviaciones típica, y entre la media más tres desviaciones típicas.

 

2.4.         Instrucciones para SPSS:

2.4.1.                       Abrir Valorsel.sav.

2.4.2.                       Analyze)/Descriptives/Frequencies/ (Analizar,Estadísticos Descriptivos, Frecuencias).

2.4.3.                       Seleccione v328y v352a (Ingreso en Miles de Pesos, 1982). Oprima una vez la tecla izquierda del ratón en la flecha que separa ambas cajas. Palomear “Display Frequency Tables”, Oprima una vez la tecla izquierda del ratón en “Statistics” (Estadísticos).

2.4.4.                       Palomear: Std. deviation, Variance, Mean, Median, Mode, Skewness, Kurtosis. Oprima una vez la tecla izquierda del ratón en “Continue” (Desviación Típica, Varianza, Media, Mediana, Moda, Sesgo, Curtosis, Continuar).

2.4.5.                       Oprima una vez la tecla izquierda del ratón en “Charts” (Gráficas). Palomee “Histograms”, “With Normal Curve” (Histogramas, Con Curva Normal).

2.4.6.                        Vaya a Windows/Output1. File/Save As (Grabar Archivo Como). Después de verificar que el directorio activo es AYC, escriba en la caja “FrecuenciasConCurva”. Oprima una vez la tecla izquierda del ratón en “Save” (Grabar). Grabe el resultado en AYC con el formato siguiente: xxxyyyyyyyDescriptiva, donde xxxyyyyyyy corresponde a la convención adoptada en este curso, que el alumno ya conoce.

2.4.7.                        Vaya a Windows/Output1. File/Export (Exportar Archivo). Se abre una ventana con varias cajas. En la caja “Document” (Tipo), seleccione Excel. En la caja “Browse” (Examinar), después de verificar que el directorio activo es AYC, escriba “xxxyyyyyyyDescriptiva”. Oprima una vez la tecla izquierda del ratón en “OK” (Aceptar).

2.4.8.                        Oprima dos veces la tecla izquierda   del ratón sobre la primera gráfica. Aparece el editor de gráficas. En  “Options/Titles” (Opciones/Títulos), escriba “Escolaridad en Número de Años. Mueva el cursor a cualquier otra zona de la gráfica.

2.4.9.                       Dentro de la gráfica, oprima una vez la tecla izquierda del ratón en “V328”. Escriba “México, 1982”. Mueva el cursor a cualquier otra zona de la gráfica.

2.4.10.                    Siguiendo los procedimientos anteriores, en lugar del título del eje vertical, “Frequency”, escriba “Frecuencias”. Y en lugar del título del eje horizontal,  “v328”, escriba “Años de Escolaridad”. Seleccione las tres cifras que están a la derecha y arriba de la gráfica. Oprima la tecla “Supr”.

2.4.11.                    “Edit/Copy Chart” (Editar/Copiar gráfico).

2.4.12.                    Abra Paint. “Editar/Pegar”. Grabe como “xxxyyyyyyyFrecuenciasConCurvaV328”.

2.4.13.                    Oprima dos veces la tecla izquierda del ratón sobre la segunda gráfica. Repita los pasos de la gráfica de v328. Escriba, si hay tiempo, los títulos correspondientes.  Grabe como “xxxyyyyyyyFrecuenciasConCurvaV352a”.

2.4.14.                    Regrese a resultados de SPSS. Compare visualmente ambas gráficas.

2.4.15.                    Para gráficas de pastel, traducida por SPSS como “sectores”, véase el archivo “UnamPaEscolaridad.xls”.

 

 

2.5.                    Fórmula en Excel

                         Véase archivo MatLengVarianza.xls

 

                          Iván Zavala Echavarría, 3 de marzo de 2009