Matemáticas de preparatoria

Estadística elemental

Población y muestra

En las lecciones anteriores has adquirido conocimientos sobre Geometría, que te ayudarán para abordar otra área de las Matemáticas que también implica hacer mediciones, pero ahora de poblaciones, y toda la información que se obtenga se estudia a partir de métodos estadísticos.

Población

Una población, estadísticamente hablando, es el conjunto de todos los elementos para los cuales se desea conocer algo. Una población pueden ser todos los árboles de un bosque, todos los estudiantes de una escuela, todos los sobres de café producidos durante un día por una empacadora, todos los electores que tienen derecho a participar en la elección de gobernantes en un estado, etcétera. Existen dos tipos de población: la finita y la infinita.

  • Población finita: conjunto compuesto por una cantidad limitada de elementos.
  • Población infinita: característica de los sujetos de la población que puede tomar cualquiera de los valores de un conjunto y que se evalúa por medio de una muestra.

Un ejemplo de población finita es el de tu grupo, pues el número de alumnos en él se define por medio de un entero, por ejemplo 30. O bien, el número de caballos de un rancho, como se muestra en la figura 9.1.

Figura 9.1

Una población infinita, por ejemplo, es el número de bacterias que existen en todos los seres vivos. Resulta imposible contar todas las bacterias por la gran diversidad de lugares donde se albergan. Tan sólo en tu boca se alojan más de mil millones de bacterias.

Figura 9.2

Muestra

Para que una muestra sea representativa de la población es necesario que sus elementos sean seleccionados aleatoriamente; es decir, al azar, sin escoger en especial a unos o a otros.

Por medio del muestreo, por ejemplo, es posible calificar la calidad de la producción en una envasadora de café, conocer el nivel de habilidades matemáticas de los jóvenes de México en evaluaciones internacionales, estimar la preferencia de los electores por un candidato a un puesto de gobierno, saber la respuesta del mercado a un nuevo producto, etc. En las muestras de población se definen variables a estudiar, como por ejemplo, en una muestra de un grupo de personas, la variable puede ser el sexo (hombres-mujeres) o también la edad cronológica; también el lugar donde nacieron. En una muestra de animales mamíferos, una variable a estudiar puede ser la edad y, tres posibles valores de ella: cachorros, adultos y viejos.

  • Muestra: subgrupo de la población.
  • Variable: característica de los sujetos de la población que puede tomar cualquiera de los valores de un conjunto y que se evalúa por medio de una muestra.

Por lo tanto, llamamos variable a la medición de la o las características que varían de sujeto a sujeto. Cada sujeto tiene un valor para cada variable. Si hacemos una definición de variables incorrecta o medimos mal, todo nuestro estudio estadístico estará mal. Los métodos estadísticos que usamos dependen del tipo de variable.

Las variables cuantitativas se identifican porque se puede expresar su valor a través de números. Ejemplos de este tipo de variable son: la edad, estatura, calificaciones, etc.

Ejemplo:

PoblaciónCaracterística a estudiar o variable cuantitativaValores posibles
Edificios educativos de zonas urbanas de México.Tamaño (en metros cuadrados construidos)600 metros cuadrados
200 metros cuadrados
10,000 metros cuadrados
Caballos de la región sur de MéxicoMasade 300 a 350 kg
de 351 a 400 kg
de 401 a 450 kg

Para las variables cualitativas, la escala de valores es nominal y son categorías.

En los estudios estadísticos de las variables se busca, en primer término, describir los datos y después se realizan análisis estadísticos para relacionar las variables. Es decir, se aplica una estadística descriptiva para cada una de las variables de estudio.

Ejemplo:

PoblaciónCaracterística a estudiar o variable cualitativaValores posibles
PersonasCarácterAlegres
Enojados
Tristes
Estudiantes de
bachillerato
Rendimiento escolarAlto
Medio
Bajo

Concepto de Estadística

Cuando en nuestro estudio nos interesa describir situaciones, fenómenos, contextos y eventos, definimos variables cuantitativas y buscaremos detallar cómo se manifiestan, es decir, estaremos realizando estudios descriptivos porque se tratará de especificar propiedades, características y rasgos importantes de la población o grupo de estudio. Este tipo de estudios pertenece al área de la Estadística.

Estadística:

Conjunto de procedimientos que sirven para organizar y resumir datos, hacer inferencias a partir de ellos y transmitir los resultados de forma clara, concisa y significativa.

Estadística descriptiva

La Estadística descriptiva tiene como finalidad principal la de describir apropiadamente las diversas características de los elementos de una población y/o muestra, a partir de observaciones o registros, que permitan tomar medidas que ayuden a mejorar dicha población. De este modo, si observamos el desempeño académico de los alumnos de un grupo, es posible saber qué actividades propician que dicho desempeño mejore. Asimismo, un adecuado registro de las lluvias en una región del país puede ayudar en un adecuado pronóstico del tiempo que, a su vez, ayude a programar adecuadamente las épocas de siembra y cosecha o a invertir eficientemente recursos del estado para ayudar a los campesinos.

Figura 9.3

Una vez que se selecciona la población o la muestra a medir iniciamos con nuestras etapas para realizar un estudio descriptivo.

ETAPA 1

Recolectar datos. Requiere que elabores un plan del procedimiento que te permita reunir datos con un determinado propósito. Tienes que buscar en fuentes bibliográficas un fundamento teórico; posteriormente elaboras un instrumento, que pueden ser cuestionarios, encuestas, guiones de entrevista, pruebas estandarizadas, copia de archivos, investigación en departamentos estadísticos, etc.

ETAPA 2

Ordenamiento de información. Una vez que se aplica el instrumento, se procede a organizar la información obtenida. Para ello, se elabora una tabla de distribución, en la que se escriben los resultados de cada una de las variables medidas en el instrumento. En seguida se cuenta el número de veces en que aparece una determinada respuesta y se registra en tabla de frecuencia.

Ejemplo:

Muestra: número de días en que ha llovido en el mes de julio.

La ETAPA 3 se refiere al tema de medidas de tendencia central que se explica a continuación.

Medidas de tendencia central

En esta ETAPA 3 se realiza la observación de parámetros descriptivos y se calculan medidas de tendencia central y dispersión. Hay tres tipos de medidas de tendencia central, que son: la media, la mediana y la moda.

Ejemplo: Tenemos una población de 2066 personas que llegan a la ciudad del Distrito Federal para buscar trabajo, y queremos saber cuál es su tierra de origen para reconocer de qué estado llegan más personas a trabajar al DF. La variable de este estudio es: lugar de origen.

  • Paso 1. Recolección de datos. Para ello se aplicará un cuestionario en donde se les hará la pregunta: ¿En dónde nacieron?
  • Paso 2. Ordenamiento y clasificación de la información obtenida. Al haber aplicado el instrumento, se continúa con el registro de las respuestas y posteriormente se llegan a ordenar y clasificar. Continuando con el ejemplo del estudio de la variable “lugar de origen”, este segundo paso consiste en realizar un registro de las respuestas obtenidas. Esto consiste en haber anotado cada respuesta que dio un encuestado a la pregunta ¿en dónde nacieron? De tal forma que se presentó la frecuencia de la respuesta como se indica en la siguiente tabla.
  • Paso 3. Obtención de parámetros descriptivos. Para obtener el resultado de la moda, observa las cantidades de la tabla de frecuencias y selecciona la de mayor frecuencia. De este estudio estadístico la moda es: 784 personas

Para calcular la mediana se selecciona la frecuencia que se ubica en el punto medio de la distribución de frecuencias después de ordenarlas de manera ascendente o descendente. De acuerdo al número de datos si es par o impar, se calcula de la siguiente manera:

Medidas de dispersión (variación)

A las medidas de dispersión también se llama medidas de variabilidad, porque nos señalan la variabilidad de una distribución y están indicadas por medio de un número . Este tipo de medidas nos muestran la información de la muestra o serie de datos, indicándonos sobre la magnitud del alejamiento de la distribución de datos en relación a un valor central. Estas medidas son: rango, desviación típica y varianza.

  • Rango: diferencia entre el máximo y mínimo valor de una serie de datos y nos da una vaga referencia a la posible dispersión que se puede tener de los datos.
  • Desviación típica: número que nos dice cuán alejados están los datos del valor o posición previamente obtenidos.
  • Varianza: medida de los valores alrededor de la media.

El rango lo podemos entender como la amplitud existente entre una serie de datos, es decir, mide cuán lejos está el valor más pequeño y el valor más grande de la muestra o población. La fórmula que se utiliza es:

Dato más grande o el mayor – Dato más pequeño o menor
( X2 – X1 )

La desviación estándar o típica es la medida de dispersión de mayor utilidad práctica, se representa normalmente por el símbolo σ (sigma) y nos da una idea de la variación de los datos respecto a la media.

La fórmula de desviación típica es:

Con el ejemplo que mencionamos anteriormente, analizaremos la dispersión o variabilidad de los datos obtenidos en la tabla de distribución de frecuencias.

Para aplicar las medidas de dispersión se utilizarán resultados de las medidas de tendencia central, como se muestra en seguida:

Rango de personas foráneas que llegan al DF:

( X2 – X1 )
784 – 85 = 699

El rango de personas foráneas que llegan al DF es de 699 personas de otros estados.

Tenemos que en promedio llegan al DF 295.14 personas de 7 estados a trabajar pero existe una desviación típica y pueden llegar hasta 360.69 personas foráneas a trabajar.

La varianza es la medida de dispersión que nos permite identificar la diferencia promedio que existe entre cada uno de los valores respecto a su punto central. Se representa por el símbolo σ2 (sigma cuadrada).

Varianza

Puede variar el promedio de las personas que llegan a trabajar al DF, es decir, pueden llegar al DF 369.69 personas.

ETAPA 4

Representación gráfica de los datos. Es frecuente usar representaciones visuales complementarias para presentar los resultados de los análisis de la información de los estudios estadísticos, para ello existen diferentes tipos de gráficas:

Ejemplo:

Fuente: Secretaría de Educación Pública. (2015). Matemáticas II. Ciudad de México.