Ciencias física, Naturales, Matemáticas y Estadísticas

Muestro y datos

Objetivos didácticos

Al final de esta lección el estudiante podrá:

  • Reconocer y diferenciar los términos clave.
  • Aplicar diversos tipos de métodos de muestreo a la recolección de datos.
  • Crear e interpretar tablas de frecuencia.

Introducción

Probablemente se esté preguntando: “¿Cuándo y dónde voy a utilizar la estadística?”. Si lee cualquier periódico, ve la TV o utiliza internet, verá información estadística. Hay estadísticas sobre delincuencia, deportes, educación, política y bienes raíces. Normalmente, cuando se lee un artículo de periódico o se ve un programa de noticias de televisión se da una información de muestra. Con esta información, puede tomar una decisión sobre la corrección de una declaración, afirmación o “hecho”. Los métodos estadísticos pueden ayudarlo a hacer una “mejor estimación”.

Como sin duda recibirá información estadística en algún momento de su vida, necesita conocer algunas técnicas para analizar la información de forma reflexiva. Piense en la compra de una casa o en la gestión de un presupuesto. Piense en la profesión que ha elegido. Economía, Negocios, Psicología, Educación, Biología, Derecho, Informática, Política y Desarrollo de la Primera Infancia son campos de conocimiento que requieren, al menos, un curso de Estadística.

En esta lección se incluyen las ideas y palabras básicas de probabilidad y estadística. Pronto entenderá que la estadística y la probabilidad trabajan juntas. También aprenderá cómo se recopilan los datos y qué datos son útiles.

Contenidos temáticos

  1. Definiciones de estadística, probabilidad y términos clave
  2. Datos, muestreo y variación de datos y muestreo
  3. Frecuencia, tablas de frecuencia y niveles de medición
  4. Diseño experimental y ética

Desarrollo del tema

1. Definiciones de estadística, probabilidad y términos clave

La ciencia de la Estadística se ocupa de la recopilación, del análisis, de la interpretación y de la presentación de datos. Vemos y utilizamos datos en nuestra vida cotidiana.

La organización y el resumen de los datos se denominan Estadística Descriptiva. Dos formas de resumir los datos son la elaboración de gráficos y el uso de números (por ejemplo, hallar un promedio). Después de haber estudiado la probabilidad y las distribuciones de probabilidad, utilizará métodos formales para sacar conclusiones de los datos “buenos”. Los métodos formales se denominan Estadística Inferencial. La inferencia estadística utiliza la probabilidad para determinar el grado de confianza que podemos tener en que nuestras conclusiones son correctas.

La interpretación eficaz de los datos (inferencia) se basa en buenos procedimientos de producción de datos y en examinarlos de forma reflexiva. Se encontrará con lo que le parecerá un exceso de fórmulas matemáticas para interpretar los datos. La meta de la Estadística no es realizar numerosos cálculos con las fórmulas, sino comprender los datos. Los cálculos se pueden hacer con una calculadora o una computadora. La comprensión debe venir de usted. Si puede comprender a fondo los fundamentos de la Estadística, podrá tener más confianza en las decisiones que tome en la vida.

La ciencia de la Estadística se ocupa de la recopilación, del análisis, de la interpretación y de la presentación de datos. Vemos y utilizamos datos en nuestra vida cotidiana.

Probabilidad

La probabilidad es una herramienta matemática utilizada para estudiar el azar. Se trata de la oportunidad (la posibilidad) de que se produzca un evento. Por ejemplo, si se lanza una moneda imparcial cuatro veces, los resultados no pueden ser dos caras y dos cruces. Sin embargo, si se lanza la misma moneda 4.000 veces, los resultados se aproximarán a mitad cara y mitad cruz. La probabilidad teórica esperada de salir cara en cualquier lanzamiento es 1/2 o 0,5. Aunque los resultados de unas pocas repeticiones son inciertos, existe un patrón regular de resultados cuando hay muchas repeticiones. Tras leer sobre el estadístico inglés Karl Pearson, que lanzó una moneda 24.000 veces con un resultado de 12.012 caras, uno de los autores lanzó una moneda 2.000 veces. Los resultados fueron 996 caras. La fracción 996/2000 es igual a 0,498, que está muy cerca de 0,5, la probabilidad esperada.

La teoría de la probabilidad comenzó con el estudio de los juegos de azar, como el póquer. Las predicciones adoptan la forma de probabilidades. Para predecir la probabilidad de que se produzca un terremoto, de que llueva o de que obtenga una A en este curso utilizamos las probabilidades. Los médicos utilizan la probabilidad para determinar la posibilidad de que una vacuna provoque la enfermedad que se supone que debe prevenir. Un agente de bolsa utiliza la probabilidad para determinar la tasa de rendimiento de las inversiones de un cliente. Puede utilizar la probabilidad para decidir si compra un billete de lotería o no. En su estudio de la Estadística, utilizará el poder de las Matemáticas a través de cálculos de probabilidad para analizar e interpretar sus datos.

Términos clave

En estadística, generalmente queremos estudiar una población. Se puede pensar en una población como un conjunto de personas, cosas u objetos en estudio. Para estudiar la población seleccionamos una muestra. La idea del muestreo es seleccionar una porción (o subconjunto) de la población mayor y estudiar esa porción (la muestra) para obtener información sobre la población. Los datos son el resultado de un muestreo de una población.

Como se necesita mucho tiempo y dinero para examinar toda una población, el muestreo es una técnica muy práctica. Si desea calcular el promedio general de calificaciones de su escuela, tendría sentido seleccionar una muestra de estudiantes que asisten a la escuela. Los datos recopilados de la muestra serían los promedios de las calificaciones de los estudiantes. En las elecciones presidenciales se toman muestras de sondeos de opinión de 1.000 a 2.000 personas. Se supone que el sondeo de opinión representa el punto de vista de las personas de todo el país. Los fabricantes de bebidas carbonatadas en lata toman muestras para determinar si una lata de 16 onzas contiene 16 onzas de bebida carbonatada.

A partir de los datos de la muestra podemos calcular un estadístico. Un estadístico es un número que representa una propiedad de la muestra. Por ejemplo, si consideramos que una clase de Matemáticas es una muestra de la población de todas las clases de Matemáticas, el número promedio de puntos obtenidos por los estudiantes de esa clase de Matemáticas al final del trimestre es un ejemplo de un estadístico. El estadístico es una estimación de un parámetro de población. Un parámetro es una característica numérica de toda la población que puede estimarse mediante un estadístico. Dado que consideramos que todas las clases de Matemáticas son la población, el número promedio de puntos obtenidos por estudiante en todas las clases de Matemáticas es un ejemplo de parámetro.

Una de las principales preocupaciones en el campo de la Estadística es la precisión con la que un estadístico estima un parámetro. La precisión depende realmente de lo bien que la muestra represente a la población. La muestra debe contener las características de la población para ser una muestra representativa. En la Estadística Inferencial nos interesa tanto el estadístico de la muestra como el parámetro de la población. En un capítulo posterior utilizaremos el estadístico de la muestra para comprobar la validez del parámetro poblacional establecido.

Una variable, generalmente anotada con letras mayúsculas como X e Y, es una característica o medida que puede determinarse para cada miembro de una población. Las variables pueden ser numéricas o categóricas. Las variables numéricas toman valores con unidades iguales, como el peso en libras y el tiempo en horas. Las variables categóricas sitúan a la persona o cosa en una categoría. Si suponemos que X equivale al número de puntos obtenidos por un estudiante de Matemáticas al final de un trimestre, entonces X es una variable numérica. Si suponemos que Y es la afiliación de una persona a un partido, entonces algunos ejemplos de Y incluyen republicano, demócrata e independiente. Y es una variable categórica. Podríamos hacer algunos cálculos con valores de X (calcular el promedio de puntos obtenidos, por ejemplo), pero no tiene sentido hacer cálculos con valores de Y (calcular un promedio de afiliación a un partido no tiene sentido).

Los datos son los valores reales de la variable. Pueden ser números o palabras. El dato es un valor único.

Dos palabras que aparecen a menudo en estadística son media y proporción. Si presenta tres exámenes de sus clases de Matemáticas y obtiene calificaciones de 86, 75 y 92, calcularía su calificación media sumando las tres calificaciones de los exámenes y dividiéndolas entre tres (su calificación media sería 84,3 con un decimal). Si en su clase de Matemáticas hay 40 estudiantes y 22 son hombres y 18 son mujeres, entonces la proporción de estudiantes hombres es 22/40 y la proporción de estudiantes mujeres es 18/40. La media y la proporción se tratan con más detalle en capítulos posteriores.

Nota

Las palabras “media” y “promedio” suelen utilizarse indistintamente. La sustitución de una palabra por otra es una práctica habitual. El término técnico es “media aritmética” y “promedio” es técnicamente un lugar central. Sin embargo, en la práctica, entre los no estadísticos, se suele aceptar “promedio” por “media aritmética”.

2. Datos, muestreo y variación de datos y muestreo

Los datos pueden proceder de una población o de una muestra. Letras minúsculas como 𝑥 o 𝑦 se utilizan generalmente para representar valores de datos. La mayoría de los datos se pueden clasificar en las siguientes categorías:

  • Cualitativa
  • Cuantitativa

Los datos cualitativos son el resultado de categorizar o describir los atributos de una población. Los datos cualitativos también suelen denominarse datos categóricos. El color del pelo, el tipo de sangre, el grupo étnico, el automóvil que conduce una persona y la calle en la que vive son ejemplos de datos cualitativos. Los datos cualitativos suelen describirse con palabras o letras. Por ejemplo, el color del cabello puede ser negro, castaño oscuro, castaño claro, rubio, gris o rojo. El tipo de sangre puede ser AB+, O– o B+. Los investigadores suelen preferir los datos cuantitativos a los cualitativos porque se prestan más al análisis matemático. Por ejemplo, no tiene sentido hallar un color de cabello o un tipo de sangre promedio.

Los datos cuantitativos son siempre números. Los datos cuantitativos son el resultado de contar o medir los atributos de una población. La cantidad de dinero, la frecuencia del pulso, el peso, el número de personas que viven en su ciudad y el número de estudiantes que cursan Estadística son ejemplos de datos cuantitativos. Los datos cuantitativos pueden ser discretos o continuos.

Todos los datos que son el resultado de contar se denominan datos discretos cuantitativos. Estos datos solo adoptan ciertos valores numéricos. Si cuenta el número de llamadas telefónicas que recibe cada día de la semana, puede obtener valores como cero, uno, dos o tres.

Los datos que no solo se componen de números para contar, sino que pueden incluir fracciones, decimales o números irracionales, se denominan datos cuantitativos continuos. Los datos continuos suelen ser el resultado de mediciones como longitudes, pesos o tiempos. Una lista de la duración en minutos de todas las llamadas telefónicas que realiza en una semana, con números como 2,4; 7,5; u 11,0, sería un dato cuantitativo continuo.

Ejemplos de muestra de datos cuantitativos

Muestra de datos cuantitativos discretos

  • Los datos son el número de libros que los estudiantes llevan en sus mochilas. Usted toma una muestra de cinco estudiantes. Dos estudiantes llevan tres libros, un estudiante lleva cuatro, un estudiante lleva dos y un estudiante lleva uno. Los números de libros (tres, cuatro, dos y uno) son los datos cuantitativos discretos.

Muestra de datos cuantitativos continuos

  • Los datos son los pesos de mochilas que contienen libros. La muestra es de los mismos cinco estudiantes. Los pesos (en libras) de sus mochilas son 6,2; 7; 6,8; 9,1 y 4,3. Tome en cuenta que las mochilas que llevan tres libros pueden tener pesos diferentes. Los pesos son datos cuantitativos continuos.

Discusión de datos cualitativos

A continuación se muestran tablas que comparan el número de estudiantes a tiempo parcial y a tiempo completo en De Anza College y Foothill College inscritos para el trimestre de primavera de 2010. Las tablas muestran recuentos (frecuencias) y porcentajes o proporciones (frecuencias relativas). Las columnas de porcentajes facilitan la comparación de las mismas categorías en los institutos universitarios. Suele ser útil mostrar porcentajes junto con números, pero es especialmente importante cuando se comparan conjuntos de datos que no tienen los mismos totales, como las inscripciones totales de ambos institutos universitarios en este ejemplo. Observe que el porcentaje de estudiantes a tiempo parcial del Foothill College es mucho mayor que el del De Anza College.

De Anza CollegeNúmeroPorcentajeFoothill CollegeNúmeroPorcentaje
Tiempo completo9.20040,9%Tiempo completo4.05928,6%
Tiempo parcial13.29659,1%Tiempo parcial10.12471,4%
Total22.496100 %Total14.183100 %
Tabla 1.

Las tablas son una buena forma de organizar y mostrar datos. Pero los gráficos pueden ser aun más útiles para entender los datos. No hay reglas estrictas en cuanto a los gráficos que hay que utilizar. Dos gráficos que se utilizan para mostrar datos cualitativos son los gráficos circulares y los de barras.

En un gráfico circular las categorías de datos se representan mediante cuñas en un círculo y su tamaño es proporcional al porcentaje de personas de cada categoría.

En un gráfico de barras la longitud de la barra para cada categoría es proporcional al número o porcentaje de personas en cada categoría. Las barras pueden ser verticales u horizontales.

Un diagrama de Pareto está formado por barras que se ordenan por el tamaño de la categoría (de mayor a menor).

Es una buena idea observar una variedad de gráficos para ver cuál es el más útil para mostrar los datos. Según los datos y el contexto, podemos elegir el “mejor” gráfico. Nuestra elección también depende del uso que hagamos de los datos.

Omisión de categorías / falta de datos

La tabla muestra el origen étnico de los estudiantes pero falta la categoría “otros/desconocidos”. En esta categoría se ubican las personas que no se consideraron incluidas en ninguna de las categorías étnicas o que se negaron a responder. Observe que las frecuencias no suman el número total de estudiantes. En esta situación, cree un gráfico de barras y no un gráfico circular.

FrecuenciaPorcentaje
Asiáticos8.79436,1%
Negros1.4125,8%
Filipinos1.2985,3%
Hispanos4.18017,1%
Nativos de Estados Unidos1460,6 %
Isleños del Pacífico2361,0%
Blancos5.97824,5%
TOTAL22.044 de 24.38290,4 % del 100 %
El siguiente gráfico es igual que el anterior, pero se ha incluido el porcentaje de “otros/desconocidos” (9,6 %). La categoría “otros/desconocidos” es grande en comparación con algunas de las otras categorías (nativos de Estados Unidos, 0,6 %, isleños del Pacífico, 1,0 %). Es importante saber esto cuando pensamos en lo que nos dicen los datos.

Este gráfico de barras particular puede ser difícil de entender visualmente.

El siguiente gráfico es un diagrama de Pareto. El diagrama de Pareto tiene las barras ordenadas de mayor a menor y es más fácil de leer e interpretar.

Gráficos circulares: no faltan datos

Los siguientes gráficos circulares incluyen la categoría “otros/desconocidos” (ya que los porcentajes deben sumar el 100 %). El gráfico de la derecha está organizado por el tamaño de cada porción, lo que lo convierte en un gráfico visualmente más informativo que el gráfico sin clasificar ubicado en la parte izquierda.

Muestreo

Recopilar información sobre toda una población suele ser demasiado costoso o prácticamente imposible. En cambio, utilizamos una muestra de la población. Una muestra debe tener las mismas características que la población que representa. La mayoría de los estadísticos utilizan varios métodos de muestreo aleatorio para intentar alcanzar esta meta. En esta sección se describen algunos de los métodos más comunes. Existen varios métodos de muestreo aleatorio. En cada forma de muestreo aleatorio, cada miembro de una población tiene inicialmente la misma probabilidad de que lo seleccionen para la muestra. Cada método tiene sus pros y sus contras. El método más fácil de describir se llama muestra aleatoria simple. Cualquier grupo de n personas tiene la misma probabilidad de que lo seleccionen que cualquier otro grupo de n personas si se utiliza la técnica de muestreo aleatorio simple. En otras palabras, cada muestra del mismo tamaño tiene la misma probabilidad de que la seleccionen. Por ejemplo, supongamos que Lisa quiere formar un grupo de estudio de cuatro personas (ella y otras tres) de su clase de precálculo, que tiene 31 miembros sin incluir a Lisa. Para elegir una muestra aleatoria simple de tamaño tres entre los demás miembros de su clase, Lisa podría poner los 31 nombres en un sombrero, agitar el sombrero, cerrar los ojos y elegir tres nombres. Una forma más tecnológica es que Lisa enumere primero los apellidos de los miembros de su clase junto con un número de dos dígitos:

IDNombreIDNombreIDNombre
00Anselmo11King21Roquero
01Bautista12Legeny22Roth
02Bayani13Lundquist23Rowell
03Cheng14Macierz24Salangsang
04Cuarismo15Motogawa25Slade
05Cuningham16Okimoto26Stratcher
06Fontecha17Patel27Tallai
07Hong18Price28Tran
08Hoobler19Quizon29Wai
09Jiao20Reyes30Madera
10Khan

Lisa puede utilizar una tabla de números aleatorios (que se encuentra en muchos libros de estadística y manuales de matemáticas), una calculadora o una computadora para generar números aleatorios. Para este ejemplo, supongamos que Lisa elige generar números aleatorios con una calculadora. Los números generados son los siguientes:

0,94360; 0,99832; 0,14669; 0,51470; 0,40581; 0,73381; 0,04399

Lisa lee grupos de dos dígitos hasta que haya elegido tres miembros de la clase (es decir, lee 0,94360 como los grupos 94, 43, 36, 60). Cada número aleatorio solo puede aportar un miembro de la clase. De ser necesario, Lisa podría haber generado más números aleatorios.

Los números aleatorios 0,94360 y 0,99832 no contienen números de dos dígitos adecuados. Sin embargo, el tercer número aleatorio, 0,14669, contiene 14 (el cuarto número aleatorio también contiene 14), el quinto número aleatorio contiene 05 y el séptimo número aleatorio contiene 04. El número de dos dígitos 14 corresponde a Macierz, el 05 a Cuningham y el 04 a Cuarismo. Aparte de ella, el grupo de Lisa estará formado por Marcierz, Cuningham y Cuarismo.

Además del muestreo aleatorio simple, existen otras formas de muestreo que implican un proceso de azar para obtener la muestra. Otros métodos de muestreo aleatorio bien conocidos son la muestra estratificada, la muestra por conglomerados y la muestra sistemática.

Para seleccionar una muestra estratificada, hay que dividir la población en grupos llamados estratos y, a continuación, tomar un número proporcional de cada estrato. Por ejemplo, podría estratificar (agrupar) la población de su instituto universitario por departamentos y luego seleccionar una muestra aleatoria simple proporcional de cada estrato (cada departamento) para obtener una muestra aleatoria estratificada. Para seleccionar una muestra aleatoria simple de cada departamento, numere cada miembro del primer departamento, numere cada miembro del segundo departamento y haga lo mismo con los departamentos restantes. Luego, utilice un muestreo aleatorio simple para seleccionar números proporcionales del primer departamento y haga lo mismo con cada uno de los departamentos restantes. Esos números seleccionados del primer departamento y del segundo departamento, y así sucesivamente, representan los miembros que componen la muestra estratificada.

Para seleccionar una muestra por conglomerados hay que dividir la población en conglomerados (grupos) y luego seleccionar al azar algunos de los conglomerados. Todos los miembros de estos grupos están en la muestra por conglomerados. Por ejemplo, si toma una muestra aleatoria de cuatro departamentos de la población de su instituto universitario, los cuatro departamentos constituyen la muestra por conglomerados. Divida el profesorado de su instituto universitario por departamento. Los departamentos son los conglomerados. Numere cada departamento y, a continuación, elija cuatro números diferentes mediante un muestreo aleatorio simple. Todos los miembros de los cuatro departamentos con esos números son la muestra de conglomerado.

Para seleccionar una muestra sistemática, seleccione al azar un punto de partida y tome cada n.ª (enésima) pieza de datos de una lista de la población. Por ejemplo, supongamos que tiene que hacer una encuesta telefónica. Su directorio telefónico contiene 20.000 listas de residencias. Debe seleccionar 400 nombres para la muestra. Numere la población de 1 a 20.000 y luego utilice una muestra aleatoria simple para seleccionar un número que represente el primer nombre de la muestra. Luego, elija cada quincuagésimo nombre hasta que tenga un total de 400 nombres (puede que tenga que volver al principio de su lista de teléfonos). El muestreo sistemático se elige con frecuencia porque es un método sencillo.

Un tipo de muestreo que no es aleatorio es el muestreo de conveniencia. El muestreo de conveniencia implica el uso de resultados que están fácilmente disponibles. Por ejemplo, una tienda de softwares realiza un estudio de mercadeo mediante entrevistas con los clientes potenciales que se encuentran en la tienda mirando softwares disponibles. Los resultados del muestreo de conveniencia pueden ser muy buenos en algunos casos y muy sesgados (favorecer ciertos resultados) en otros.

El muestreo de datos debe hacerse con mucho cuidado. Recolectar datos sin cuidado puede causar resultados devastadores. Las encuestas enviadas por correo a los hogares y luego devueltas pueden estar muy sesgadas (pueden favorecer a un determinado grupo). Es mejor que la persona que realiza la encuesta seleccione la muestra de encuestados.

El muestreo aleatorio verdadero se realiza con reemplazo. Es decir, una vez que se selecciona un miembro, ese miembro vuelve a la población y, por tanto, lo pueden escoger más de una vez. Sin embargo, por razones prácticas, en la mayoría de las poblaciones el muestreo aleatorio simple se realiza sin reemplazo. Las encuestas suelen hacerse sin reemplazo. Es decir, un miembro de la población solo lo pueden seleccionar una vez. La mayoría de las muestras se toman de poblaciones grandes y la muestra tiende a ser pequeña en comparación con la población. En este caso, el muestreo sin reemplazo es, aproximadamente, igual al muestreo con reemplazo, ya que la probabilidad de seleccionar a la misma persona más de una vez con reemplazo es muy baja.

En una población universitaria de 10.000 personas, supongamos que se quiere seleccionar una muestra de 1.000 al azar para una encuesta. Para cualquier muestra particular de 1.000, si se hace un muestreo con reemplazo,

  • la probabilidad de seleccionar la primera persona es de 1.000 entre 10.000 (0,1000);
  • la probabilidad de seleccionar una segunda persona diferente para esta muestra es de 999 entre 10.000 (0,0999);
  • la probabilidad de volver a seleccionar a la misma persona es de 1 entre 10.000 (muy baja).

Si se trata de un muestreo sin reemplazo,

  • la probabilidad de seleccionar la primera persona para cualquier muestra específica es de 1.000 entre 10.000 (0,1000);
  • la probabilidad de seleccionar una segunda persona diferente es de 999 entre 9.999 (0,0999);
  • no se sustituye la primera persona antes de seleccionar la siguiente.

Compare las fracciones 999/10.000 y 999/9.999. Para lograr más exactitud, lleve las respuestas decimales a cuatro cifras. Con cuatro decimales, estos números son equivalentes (0,0999).

El muestreo sin reemplazo en vez del muestreo con reemplazo se convierte en una cuestión matemática solo cuando la población es pequeña. Por ejemplo, si la población es de 25 personas, la muestra es de diez y se realiza un muestreo con reemplazo para cualquier muestra particular, entonces la probabilidad de seleccionar la primera persona es de diez entre 25, y la probabilidad de seleccionar una segunda persona diferente es de nueve entre 25 (se reemplaza la primera persona).

Si se hace una muestra sin reemplazo, la probabilidad de seleccionar la primera persona es de diez entre 25, y la probabilidad de seleccionar la segunda persona (que es diferente) es de nueve entre 24 (no se reemplaza la primera persona).

Compare las fracciones 9/25 y 9/24. Con cuatro decimales, 9/25 = 0,3600 y 9/24 = 0,3750. Con cuatro decimales, estos números no son equivalentes.

Al analizar los datos, es importante tener en cuenta los errores de muestreo y los errores ajenos al muestreo. El propio proceso de muestreo provoca errores de muestreo. Por ejemplo, la muestra puede no ser lo suficientemente grande. Los factores no relacionados con el proceso de muestreo provocan errores ajenos al muestreo. Un dispositivo de recuento defectuoso puede causar un error ajeno al muestreo.

En realidad, una muestra nunca será exactamente representativa de la población, por lo que siempre habrá algún error de muestreo. Por regla general, cuanto mayor sea la muestra, menor será el error de muestreo.

En estadística, se crea un sesgo de muestreo cuando se recopila una muestra de una población y algunos de sus miembros no tienen la misma probabilidad de que los seleccionen que otros (recuerde que cada miembro de la población debe tener la misma probabilidad de que lo seleccionen). Cuando se produce un sesgo de muestreo, se pueden extraer conclusiones incorrectas sobre la población que se está estudiando.

Evaluación crítica

Tenemos que evaluar los estudios estadísticos que leemos de forma crítica y analizarlos antes de aceptar sus resultados. Los problemas más comunes que hay que tener en cuenta son:

  • Problemas con las muestras: una muestra debe ser representativa de la población. Una muestra que no es representativa de la población está sesgada. Las muestras sesgadas que no son representativas de la población dan resultados inexactos y no válidos.
  • Muestras autoseleccionadas: las respuestas de las personas que deciden responder, como las encuestas telefónicas, suelen ser poco fiables.
  • Problemas de tamaño de la muestra: las muestras demasiado pequeñas pueden ser poco fiables. Si es posible, las muestras más grandes son mejores. En algunas situaciones, es inevitable contar con muestras pequeñas y, aun así, se pueden usar para sacar conclusiones. Ejemplos: pruebas de choques de automóviles o pruebas médicas para detectar condiciones poco comunes.
  • Influencia indebida: recopilar datos o hacer preguntas de forma que influyan en la respuesta.
  • Falta de respuesta o negativa del sujeto a participar:  las respuestas recogidas pueden dejar de ser representativas de la población.  A menudo, personas con fuertes opiniones positivas o negativas pueden responder las encuestas, lo que puede afectar los resultados.
  • Causalidad: una relación entre dos variables no significa que una cause la otra. Pueden estar relacionadas (correlacionadas) debido a su relación a través de una variable diferente.
  • Estudios autofinanciados o de interés propio: estudio realizado por una persona u organización para respaldar su afirmación. ¿El estudio es imparcial? Lea atentamente el estudio para evaluar el trabajo. No asuma automáticamente que el estudio es bueno, pero tampoco asuma automáticamente que es deficiente. Valórelo por sus méritos y el trabajo realizado.
  • Uso engañoso de datos: gráficos mal presentados, datos incompletos o falta de contexto.
  • Confusión:  cuando los efectos de múltiples factores sobre una respuesta no se pueden separar.  Los factores de confusión dificultan o impiden sacar conclusiones válidas sobre el efecto de cada uno de ellos.

Si examinamos dos muestras que representen a la misma población, aunque utilicemos métodos de muestreo aleatorio para las muestras, no serán exactamente iguales. Al igual que hay variación en los datos, hay variación en las muestras. A medida que se acostumbre a la toma de muestras, la variabilidad empezará a parecer natural.

Variación de los datos

La variación está presente en cualquier conjunto de datos. Por ejemplo, las latas de bebida de 16 onzas pueden contener más o menos de 16 onzas de líquido. En un estudio, se midieron ocho latas de 16 onzas y produjeron la siguiente cantidad (en onzas) de bebida:

15,8; 16,1; 15,2; 14,8; 15,8; 15,9; 16,0; 15,5

Las medidas de la cantidad de bebida en una lata de 16 onzas pueden variar porque diferentes personas hacen las mediciones o porque no se puso la cantidad exacta, 16 onzas de líquido, en las latas. Los fabricantes realizan regularmente pruebas para determinar si la cantidad de bebida en una lata de 16 onzas está dentro del rango deseado.

Tenga en cuenta que, al tomar los datos, estos pueden variar en cierta medida con respecto a los datos que otra persona está tomando para el mismo fin. Esto es completamente natural. Sin embargo, si dos o más de ustedes toman los mismos datos y obtienen resultados muy diferentes, es hora de que usted y los demás reevalúen sus métodos de toma de datos y su exactitud.

Variación en las muestras

Ya se ha mencionado anteriormente que dos o más muestras de la misma población, tomadas al azar y que se aproximen a las mismas características de la población serán probablemente diferentes entre sí. Supongamos que Doreen y Jung deciden estudiar la cantidad promedio de tiempo que los estudiantes de su instituto universitario duermen cada noche. Doreen y Jung toman cada uno muestras de 500 estudiantes. Doreen utiliza el muestreo sistemático y Jung el muestreo por conglomerados. La muestra de Doreen será diferente a la de Jung. Aunque Doreen y Jung utilizaran el mismo método de muestreo, con toda probabilidad sus muestras serían diferentes. Sin embargo, ninguno de los dos estaría equivocado.

Piense en lo que contribuye a que las muestras de Doreen y Jung sean diferentes.

Si Doreen y Jung tomaran muestras más grandes (es decir, el número de valores de los datos se incrementa), los resultados de su muestra (la cantidad promedio de tiempo que duerme un estudiante) podrían estar más cerca del promedio real de la población. Pero aun así, sus muestras serían, con toda probabilidad, diferentes entre sí. Nunca se insistirá lo suficiente en esta variabilidad en las muestras.

Tamaño de la muestra

El tamaño de la muestra (a menudo llamado número de observaciones) es importante. Los ejemplos que ha visto en este libro hasta ahora han sido pequeños. Muestras de solo unos cientos de observaciones, o incluso más pequeñas, son suficientes para muchos propósitos. En los sondeos, las muestras que van de 1.200 a 1.500 observaciones se consideran suficientemente grandes y buenas si la encuesta es aleatoria y está bien hecha. Aprenderá por qué cuando estudie intervalos de confianza.

Tenga en cuenta que muchas muestras grandes están sesgadas. Por ejemplo, las encuestas con llamadas están invariablemente sesgadas porque la gente decide responder o no.

3. Frecuencia, tablas de frecuencia y niveles de medición

Una vez que tenga un conjunto de datos, tendrá que organizarlos para poder analizar la frecuencia con la que aparece cada dato en el conjunto. Sin embargo, al calcular la frecuencia, es posible que tenga que redondear sus respuestas para que sean lo más precisas posible.

Respuestas y redondeo

Una forma sencilla de redondear las respuestas es llevar la respuesta final a un decimal más de los que aparecen en los datos originales. Redondee solo la respuesta final. Si es posible, no redondee los resultados intermedios. Si es necesario redondear los resultados intermedios, llévelos al menos al doble de decimales que la respuesta final. Por ejemplo, el promedio de las tres puntuaciones de un cuestionario que son cuatro, seis y nueve es 6,3, redondeada a la décima más cercana, porque los datos son números enteros. La mayoría de las respuestas se redondearán de esta manera.

Niveles de medición

La forma de medir un conjunto de datos se denomina nivel de medición. Los procedimientos estadísticos correctos dependen de que el investigador esté familiarizado con los niveles de medición. No todas las operaciones estadísticas se pueden usar con todos los conjuntos de datos. Los datos se pueden clasificar en cuatro niveles de medición. Son (de menor a mayor nivel):

  • Nivel de escala nominal
  • Nivel de escala ordinal
  • Nivel de escala de intervalos
  • Nivel de escala de cociente

Los datos que se miden mediante una escala nominal son cualitativos (categóricos). Categorías, colores, nombres, etiquetas y alimentos favoritos junto con las respuestas de sí o no son ejemplos de datos de nivel nominal. Los datos de escala nominal no están ordenados. Por ejemplo, intentar clasificar a las personas según su comida favorita no tiene ningún sentido. Poner la pizza en primer lugar y el sushi en segundo no tiene sentido.

Las compañías de teléfonos inteligentes son otro ejemplo de datos de escala nominal. Los datos son los nombres de las compañías que fabrican teléfonos inteligentes, pero no hay un orden consensuado de estas marcas, aunque la gente pueda tener preferencias personales. Los datos de escala nominal no se pueden usar en cálculos.

Los datos que se miden con una escala ordinal son similares a los datos de la escala nominal, pero hay una gran diferencia. Los datos de la escala ordinal se pueden ordenar. Un ejemplo de datos de escala ordinal es una lista de los cinco mejores parques nacionales de Estados Unidos. Los cinco principales parques nacionales de Estados Unidos se pueden clasificar del uno al cinco, pero no podemos medir las diferencias entre los datos.

Otro ejemplo de uso de la escala ordinal es una encuesta sobre un crucero en la que las respuestas son “excelente”, “bueno”, “satisfactorio” e “insatisfactorio”. Estas respuestas están ordenadas de la respuesta más deseada a la menos deseada. Pero las diferencias entre dos datos no se pueden medir. Al igual que los datos de la escala nominal, los datos de la escala ordinal no se pueden usar en cálculos.

Los datos que se miden con la escala de intervalos son similares a los datos de nivel ordinal porque tienen un orden definido, pero hay una diferencia entre los datos. Las diferencias entre los datos de la escala de intervalos se pueden medir aunque los datos no tengan un punto de partida.

Las escalas de temperatura como Celsius (C) y Fahrenheit (F) se miden utilizando la escala de intervalos. En ambas medidas de temperatura, 40° es igual a 100° menos 60°. Las diferencias tienen sentido. Pero los 0 grados no porque, en ambas escalas, el 0 no es la temperatura mínima absoluta. Existen temperaturas como –10 °F y –15 °C que son más frías que el 0.

os datos a nivel de intervalo pueden utilizarse en cálculos, pero no se puede hacer un tipo de comparación. 80 °C no es cuatro veces más caliente que 20 °C (ni 80 °F es cuatro veces más caliente que 20 °F). El cociente de 80 a 20 (o de cuatro a uno) no tiene sentido.

Los datos que se miden con la escala de cociente se encargan del problema de las proporciones y ofrecen más información. Los datos de la escala de cociente son como los datos de la escala de intervalos, pero tienen un punto 0 y se pueden calcular cocientes. Por ejemplo, las calificaciones de cuatro exámenes finales de Estadística de opción múltiple son 80, 68, 20 y 92 (sobre 100 puntos posibles). Los exámenes son calificados por máquina.

Los datos se pueden ordenar de menor a mayor: 20, 68, 80, 92.

Las diferencias entre los datos tienen un significado. La calificación de 92 es superior a la de 68 por 24 puntos. Se pueden calcular cocientes. La calificación más baja es 0. Así que 80 es cuatro veces 20. La calificación de 80 es cuatro veces mejor que la de 20.

Frecuencia

Se les preguntó a veinte estudiantes cuántas horas trabajaban al día. Sus respuestas, en horas, son las siguientes: 5; 6; 3; 3; 2; 4; 7; 5; 2; 3; 5; 6; 5; 4; 4; 3; 5; 2; 5; 3.

La siguiente tabla enumera los diferentes valores de los datos en orden ascendente y sus frecuencias.

VALOR DE LOS DATOSFRECUENCIA
23
35
43
56
62
71

Una frecuencia es el número de veces que se produce un valor de los datos. Según la tabla anterior hay tres estudiantes que trabajan dos horas, cinco estudiantes que trabajan tres horas y así sucesivamente. La suma de los valores de la columna de frecuencia, 20, representa el número total de estudiantes incluidos en la muestra.

Una frecuencia relativa es el cociente (fracción o proporción) entre el número de veces que se produce un valor de los datos en el conjunto de todos los resultados y el número total de resultados. Para hallar las frecuencias relativas, divida cada frecuencia entre el número total de estudiantes de la muestra, en este caso, 20. Las frecuencias relativas se pueden escribir como fracciones, porcentajes o decimales.

VALOR DE LOS DATOSFRECUENCIAFRECUENCIA RELATIVA
233/20 o 0,15
355/20 o 0,25
433/20 o 0,15
566/20 o 0,30
622/20 o 0,10
711/20 o 0,05

La suma de los valores de la columna de frecuencia relativa de la tabla anterior es 20/20, o 1.

La frecuencia relativa acumulada es la acumulación de las frecuencias relativas anteriores. Para hallar las frecuencias relativas acumuladas se suman todas las frecuencias relativas anteriores a la frecuencia relativa de la fila actual, como se muestra en la siguiente tabla.

VALOR DE LOS DATOSFRECUENCIAFRECUENCIA
RELATIVA
FRECUENCIA RELATIVA
ACUMULADA
233/20 o 0,150,15
355/20 o 0,250,15 + 0,25 = 0,40
433/20 o 0,150,40 + 0,15 = 0,55
566/20 o 0,300,55 + 0,30 = 0,85
622/20 o 0,100,85 + 0,10 = 0,95
711/20 o 0,050,95 + 0,05 = 1,00

La última entrada de la columna de frecuencia relativa acumulada es uno, lo que indica que se ha acumulado el cien por ciento de los datos.

La siguiente tabla representa las alturas, en pulgadas, de una muestra de 100 hombres jugadores de fútbol semiprofesionales.

ALTURAS
(PULGADAS)
FRECUENCIAFRECUENCIA
RELATIVA
FRECUENCIA
RELATIVA
ACUMULADA
59.95–61.9555/100 = 0,050,05
61.95–63.9533/100 = 0,030,05 + 0,03 = 0,08
63.95–65.951515/100 = 0,150,08 + 0,15 = 0,23
65.95–67.95404/100 = 0,400,23 + 0,40 = 0,63
67.95–69.951717/100 = 0,170,63 + 0,17 = 0,80
69.95–71.951212/100 = 0,120,80 + 0,12 = 0,92
71.95–73.9577/100 = 0,070,92 + 0,07 = 0,99
73.95–75.9511/100 = 0,010,99 + 0,01 = 1,00
Total = 100Total = 1,00

Los datos de esta tabla se han agrupado en los siguientes intervalos:

  • de 59,95 a 61,95 pulgadas
  • de 61,95 a 63,95 pulgadas
  • de 63,95 a 65,95 pulgadas
  • de 65,95 a 67,95 pulgadas
  • de 67,95 a 69,95 pulgadas
  • de 69,95 a 71,95 pulgadas
  • de 71,95 a 73,95 pulgadas
  • de 73,95 a 75,95 pulgadas

En esta muestra hay cinco jugadores cuyas alturas están dentro del intervalo de 59,95 a 61,95 pulgadas, tres dentro del intervalo de 61,95 a 63,95 pulgadas, 15 dentro del intervalo de 63,95 a 65,95 pulgadas, 40 dentro del intervalo de 65,95 a 67,95 pulgadas, 17 dentro del intervalo de 67,95 a 69,95 pulgadas, 12 jugadores dentro del intervalo de 69,95 a 71,95, siete dentro del intervalo de 71,95 a 73,95 y un jugador cuya altura está dentro del intervalo de 73,95 a 75,95. Todas las alturas caen entre los puntos finales de un intervalo y no en los puntos finales.

4. Diseño experimental y ética

¿La aspirina reduce el riesgo de infarto? ¿Una marca de abono es más eficaz para el cultivo de rosas que otra? ¿El cansancio es tan peligroso para un conductor como la influencia del alcohol? Este tipo de preguntas se responden con experimentos aleatorios. En este módulo aprenderá aspectos importantes del diseño experimental. Un diseño adecuado del estudio garantiza la obtención de datos fiables y precisos.

El propósito de un experimento es investigar la relación entre dos variables. Cuando una variable provoca un cambio en otra, llamamos a la primera variable la variable explicativa. La variable afectada se denomina variable de respuesta. En un experimento aleatorio, el investigador manipula los valores de la variable explicativa y mide los cambios resultantes en la variable de respuesta. Los diferentes valores de la variable explicativa se denominan tratamientos. Una unidad experimental es un único objeto o persona que se va a medir.

Quiere investigar la eficacia de la vitamina E en la prevención de enfermedades. Usted recluta a un grupo de sujetos y les pregunta si toman regularmente vitamina E. Observa que los sujetos que toman vitamina E, en promedio, presentan una salud mejor que quienes no la toman. ¿Esto prueba que la vitamina E es eficaz en la prevención de enfermedades? No es así. Hay muchas diferencias entre los dos grupos comparados, además del consumo de vitamina E. Las personas que toman vitamina E con regularidad suelen tomar otras medidas para mejorar su salud: ejercicio, dieta, otros suplementos vitamínicos, elección de no fumar, etc. Cualquiera de estos factores podría estar influyendo en la salud. Como se ha descrito, este estudio no demuestra que la vitamina E sea la clave para la prevención de enfermedades.

Las variables adicionales que pueden enturbiar un estudio se denominan variables ocultas. Para demostrar que la variable explicativa provoca un cambio en la variable de respuesta, es necesario aislar la variable explicativa. La investigadora debe diseñar su experimento de forma que solo haya una diferencia entre los grupos que se comparan: los tratamientos previstos. Esto se consigue mediante la asignación aleatoria de unidades experimentales a grupos de tratamiento. Cuando los sujetos se asignan a los tratamientos de forma aleatoria, todas las variables ocultas potenciales se reparten por igual entre los grupos. En este punto, la única diferencia entre los grupos es la impuesta por el investigador. Los diferentes resultados medidos en la variable de respuesta, por tanto, deben ser una consecuencia directa de los diferentes tratamientos. De este modo, un experimento puede demostrar una conexión causa-efecto entre las variables explicativas y las de respuesta.

El poder de la sugestión puede tener una importante influencia en el resultado de un experimento. Los estudios han demostrado que la expectativa del participante en el estudio puede ser tan importante como el medicamento real. En un estudio sobre fármacos que mejoran el desempeño, los investigadores señalaron:

Los resultados mostraron que creer que se había tomado la sustancia provocaba tiempos de [desempeño] casi tan rápidos como los asociados al consumo del propio fármaco. Por el contrario, la toma del fármaco sin conocimiento no produjo un aumento significativo del desempeño.

Cuando la participación en un estudio provoca una respuesta física del participante, es difícil aislar los efectos de la variable explicativa. Para contrarrestar el poder de la sugestión, los investigadores reservaron un grupo de tratamiento como grupo de control. Este grupo recibe un tratamiento placebo, es decir, un tratamiento que no puede influir en la variable de respuesta. El grupo de control ayuda a los investigadores a equilibrar los efectos de estar en un experimento con los efectos de los tratamientos activos. Por supuesto, si usted participa en un estudio y sabe que está recibiendo una píldora que no contiene ningún medicamento real, entonces el poder de la sugestión ya no es un factor. Que un experimento aleatorio sea ciego preserva el poder de la sugestión. Cuando una persona participa en un estudio de investigación ciego, no sabe quién recibe el tratamiento activo y quién el placebo. Un experimento doble ciego es aquel en el que tanto los sujetos como los investigadores que participan en él no conocen la información del fármaco.

Ética

El mal uso y la tergiversación generalizados de la información estadística suelen dar mala fama a este campo. Algunos dicen que «los números no mienten», pero las personas que utilizan los números para apoyar sus afirmaciones a menudo lo hacen.

Una reciente investigación sobre el famoso psicólogo social Diederik Stapel ha llevado a la retractación de sus artículos en algunas de las principales revistas del mundo, como Journal of Experimental Social Psychology, Social Psychology, Basic and Applied Social Psychology, British Journal of Social Psychology y la revista Science. Diederik Stapel es un antiguo profesor de la Universidad de Tilburg (Países Bajos). En los últimos dos años, una amplia investigación en la que han participado tres universidades en las que ha trabajado Stapel ha concluido que el psicólogo es culpable de un fraude a escala colosal. Los datos falsificados contaminaron más de 55 artículos de su autoría y 10 tesis doctorales que supervisó.

Stapel no negó que su engaño estuviera motivado por la ambición. Pero me dijo que era más complicado que eso. Insistió en que le encantaba la psicología social, pero que se sentía frustrado por el desorden de los datos experimentales, que rara vez conducían a conclusiones claras. Su obsesión de toda la vida por la elegancia y el orden, según él, le llevó a inventar resultados sexys que las revistas encontraban atractivos. «Era una búsqueda de la estética, de la belleza, en lugar de la verdad», dijo. Describió su comportamiento como una adicción que le llevaba a realizar actos de fraude cada vez más atrevidos, como un drogadicto que busca un estímulo mayor y mejor.

La comisión que investiga a Stapel concluyó que es culpable de varias prácticas, entre ellas

  • crear conjuntos de datos, que confirmaron en gran medida las expectativas previas,
  • alterar los datos de los conjuntos de datos existentes,
  • cambiar los instrumentos de medición sin informar del cambio, y
  • tergiversar el número de sujetos experimentales.

Está claro que nunca es aceptable falsear los datos de la forma en que lo hizo este investigador. Sin embargo, a veces las violaciones de la ética no son tan fáciles de detectar.

Está claro que nunca es aceptable falsear los datos de la forma en que lo hizo este investigador. Sin embargo, a veces las violaciones de la ética no son tan fáciles de detectar.

Los investigadores tienen la responsabilidad de verificar que se siguen los métodos adecuados. El informe que describe la investigación del fraude de Stapel afirma que «los fallos estadísticos revelaron con frecuencia una falta de familiaridad con las estadísticas elementales”. Muchos de los coautores de Stapel deberían haber detectado irregularidades en sus datos. Desgraciadamente, no sabían mucho de análisis estadístico y se limitaban a confiar en que recopilaba y comunicaba los datos correctamente.

Muchos tipos de fraude estadístico son difíciles de detectar. Algunos investigadores simplemente dejan de recopilar datos una vez que tienen los suficientes para demostrar lo que esperaban comprobar. No quieren arriesgarse a que un estudio más extenso les complique la vida produciendo datos que contradigan su hipótesis.

Las organizaciones profesionales, como la American Statistical Association, definen claramente las expectativas de los investigadores. Incluso hay leyes en el código federal sobre el uso de datos de investigación.

Cuando un estudio estadístico utiliza participantes humanos, como en los estudios médicos, tanto la ética como la ley dictan que los investigadores deben tener en cuenta la seguridad de sus sujetos de investigación. El Departamento de Salud y Servicios Humanos de EE. UU. supervisa la normativa federal de los estudios de investigación con el objetivo de proteger a los participantes. Cuando una universidad u otra institución de investigación se dedica a la investigación, debe garantizar la seguridad de todos los sujetos humanos. Por esta razón, las instituciones de investigación establecen comités de supervisión conocidos como Juntas de Revisión Institucional (Institutional Review Boards, IRB). Todos los estudios previstos deben ser aprobados previamente por la IRB. Entre las principales protecciones que impone la ley se encuentran las siguientes:

  • Los riesgos para los afiliados deben ser mínimos y razonables con respecto a los beneficios previstos.
  • Los participantes deben dar su consentimiento informado. Esto significa que los riesgos de la participación deben explicarse claramente a los sujetos del estudio. Los sujetos deben dar su consentimiento por escrito y los investigadores están obligados a conservar la documentación de su consentimiento.
  • Los datos recogidos de las personas deben ser custodiados cuidadosamente para proteger su privacidad.

Estas ideas pueden parecer fundamentales, pero pueden ser muy difíciles de verificar en la práctica. ¿Es suficiente eliminar el nombre de un participante del registro de datos para proteger la privacidad? Tal vez se pueda descubrir la identidad de la persona a partir de los datos que quedan. ¿Qué ocurre si el estudio no se desarrolla como estaba previsto y surgen riesgos que no se habían considerado? ¿Cuándo es realmente necesario el consentimiento informado? Supongamos que su médico quiere una muestra de sangre para comprobar su nivel de colesterol. Una vez analizada la muestra, espera que el laboratorio se deshaga de la sangre restante. En ese momento la sangre se convierte en un residuo biológico. ¿Tiene un investigador derecho a tomarla para utilizarla en un estudio?

Es importante que los estudiantes de Estadística dediquen tiempo a considerar las cuestiones éticas que surgen en los estudios estadísticos. ¿Cuál es la prevalencia del fraude en los estudios estadísticos? Puede que se sorprenda y se decepcione.

La vigilancia contra el fraude requiere conocimientos. El aprendizaje de la teoría básica de la estadística le capacitará para analizar críticamente los estudios estadísticos.

Fuente y licenciamiento