Introducción
Los estudios suelen comparar dos grupos. Por ejemplo, los investigadores están interesados en el efecto que tiene la aspirina en la prevención de ataques al corazón. Durante los años recientes, los periódicos y las revistas han informado de varios estudios sobre la aspirina en los que participan dos grupos. Normalmente, un grupo recibe aspirina y el otro un placebo. Luego, se estudia la tasa de infarto durante varios años.
Hay otras situaciones que tratan de la comparación de dos grupos. Por ejemplo, los estudios comparan varios programas de dieta y ejercicio. Los políticos comparan la proporción de personas de diferentes niveles de ingresos que podrían votar por ellos. Los estudiantes se interesan por saber si los cursos de preparación para la SAT o el Examen de Registro de Graduados (Graduate Record Exam, GRE) ayudan realmente a mejorar sus calificaciones.
Para comparar dos medias o dos proporciones, se trabaja con dos grupos. Los grupos se clasifican como independientes o pares coincidentes. Los grupos independientes consisten en dos muestras que son independientes, es decir, los valores de la muestra seleccionados de una población no están relacionados de ninguna manera con los valores de la muestra seleccionados de la otra población. Los pares coincidentes consisten en dos muestras que son dependientes. El parámetro que se comprueba utilizando pares coincidentes es la media de la población. Los parámetros que se prueban utilizando grupos independientes son las medias de la población o las proporciones de la población.

Desarrollo del tema
Medias de dos poblaciones con desviaciones típicas desconocidas
- Las dos muestras independientes son simples muestras aleatorias de dos poblaciones distintas.
- Para las dos poblaciones distintas
- Si los tamaños de las muestras son pequeños, las distribuciones son importantes (deben ser normales)
- si los tamaños de las muestras son grandes, las distribuciones no son importantes (no tienen por qué ser normales)
NOTA: La prueba que compara dos medias poblacionales independientes con desviaciones típicas poblacionales desconocidas y posiblemente desiguales se denomina prueba t de Aspin-Welch. Aspin Welch desarrolló la fórmula de los grados de libertad. |
La comparación de dos medias poblacionales es muy común. La diferencia entre las dos muestras depende tanto de las medias como de las desviaciones típicas. Pueden producirse medias muy diferentes por azar si hay una gran variación entre cada una de las muestras. Para tener en cuenta la variación, tomamos la diferencia de las medias de la muestra,

y dividimos entre el error estándar para normalizar la diferencia. El resultado es un estadístico de prueba de puntuación t.
Ya que desconocemos las desviaciones típicas de la población, las calculamos con las dos desviaciones típicas de nuestras muestras independientes. En la prueba de hipótesis, calculamos la desviación típica o el error estándar, de la diferencia de las medias muestrales,

El error estándar es:

El estadístico de prueba(puntuación t) se calcula como sigue:

donde:
- s1 y s2, las desviaciones típicas de la muestra, son estimaciones de σ1 y σ2, respectivamente.
- σ1 y σ2 son las desviaciones típicas desconocidas de la población.
- x¯1 y x¯2 son las medias muestrales. μ1 y μ2 son las medias poblacionales.
El número de grados de libertad (df) requiere un cálculo algo complicado. Sin embargo, la computadora o la calculadora lo calculan fácilmente. Los df no son siempre un número entero. El estadístico de prueba calculado anteriormente se determina aproximadamente mediante la distribución t de Student con df de la siguiente manera:

Cuando los tamaños de las muestras n1 y n2 son cinco o más, la aproximación t de Student es bastante apropiada. Observe que las varianzas muestrales (s1)2 y (s2)2 no están agrupadas. (Si se plantea la cuestión, no agrupe las varianzas).
NOTA: No es necesario calcularlo a mano. La calculadora o la computadoras lo harán fácilmente. |
Ejemplo:
Grupos independientes
Se cree que el promedio de tiempo que los niños y niñas de entre siete y once años practican deportes cada día es la misma. Se hace un estudio y se recopilan datos, lo que da como resultado los datos en la Tabla. Cada población tiene una distribución normal.
Tamaño de la muestra | Promedio de horas de práctica deportiva al día | Desviación típica de la muestra | |
---|---|---|---|
Niñas | 9 | 2 | 0,866 |
Niños | 16 | 3,2 | 1,00 |
Solución


Criterios de Cohen para efectos de tamaño pequeño, mediano y grande
La d de Cohen es la medida del tamaño del efecto con base en las diferencias entre dos medias. La d de Cohen, llamada así por el estadístico estadounidense Jacob Cohen, mide la fuerza relativa de las diferencias entre las medias de dos poblaciones a partir de los datos de la muestra. El valor calculado del tamaño del efecto se compara entonces con los criterios de Cohen de efecto de tamaño pequeño, mediano y grande.
Tamaño del efecto | d |
---|---|
Pequeño | 0,2 |
Mediano | 0,5 |
Grande | 0,8 |
La d de Cohen es la medida de la diferencia entre dos medias dividida entre la desviación típica combinada:

Dos medias poblacionales con desviaciones típicas conocidas
Aunque esta situación no es probable (conocer las desviaciones típicas de la población no es probable), el siguiente ejemplo ilustra la prueba de hipótesis para medias independientes, conociendo las desviaciones típicas de la población. La distribución muestral para la diferencia entre las medias es normal y ambas poblaciones deben ser normales. La variable aleatoria es

La distribución normal tiene el siguiente:

Ejemplo:
Grupos independientes, desviaciones típicas de la población conocidas: Se va a comparar el tiempo medio de duración de dos ceras para suelos de la competencia. Se asignan al azar veinte pisos para probar cada cera. Ambas poblaciones tienen una distribución normal. Los datos se registran en la tabla:
Cera | Muestra del número medio de meses que dura la cera del suelo | Desviación típica de la población |
---|---|---|
1 | 3 | 0,33 |
2 | 2,9 | 0,36 |


Comparación de dos proporciones de población independientes
Cuando se realiza una prueba de hipótesis que compara dos proporciones de población independientes se deben dar las siguientes características:
- Las dos muestras independientes son muestras aleatorias simples que son independientes.
- El número de aciertos es, al menos, cinco y el número de fallos es, al menos, cinco para cada una de las muestras.
- La literatura creciente establece que la población debe ser al menos diez o veinte veces el tamaño de la muestra. Así se evita que cada población sea objeto de un muestreo excesivo y se obtengan resultados incorrectos.
La comparación de dos proporciones, al igual que la comparación de dos medias, es de uso común. Si dos proporciones estimadas son diferentes, puede deberse a una diferencia en las poblaciones o al azar. Una prueba de hipótesis puede ayudar a determinar si una diferencia en las proporciones estimadas refleja una diferencia en las proporciones de la población.
La diferencia de dos proporciones sigue una distribución normal aproximada. En general, la hipótesis nula afirma que las dos proporciones son iguales. Es decir, H0: pA = pB. Para llevar a cabo la prueba utilizamos una proporción combinada, pc.

Ejemplo:
Se prueban dos tipos de medicamentos para la urticaria con el fin de determinar si existe una diferencia en las proporciones de las reacciones de los pacientes adultos. Veinte de una muestra aleatoria de 200 adultos a los que se les administró el medicamento A seguían teniendo urticaria 30 minutos después de tomarla. Doce de otra muestra aleatoria de 200 adultos a los que se les administró el medicamento B seguían teniendo urticaria 30 minutos después de tomar la medicación. Pruebe con un nivel de significación del 1 %.
Solución


Muestras coincidentes o emparejadas
Cuando se utiliza una prueba de hipótesis para muestras coincidentes o emparejadas, deben darse las siguientes características:
- Se utiliza un muestreo aleatorio simple.
- El tamaño de las muestras suele ser pequeño.
- Se toman dos medidas (muestras) del mismo par de personas u objetos.
- Las diferencias se calculan a partir de las muestras coincidentes o emparejadas.
- Las diferencias forman la muestra que se utiliza para la prueba de hipótesis.
- O bien los pares coincidentes tienen diferencias que provienen de una población que es normal o el número de diferencias es lo suficientemente grande como para que la distribución de la media muestral de las diferencias sea aproximadamente normal.
En una prueba de hipótesis para muestras coincidentes o emparejadas los sujetos son coincidentes en pares y se calculan las diferencias. Las diferencias son los datos. A continuación, se comprueba la media poblacional de las diferencias, μd, mediante una prueba t de Student para una única media poblacional con n – 1 grados de libertad, donde n es el número de diferencias.

Se realizó un estudio para investigar la eficacia del hipnotismo en la reducción del dolor. Los resultados de los sujetos seleccionados al azar se muestran en la Tabla. Una calificación más baja indica menos dolor. El valor “antes” es coincidente con un valor “después” y se calculan las diferencias. Las diferencias tienen una distribución normal. ¿Las medidas sensoriales son, en promedio, más bajas después del hipnotismo? Pruebe con un nivel de significación del 5 %.
Sujeto: | A | B | C | D | E | F | G | H |
---|---|---|---|---|---|---|---|---|
Antes | 6,6 | 6,5 | 9,0 | 10,3 | 11,3 | 8,1 | 6,3 | 11,6 |
Después | 6,8 | 2,4 | 7,4 | 8,5 | 8,1 | 6,1 | 3,4 | 2,0 |




Fuente y licenciamiento
- OpenStax (2022). Introducción al estadística. OpenStax https://openstax.org/books/introducci%C3%B3n-estad%C3%ADstica/
- De OpenStax bajo licencia Creative Commons Attribution License v4.0