Ciencias física, Naturales, Matemáticas y Estadísticas

Variables aleatorias discretas

Objetivos didácticos

Al final de este capítulo el estudiante podrá:

  • Reconocer y comprender las funciones de distribución de probabilidad discreta, en general.
  • Calcular e interpretar los valores esperados.
  • Reconocer la distribución de probabilidad binomial y aplicarla adecuadamente.
  • Reconocer la distribución de probabilidad de Poisson y aplicarla adecuadamente.
  • Reconocer la distribución geométrica de la probabilidad y aplicarla adecuadamente.
  • Reconocer la distribución de probabilidad hipergeométrica y aplicarla adecuadamente.
  • Clasificar los problemas de palabras discretas por sus distribuciones.

Introducción

Un estudiante responde un cuestionario de diez preguntas de verdadero-falso. Como el estudiante tenía una agenda tan apretada, no podía estudiar y estimaba al azar cada respuesta. ¿Cuál es la probabilidad de que el estudiante apruebe el examen con, al menos el 70 %?

Hay pequeñas compañías que pueden estar interesadas en el número de llamadas telefónicas de larga distancia que hacen sus empleados en las horas pico del día. Supongamos que el promedio es de 20 llamadas. ¿Cuál es la probabilidad de que los empleados hagan más de 20 llamadas de larga distancia durante las horas pico?

Estos dos ejemplos ilustran dos tipos diferentes de problemas de probabilidad que implican variables aleatorias discretas. Recordemos que los datos discretos son datos que se pueden contar. Una variable aleatoria describe con palabras los resultados de un experimento estadístico. Los valores de una variable aleatoria pueden variar con cada repetición de un experimento.

Variables aleatorias discretas

Notación de la variable aleatoria

Las letras mayúsculas como X o Y denotan una variable aleatoria. Las letras minúsculas como x o y denotan el valor de una variable aleatoria. Si X es una variable aleatoria, entonces X se escribe con palabras y x se da como un número.

Por ejemplo, supongamos que X = el número de caras que se obtiene al lanzar tres monedas imparciales. El espacio muestral para el lanzamiento de tres monedas imparciales es TTT; THH; HTH; HHT; HTT; THT; TTH; HHH. Entonces, x = 0, 1, 2, 3. X está en palabras y x es un número. Observe que para este ejemplo los valores de x son resultados contables. Como se pueden contar los posibles valores que puede tomar X y los resultados son aleatorios (los valores de x 0, 1, 2, 3), X es una variable aleatoria discreta.

Contenidos temáticos

  1. Función de Distribución de Probabilidad (PDF) para una variable aleatoria discreta.
  2. Media o valor esperado y desviación típica.
  3. Distribución binomial.
  4. Distribución geométrica.
  5. Distribución hipergeométrica.
  6. Distribución de Poisson

Desarrollo del tema

1. Función de Distribución de Probabilidad (PDF) para una variable aleatoria discreta

Una función de distribución de probabilidad discreta tiene dos características:

  1. Cada probabilidad está entre cero y uno, ambos inclusive.
  2. La suma de las probabilidades es uno.

Ejemplo:

Supongamos que Nancy tiene clases tres días a la semana. Asiste a clases tres días a la semana el 80 % del tiempo, dos días el 15 % del tiempo, un día el 4 % del tiempo y ningún día el 1 % del tiempo. Supongamos que se selecciona una semana al azar.

a. Supongamos que X = el número de días que Nancy ________.
b. ¿Qué valores asumeX?
c. Supongamos que se elige una semana al azar. Construya una tabla de distribución de probabilidades (llamada tabla PDF) como la que aparece en el Ejemplo 4.1. La tabla debe tener dos columnas denominadas x y P(x). ¿A cuánto asciende la columna P(x)?

Solución:

a. Supongamos que X = el número de días que Nancy asiste a clase por semana
b. 0, 1, 2 y 3

c.

2. Media o valor esperado y desviación típica

El valor esperado suele denominarse media o promedio «a largo plazo». Esto significa que a largo plazo de hacer un experimento una y otra vez, se esperaría este promedio.

Se lanza una moneda y se anota el resultado. ¿Cuál es la probabilidad de que el resultado sea cara? Si lanza una moneda dos veces, ¿la probabilidad le dice que estos lanzamientos darán como resultado una cara y una cruz? Puede lanzar una moneda diez veces y registrar nueve caras.

La ley de los grandes números establece que, a medida que aumenta el número de ensayos en un experimento de probabilidad, la diferencia entre la probabilidad teórica de un evento y la frecuencia relativa se aproxima a cero (la probabilidad teórica y la frecuencia relativa se acercan cada vez más). Al evaluar los resultados a largo plazo de los experimentos estadísticos, a menudo queremos conocer el resultado del “promedio». Este “promedio a largo plazo” se conoce como la media o valor esperado del experimento y se denota con la letra griega μ. En otras palabras, después de realizar muchos ensayos de un experimento, se esperaría este valor promedio.

Ejemplo:

Un equipo de fútbol masculino juega al fútbol en cero, en uno o en dos días a la semana. La probabilidad de que jueguen cero días es de 0,2, la de que jueguen un día es de 0,5 y la de que jueguen dos días es de 0,3. Calcule el promedio a largo plazo o el valor esperado, μ, del número de días por semana que el equipo de fútbol masculino juega al fútbol.

Para resolver el problema, primero dejemos la variable aleatoria X = el número de días que el equipo de fútbol masculino juega al fútbol por semana. X toma los valores 0, 1, 2 Construya una tabla PDF añadiendo una columna x*P(x). En esta columna, multiplicará cada valor de x por su probabilidad.

xP(x)x*P(x)
00,2(0)(0,2) = 0
10,5(1)(0,5) = 0,5
20,3(2)(0,3) = 0,6
Tabla de valores esperados Esta tabla se denomina tabla de valores esperados. La tabla le ayuda a calcular el valor esperado o promedio a largo plazo.

Añada la última columna x*P(x) para hallar las intersecciones en el promedio a largo plazo o el valor esperado: (0)(0,2) + (1)(0,5) + (2)(0,3) = 0 + 0,5 + 0,6 = 1,1.

El valor esperado es 1,1. El equipo de fútbol masculino tendría, en promedio, que jugar al fútbol 1,1 días por semana. El número 1,1 es el promedio a largo plazo o el valor esperado si el equipo de fútbol masculino juega al fútbol semana tras semana. Decimos que μ = 1,1.

Al igual que los datos, las distribuciones de probabilidad tienen desviaciones típicas. Para calcular la desviación típica) de una distribución de probabilidad, halle cada desviación de su valor esperado, elévela al cuadrado, multiplíquela por su probabilidad, sume los productos y calcule la raíz cuadrada. Para entender cómo hacer el cálculo, observe la tabla del número de días por semana que un equipo de fútbol masculino juega al fútbol. Para calcular la desviación típica, sume las entradas de la columna marcada como (x – μ)2P(x) y calcule la raíz cuadrada.

xP(x)x*P(x)(x – μ)2P(x)
00,2(0)(0,2) = 0(0 – 1,1)2(0,2) = 0,242
10,5(1)(0,5) = 0,5(1 – 1,1)2(0,5) = 0,005
20,3(2)(0,3) = 0,6(2 – 1,1)2(0,3) = 0,243

Sume la última columna de la tabla. 0,242 + 0,005 + 0,243 = 0,490. La desviación típica es la raíz cuadrada de 0,49, es decir,

Generalmente, para las distribuciones de probabilidad, utilizamos una calculadora o una computadora para calcular μ y σ para reducir el error de redondeo. Para algunas distribuciones de probabilidad, existen fórmulas abreviadas para calcular μ y σ.

Ejemplo:

Un equipo de fútbol masculino juega al fútbol en cero, en uno o en dos días a la semana. La probabilidad de que jueguen cero días es de 0,2, la de que jueguen un día es de 0,5 y la de que jueguen dos días es de 0,3. Calcule el promedio a largo plazo o el valor esperado, μ, del número de días por semana que el equipo de fútbol masculino juega al fútbol.

Para resolver el problema, primero dejemos la variable aleatoria X = el número de días que el equipo de fútbol masculino juega al fútbol por semana. X toma los valores 0, 1, 2 Construya una tabla PDF añadiendo una columna x*P(x). En esta columna, multiplicará cada valor de x por su probabilidad.

 Tabla de valores esperados Esta tabla se denomina tabla de valores esperados. La tabla le ayuda a calcular el valor esperado o promedio a largo plazo.

Añadir la última columna x*P(x) para hallar las intersecciones en el promedio a largo plazo o el valor esperado: (0)(0,2) + (1)(0,5) + (2)(0,3) = 0 + 0,5 + 0,6 = 1,1.

El valor esperado es 1,1. El equipo de fútbol masculino tendría, en promedio, que jugar al fútbol 1,1 días por semana. El número 1,1 es el promedio a largo plazo o el valor esperado si el equipo de fútbol masculino juega al fútbol semana tras semana. Decimos que μ = 1,1.

Algunas de las funciones de probabilidad discreta más comunes son la binomial, la geométrica, la hipergeométrica y la de Poisson. La mayoría de los cursos elementales no cubren la geométrica, la hipergeométrica y la Poisson. Su instructor le hará saber si desea cubrir estas distribuciones.

Una función de distribución de probabilidad es un patrón. Intente adaptar un problema de probabilidad en un patrón o distribución para realizar los cálculos necesarios. Estas distribuciones son herramientas que facilitan la resolución de problemas de probabilidad. Cada distribución tiene sus propias características especiales. Aprender las características le permite distinguir entre las diferentes distribuciones.

3. Distribución binomial

El experimento binomial tiene tres características.

  1. Hay un número fijo de ensayos. Piense en los ensayos como repeticiones de un experimento. La letra n indica el número de ensayos.
  2. Solo hay dos resultados posibles, llamados “acierto” y “fallo” para cada ensayo. La letra p denota la probabilidad de acierto en un ensayo, y la q la probabilidad de fracaso en un ensayo. p + q = 1.
  3. Los n ensayos son independientes y se repiten utilizando condiciones idénticas. Como los n ensayos son independientes, el resultado de un ensayo no ayuda a predecir el resultado de otro. Otra forma de decir esto es que para cada ensayo individual la probabilidad, p, de un acierto y la probabilidad, q, de un fallo siguen siendo las mismas. Por ejemplo, estimar al azar una pregunta de estadística de verdadero-falso solo tiene dos resultados. Si un acierto es estimar correctamente, un fallo es estimar incorrectamente. Supongamos que Joe siempre acierta en cualquier pregunta de Estadística de verdadero-falso con una probabilidad p = 0,6. Entonces, q = 0,4. Esto significa que para cada pregunta de estadística de verdadero-falso que responda Joe su probabilidad de acierto (p = 0,6) y su probabilidad de fallo (q = 0,4) siguen siendo las mismas.

Los resultados de un experimento binomial se ajustan a una distribución de probabilidad binomial. La variable aleatoria X = el número de aciertos obtenidos en los n ensayos independientes.

La media, μ, y la varianza, σ2, de la distribución de probabilidad binomial son μ = np y σ2 = npq. La desviación típica, σ, es entonces:

Cualquier experimento que tenga las características dos y tres y en el que n = 1 se llama Ensayo de Bernoulli (llamado así por Jacob Bernoulli que, a finales de 1600, los estudió ampliamente). Un experimento binomial se produce cuando se cuenta el número de aciertos en uno o más ensayos de Bernoulli.

Ejemplo:

Aproximadamente el 70 % de los estudiantes de Estadística hacen sus tareas para la casa a tiempo para que sean recopiladas y calificadas. Cada estudiante lo hace de forma independiente. En una clase de Estadística de 50 estudiantes, ¿cuál es la probabilidad de que, al menos, 40 hagan la tarea para la casa a tiempo? Los estudiantes son seleccionados al azar.

a. Se trata de un problema binomial porque solo hay un acierto o un __, hay un número fijo de ensayos y la probabilidad de acierto es de 0,70 para cada ensayo.
b. Si nos interesa el número de estudiantes que hacen la tarea para la casa a tiempo, ¿cómo definimos X?
c. ¿Qué valores toma x?
d. ¿Qué es un “fallo” en palabras?
e. Si p + q = 1, ¿qué es q?
f. ¿Como qué tipo de inecuación se traducen las palabras “al menos” para la pregunta de probabilidad P(x __ 40)?

Solución:

a. fallo
b. X = número de estudiantes de Estadística que hacen la tarea para la casa a tiempo
c. 0, 1, 2, …, 50
d. Fallo se define como un estudiante que no termina sus tareas para la casa a tiempo.
La probabilidad de acierto es p = 0,70. El número de ensayos es n = 50
e. q = 0,30
f. mayor o igual que (≥)
La pregunta de probabilidad es P(x ≥ 40).

Notación para el binomio: B = Función de distribución de la probabilidad binomial

X ~ B(n, p)

Léase esto como «X es una variable aleatoria con una distribución binomial». Los parámetros son n y p; n = número de ensayos, p = probabilidad de acierto en cada ensayo.

Ejemplo:

Se ha afirmado que alrededor del 41 % de los trabajadores adultos tienen un diploma de secundaria, pero no siguen ningún tipo de educación. Si se seleccionan al azar 20 trabajadores adultos, halle la probabilidad de que como máximo 12 de ellos tengan un diploma de secundaria, pero no sigan ningún tipo de educación. ¿Cuántos trabajadores adultos espera que tengan un título de secundaria, pero que no sigan estudiando?

Supongamos que X = el número de trabajadores que tienen un diploma de secundaria, pero que no siguen ningún tipo de educación.

X toma los valores 0, 1, 2, …, 20 donde n = 20, p = 0,41 y q = 1 – 0,41 = 0,59. X ~ B(20, 0,41)

Halla P(x ≤ 12). P(x ≤ 12) = 0,9738. (calculadora o computadora)

USO DE LAS CALCULADORAS TI-83, 83+, 84, 84+

Vaya a 2nd DISTR. La sintaxis de las instrucciones es la siguiente:

Para calcular (x = valor): binompdf (n, p, número) si se omite «número», el resultado es la tabla de probabilidad binomial.
Para calcular P(x ≤ valor): binomcdf (n, p, número) si se omite «número», el resultado es la tabla de probabilidad binomial acumulada.
Para este problema: una vez que esté en 2nd DISTR, use la flecha hacia abajo hasta binomcdf. Pulse ENTER. Introduzca 20,0.41,12). El resultado es P(x ≤ 12) = 0,9738.

NOTA. Si quiere hallar P(x = 12), utilice la pdf (binompdf). Si quiere hallar P(x > 12), utilice 1 – binomcdf(20; 0,41;12).

La probabilidad de que como máximo 12 trabajadores tengan un diploma de secundaria, pero no sigan ningún tipo de educación es de 0,9738.

El gráfico de X ~ B(20, 0,41) es el siguiente:

El eje ycontiene la probabilidad de x, donde X = el número de trabajadores que solo tienen un diploma de secundaria.

El número de trabajadores adultos que se espera que tengan un diploma de secundaria, pero que no sigan ningún tipo de educación es la media, μ = np = (20)(0,41) = 8,2.

La fórmula de la varianza es σ2 = npq.

4. Distribución geométrica

Hay tres características principales de un experimento geométrico.

  1. Hay uno o más ensayos de Bernoulli con todos los fallos excepto el último, que es un acierto. En otras palabras, sigue repitiendo lo que está haciendo hasta el primer acierto. Entonces se detiene. Por ejemplo, se lanza un dardo a una diana hasta dar en ella. La primera vez que logra dar en la diana es un “acierto”, así que deja de lanzar el dardo. Puede que le lleve seis intentos hasta que acierte en la diana. Puede pensar en las pruebas como fallo, fallo, fallo, fallo, acierto, PARAR.
  2. En teoría, el número de pruebas podría ser eterno. Debe haber, al menos, un ensayo.
  3. La probabilidad, p, de un acierto y la probabilidad, q, de un fallo es igual para cada ensayo. p + q = 1 y q = 1 – p. Por ejemplo, la probabilidad de sacar un tres al lanzar un dado imparcial es 1/6. Esto es cierto sin importar cuántas veces se lance el dado. Supongamos que quiere saber la probabilidad de obtener el primer tres en la quinta lanzada. En las lanzadas del uno al cuatro, no se obtiene un lado con un tres. La probabilidad de cada una de las lanzadas es q = 5/6, la probabilidad de un fallo. La probabilidad de obtener un tres en la quinta lanzada es

X = el número de ensayos independientes hasta el primer acierto.

Notación para la Geometría: G = Función de distribución de probabilidad geométrica

X ~ G(p)

Lea como “X es una variable aleatoria con una distribución geométrica”. El parámetro es p; p = la probabilidad de acierto de cada ensayo.

Ejemplo:

Supongamos que la probabilidad de un componente informático defectuoso es de 0,02. Los componentes se seleccionan al azar. Calcule la probabilidad de que el primer defecto sea causado por el séptimo componente probado. ¿Cuántos componentes espera probar hasta que se halle uno defectuoso?

Supongamos que X = el número de componentes informáticos probados hasta que se encuentra el primer defecto.

X toma los valores 1, 2, 3, … donde p = 0,02. X ~ G(0,02)

Calcule P(x = 7). P(x = 7) = 0,0177.

USO DE LAS CALCULADORAS TI-83, 83+, 84, 84+

Hallar la probabilidad de que x = 7,

  • Introduzca 2nd, DISTR
  • Desplácese hacia abajo y seleccione geometpdf(
  • Pulse ENTER
  • Introduzca 0,02, 7); pulse ENTER para ver el resultado: P(x = 7) = 0,0177

Para hallar la probabilidad de que x ≤ 7, siga las mismas instrucciones EXCEPTO que seleccione E:geometcdf(como la función de distribución.

La probabilidad de que el séptimo componente sea el primer defecto es de 0,0177.

El gráfico de X ~ G(0,02) es:

El eje y contiene la probabilidad de x, donde X = el número de componentes informáticos probados.

El número de componentes que se espera probar hasta hallar el primero defectuoso es la media, μ = 50.

5. Distribución hipergeométrica

Hay cinco características de un experimento hipergeométrico.

  1. Se toman muestras de dos grupos.
  2. Le interesa un grupo de interés, llamado primer grupo.
  3. Se toma una muestra sin reemplazo de los grupos combinados. Por ejemplo, quiere elegir un equipo de softball entre un grupo combinado de 11 hombres y 13 mujeres. El equipo está formado por diez jugadores.
  4. Cada elección de un jugador no es independiente, ya que el muestreo es sin reemplazo. En el ejemplo del sóftbol, la probabilidad de elegir primero a una mujer es :

La probabilidad de elegir a un hombre en segundo lugar es

si se eligió a una mujer primero. Es

si se eligió a un hombre primero. La probabilidad de la segunda elección depende de lo que haya ocurrido en la primera.

5. No se trata de ensayos de Bernoulli.

Los resultados de un experimento hipergeométrico se ajustan a una distribución de probabilidad hipergeométrica. La variable aleatoria X = el número de elementos del grupo de interés.

Ejemplo:

Un plato de caramelos contiene 100 gominolas y 80 chicles. Se eligen 50 caramelos al azar. ¿Cuál es la probabilidad de que 35 de los 50 sean chicles? Los dos grupos son gominolas y pastillas de goma. Como la pregunta de probabilidad pide la probabilidad de seleccionar un chicle, el grupo de interés (primer grupo) es el de los chicles. El tamaño del grupo de interés (primer grupo) es de 80. El tamaño del segundo grupo es de 100. El tamaño de la muestra es de 50 (gominolas o chicles). Supongamos que X = el número de chicles en la muestra de 50. X toma los valores x = 0, 1, 2, …, 50. ¿Cuál es el enunciado de la probabilidad escrito matemáticamente?

Solución:

P(x = 35)

Notación para el hipergeométrico: H = Función de distribución de la probabilidad hipergeométrica

X ~ H(r, b, n)

Léala como «X es una variable aleatoria con una distribución hipergeométrica». Los parámetros son r, b y n; r = el tamaño del grupo de interés (primer grupo), b = el tamaño del segundo grupo, n = el tamaño de la muestra elegida.

Ejemplo:

El comité escolar se elegirá al azar entre seis hombres y cinco mujeres. Si el comité está formado por cuatro miembros elegidos al azar, ¿cuál es la probabilidad de que dos de ellos sean hombres? ¿Cuántos hombres espera que haya en el comité?

Supongamos que X = el número de hombres del comité de cuatro. Los hombres son el grupo de interés (primer grupo).

X toma los valores 0, 1, 2, 3, 4, donde r = 6, b = 5 y n = 4. X ~ H(6, 5, 4)
Calcula P(x = 2). P(x = 2) = 0,4545 (calculadora o computadora)

NOTA. Actualmente, la TI-83+ y la TI-84 no tienen funciones de probabilidad hipergeométrica. Hay varios paquetes informáticos, como Microsoft Excel, que lo hacen.

La probabilidad de que haya dos hombres en el comité es de aproximadamente 0,45. El gráfico de X ~ H(6, 5, 4) es:

El eje y contiene la probabilidad de X, donde X = el número de hombres en el comité. Es de esperar que haya m = 2,18 (unos dos) hombres en el comité.

La fórmula de la media es:

7. Distribución de Poisson

Hay dos características principales de un experimento de Poisson.

  1. La distribución de probabilidad de Poisson da la probabilidad de que se produzca un número de eventos en un intervalo fijo de tiempo o espacio si estos eventos se producen con una tasa promedio conocida y con independencia del tiempo transcurrido desde el último evento. Por ejemplo, un editor de libros podría estar interesado en el número de palabras escritas incorrectamente en un libro en particular. Puede ser que, en promedio, haya cinco palabras mal escritas en 100 páginas. El intervalo son las 100 páginas.
  2. La distribución de Poisson puede utilizarse para aproximarse a la binomial si la probabilidad de éxito es «pequeña» (del orden de 0,01) y el número de intentos es «grande» (del orden de 1000). Comprobará la relación en los ejercicios de los deberes. n es el número de intentos, y p es la probabilidad de un “acierto».

La variable aleatoria X = el número de ocurrencias en el intervalo de interés.

Ejemplo:

Un banco espera recibir seis cheques sin fondos al día, en promedio. ¿Cuál es la probabilidad de que el banco reciba menos de cinco cheques sin fondos en un día determinado? El interés es el número de cheques que el banco recibe en un día, por lo que el intervalo de tiempo del interés es un día. Supongamos que X = el número de cheques sin fondos que recibe el banco en un día. Si el banco espera recibir seis cheques sin fondos al día, el promedio es de seis cheques al día. Escriba un enunciado matemático para la pregunta de probabilidad.

Solución:

P(x < 5)

Fuente y licenciamiento