Skip to content

Distribución Hipergeométrica

La distribución hipergeométrica es una distribución de probabilidad discreta que describe el número de éxitos en una secuencia de extracciones sin reemplazo de una población finita. A diferencia de la distribución binomial, donde las extracciones son con reemplazo, la distribución hipergeométrica modela situaciones en las que la probabilidad de éxito cambia en cada extracción.


Definición Formal

Consideremos una población finita de tamaño N, donde:

  • K es el número de elementos que se consideran "éxitos".
  • NK es el número de elementos que se consideran "fracasos".

Se extraen n elementos sin reemplazo. La variable aleatoria X que cuenta el número de éxitos en las n extracciones sigue una distribución hipergeométrica con parámetros N, K y n, denotada como:

XHipergeométrica(N,K,n)

Función de Probabilidad

La función de probabilidad de la distribución hipergeométrica está dada por:

P(X=k)=(Kk)(NKnk)(Nn)

donde:

  • (Kk) es el número de formas de elegir k éxitos de los K disponibles.
  • (NKnk) es el número de formas de elegir nk fracasos de los NK disponibles.
  • (Nn) es el número total de formas de elegir n elementos de la población de tamaño N.

Propiedades de la Distribución Hipergeométrica

Valor Esperado (Media)

El valor esperado de una variable aleatoria hipergeométrica X es:

E[X]=nKN

Varianza

La varianza de una variable aleatoria hipergeométrica X es:

Var(X)=nKN(1KN)(NnN1)

Desviación Estándar

La desviación estándar de una variable aleatoria hipergeométrica X es:

σX=nKN(1KN)(NnN1)

Ejemplos Prácticos

Ejemplo 1: Básico

Problema: En una caja hay 10 bolas, de las cuales 4 son rojas y 6 son azules. Si se extraen 3 bolas sin reemplazo, ¿cuál es la probabilidad de que exactamente 2 sean rojas?

Solución:

  1. Identificamos los parámetros:

    • N=10 (total de bolas).
    • K=4 (bolas rojas).
    • n=3 (extracciones).
    • k=2 (éxitos deseados).
  2. Aplicamos la fórmula de la distribución hipergeométrica:

P(X=2)=(42)(61)(103)
  1. Calculamos los coeficientes binomiales:

    • (42)=6
    • (61)=6
    • (103)=120
  2. Sustituimos los valores:

P(X=2)=66120=36120=0.3

Respuesta: La probabilidad de obtener exactamente 2 bolas rojas es 30%.


Ejemplo 2: Intermedio

Problema: En un mazo de 52 cartas, hay 13 cartas de corazones. Si se extraen 5 cartas sin reemplazo, ¿cuál es la probabilidad de que al menos 3 sean corazones?

Solución:

  1. Identificamos los parámetros:

    • N=52 (total de cartas).
    • K=13 (cartas de corazones).
    • n=5 (extracciones).
    • Queremos P(X3)=P(X=3)+P(X=4)+P(X=5).
  2. Calculamos cada probabilidad por separado usando la fórmula hipergeométrica:

    • Para P(X=3):

      P(X=3)=(133)(392)(525)(133)=286,(392)=741,(525)=2,598,960P(X=3)=2867412,598,9600.0815
    • Para P(X=4):

      P(X=4)=(134)(391)(525)(134)=715,(391)=39P(X=4)=715392,598,9600.0107
    • Para P(X=5):

      P(X=5)=(135)(390)(525)(135)=1,287,(390)=1P(X=5)=1,28712,598,9600.0005
  3. Sumamos las probabilidades:

    P(X3)=0.0815+0.0107+0.0005=0.0927

Respuesta: La probabilidad de obtener al menos 3 cartas de corazones es aproximadamente 9.27%.


Ejemplo 3: Avanzado

Problema: En una lotería, hay 100 boletos en total, de los cuales 10 son ganadores. Si una persona compra 15 boletos, ¿cuál es la probabilidad de que exactamente 4 de ellos sean ganadores?

Solución:

  1. Identificamos los parámetros:

    • N=100 (total de boletos).
    • K=10 (boletos ganadores).
    • n=15 (boletos comprados).
    • k=4 (éxitos deseados).
  2. Aplicamos la fórmula de la distribución hipergeométrica:

P(X=4)=(104)(9011)(10015)
  1. Calculamos los coeficientes binomiales:

    • (104)=210.
    • (9011)1.05×1014.
    • (10015)2.53×1017.
  2. Sustituimos los valores:

P(X=4)=2101.05×10142.53×10170.087

Respuesta: La probabilidad de que exactamente 4 boletos sean ganadores es aproximadamente 8.7%.


Aplicaciones

La distribución hipergeométrica se utiliza en situaciones donde el muestreo se realiza sin reemplazo, como:

  • Control de calidad: Para calcular la probabilidad de encontrar un número específico de defectos en una muestra de productos.
  • Biología: Para estimar la probabilidad de encontrar un número determinado de individuos con una característica específica en una población.
  • Juegos de azar: Para calcular probabilidades en juegos como la lotería o el póker.

Conclusión

La distribución hipergeométrica es una herramienta esencial para modelar situaciones de muestreo sin reemplazo. Su uso es fundamental en campos como la estadística, la ingeniería y las ciencias naturales, donde es necesario calcular probabilidades en poblaciones finitas.

Released under the MIT License.