lunes, 16 de abril de 2012

Puntos extra de estadística

Distribución Binomial

En estadística, la distribución binomial es una distribución de probabilidad discreta que mide el número de éxitos en una secuencia de n ensayos de Bernoulli independientes entre sí, con una probabilidad fija p de ocurrencia del éxito entre los ensayos.
Un experimento de Bernoulli se caracteriza por ser dicotómico, esto es, sólo son posibles dos resultados. A uno de estos se denomina éxito y tiene una probabilidad de ocurrencia p y al otro, fracaso, con una probabilidad q = 1 - p. En la distribución binomial el anterior experimento se repite n veces, de forma independiente, y se trata de calcular la probabilidad de un determinado número de éxitos. Para n = 1, la binomial se convierte, de hecho, en una distribución de Bernoulli.
Para representar que una variable aleatoria X sigue una distribución binomial de parámetros n y p, se escribe:
X \sim B(n, p)\,
 
binomial
n es el número de pruebas.
k es el número de éxitos.
p es la probabilidad de éxito.
q es la probabilidad de fracaso.

Ejemplo: La última novela de un autor ha tenido un gran éxito, hasta el punto de que el 80% de los lectores ya la han leido. Un grupo de 4 amigos son aficionados a la lectura:
1. ¿Cuál es la probabilidad de que en el grupo hayan leido la novela 2 personas?
B(4, 0.8) p = 0.8 q = 0.2
binomial
A continuacion algunos ejemplos de distribucion binomial en excel:
http://dl.dropbox.com/u/69541484/distribucion%20binomial.xlsx

Distribución Binomial Negativa


Si “X” es igual al Numero de fracasos antes de obtener “K” éxitos, entonces la variable aleatoria “X” tiene por función de densidad:
P(X=x) = función de densidad de la variable aleatoria binomial negativa.
p = probabilidad de éxito
q = probabilidad de fracaso
K = cantidad de éxitos
x = cantidad de fracasos

Ejemplos
Si la probabilidad de que un niño expuesto a una enfermedad contagiosa la contraiga es 0,40, ¿Cuál es la probabilidad de que el décimo niño expuesto a la enfermedad sea el tercero en contraerla? En este caso, X es el número de niños expuestos la enfermedad y
\!x = 10, k = 3, \theta = 0,\!40
La solución es:
\!b^*(10;3,0,\!4)={10-1 \choose 3-1}0,\!4^3(1-0,\!4)^{10-3}={9 \choose 2}0,\!4^3(0,\,6)^{7}=0,\!0645
En un proceso de manufactura se sabe que un promedio de 1 en cada 10 productos es defectuoso, ¿cual es la probabilidad que el quinto (5) articulo examinado sea el primero (1) en estar defectuoso?. La solucion es: X= articulos defectuosos P= 1/10 = 0,1 q= 1- 0,1 = 0,9 x= 5 ensayos K= 1 b*(5;1,0.1)=(5-1\1-1)(0.1)^1*(0.9)^5-1= b*(5;1,0.1)= 6.6% de probabilidad que el quinto elemento extraido sea el primero en estar defectuoso.
A continuacion algunos ejemplos de distribucion binomial negativa en excel:
http://dl.dropbox.com/u/69541484/Copia%20de%20binomial%20negativa.xlsx

Distribución Poison

En teoría de probabilidad y estadística, la distribución de Poisson es una distribución de probabilidad discreta que expresa, a partir de una frecuencia de ocurrencia media, la probabilidad que ocurra un determinado número de eventos durante cierto periodo de tiempo.
La función de masa de la distribución de Poisson es
f(k;\lambda)=\frac{e^{-\lambda} \lambda^k}{k!},\,\!
donde
  • k es el número de ocurrencias del evento o fenómeno (la función nos da la probabilidad de que el evento suceda precisamente k veces).
  • λ es un parámetro positivo que representa el número de veces que se espera que ocurra el fenómeno durante un intervalo dado. Por ejemplo, si el suceso estudiado tiene lugar en promedio 4 veces por minuto y estamos interesados en la probabilidad de que ocurra k veces dentro de un intervalo de 10 minutos, usaremos un modelo de distribución de Poisson con λ = 10×4 = 40.
  • e es la base de los logaritmos naturales (e = 2,71828 ...)
A continuacion algunos ejemplos de distribucion poison en excel:
http://dl.dropbox.com/u/69541484/poison.xlsx

Distribución Geométrica

En teoría de probabilidad y estadística, la distribución geométrica es cualquiera de las dos distribuciones de probabilidad discretas siguientes:
  • la distribución de probabilidad del número X del ensayo de Bernoulli necesaria para obtener un éxito, contenido en el conjunto { 1, 2, 3,...} o
  • la distribución de probabilidad del número Y = X − 1 de fallos antes del primer éxito, contenido en el conjunto { 0, 1, 2, 3,... }.
Cual de éstas es la que uno llama "la" distribución geométrica, es una cuestión de convención y conveniencia.

Si la probabilidad de éxito en cada ensayo es p, entonces la probabilidad de que x ensayos sean necesarios para obtener un éxito es
P(X = x) = (1 - p)^{x-1}p\,
para x = 1, 2, 3,.... Equivalentemente, la probabilidad de que haya x fallos antes del primer éxito es
P(Y=x) = (1 - p)^{x}p \,
para x = 0, 1, 2, 3,....
En ambos casos, la secuencia de probabilidades es una progresión geométrica.
El valor esperado de una variable aleatoria X distribuida geométricamente es
\ E(X) = \frac{1}{p}.
y dado que Y = X-1,
\ E(Y) = \frac{1-p}{p}.
En ambos casos, la varianza es
\mbox{var}(Y) = \mbox{var}(X) = \frac{1-p}{p^2}.
Las funciones generatrices de probabilidadde X y la de Y son, respectivamente,
G_X(s) = \frac{sp}{1-s(1-p)} \quad \textrm{y} \quad G_Y(s) = \frac{p}{1-s(1-p)}, \quad |s| < (1-p)^{-1}.
Como su análoga continua, la distribución exponencial, la distribución geométrica carece de memoria. Esto significa que si intentamos repetir el experimento hasta el primer éxito, entonces, dado que el primer éxito todavía no ha ocurrido, la distribución de probabilidad condicional del número de ensayos adicionales no depende de cuantos fallos se hayan observado. El dado o la moneda que uno lanza no tiene "memoria" de estos fallos. La distribución geométrica es de hecho la única distribución discreta sin memoria.
De todas estas distribuciones de probabilidad contenidas en {1, 2, 3,... } con un valor esperado dado μ, la distribución geométrica X con parámetro p = 1/μ es la de mayor entropía.
La distribución geométrica del número y de fallos antes del primer éxito es infinitamente divisible, esto es, para cualquier entero positivo n, existen variables aleatorias independientes Y 1,..., Yn distribuidas idénticamente la suma de las cuales tiene la misma distribución que tiene Y. Estas no serán geométricamente distribuidas a menos que n = 1.
A continuacion algunos ejemplos de distribucion poison en excel:
http://dl.dropbox.com/u/69541484/geometrica.xlsx

Distribución Hipergeométrica

 
Las distribución hipergeométrica es el modelo que se aplica en experimentos del siguiente tipo:
En una urna hay bolas de dos colores (blancas y negras), ¿cuál es la probabilidad de que al sacar 2 bolas las dos sean blancas?
Son experimentos donde, al igual que en la distribución binomial, en cada ensayo hay tan sólo dos posibles resultados: o sale blanca o no sale. Pero se diferencia de la distribución binomial en que los distintos ensayos son dependientes entre sí:
Si en una urna con 5 bolas blancas y 3 negras en un primer ensayo saco una bola blanca, en el segundo ensayo hay una bola blanca menos por lo que las probabilidades son diferentes (hay dependencia entre los distintos ensayos).
La distribución hipergeométrica sigue el siguiente modelo:
Donde:
Vamos a tratar de explicarlo:
N: es el número total de bolas en la urna
N1: es el número total de bolas blancas
N2: es el número total de bolas negras
k: es el número de bolas blancas cuya probabilidad se está calculando
n: es el número de ensayos que se realiza
Veamos un ejemplo: en una urna hay 7 bolas blancas y 5 negras. Se sacan 4 bolas ¿Cuál es la probabilidad de que 3 sean blancas?
Entonces:
N = 12; N1 = 7; N2 = 5; k = 3; n = 4
Si aplicamos el modelo:
Por lo tanto, P (x = 3) = 0,3535. Es decir, la probabilidad de sacar 3 bolas blancas es del 35,3%.
Pero este modelo no sólo se utiliza con experimentos con bolas, sino que también se aplica con experimentos similares:
Ejemplo: en una fiesta hay 20 personas: 14 casadas y 6 solteras. Se eligen 3 personas al azar ¿Cuál es la probabilidad de que las 3 sean solteras?
Por lo tanto, P (x = 3) = 0,0175. Es decir, la probabilidad de que las 3 personas sean solteras es tan sólo del 1,75%.

A continuacion algunos ejemplos de distribucion poison en excel:
http://dl.dropbox.com/u/69541484/distribucion%20hipergeometrical.xlsx