Estatı́stica Básica
5.2 Resolução
-
5.2.1 O dendrograma (diagrama de árvore) é:
O espaço amostral é obtido considerando todos os ramos desse diagrama de árvore e resulta em:
\(\seteqnumber{0}{5.}{0}\)\begin{align*} \Omega =&\left \{(FFF),\,(FFM),\,(FMF),\,(FMM),\,(MFF),\,(MFM),\,(MMF),\,(MMM)\right \} \end{align*}
Cada ponto deste é equiprovável, pois as probabilidades de nascimento de fêmea e macho são iguais e cada elemento de \(\Omega \) tem probabilidade \((1/2)^3=1/8\).
-
a) A distribuição de probabilidade da variável aleatória \(X\), definida como sendo o número de fêmeas, é:
\(x\) \(0\) \(1\) \(2\) \(3\) \(P(X=x)\) \(\dfrac {1}{8}\) \(\dfrac {3}{8}\) \(\dfrac {3}{8}\) \(\dfrac {1}{8}\) Por exemplo, a probabilidade \(P(X=1)\) é obtida pelo número total de pontos de \(\Omega \) em que \(X=1\), que no caso é igual a \(3\), em relação ao número total de pontos, que é igual a \(8\).
-
b) Os resultados para os eventos solicitados são:
-
i) \(P(X=2)=\dfrac {3}{8}=\)0,3750=37,50%;
-
ii) Se \(Y\) representa o número de machos, o evento \(Y\ge 1\) equivale a \(X\le 2\), pois se houver \(1\) macho na ninhada, isto implica em duas fêmeas; se houver \(2\) machos, implica em \(1\) fêmea; e se houver \(3\) machos, implica em \(0\) fêmea. Assim, a probabilidade do evento é:
\(P(Y\ge 1)=P(X\le 2)=P(X=2)+P(X=1)+P(X=0)=\dfrac {3}{8}+\dfrac {3}{8}+\dfrac {1}{8}\) \(=\dfrac {7}{8}=\)0,8750=87,50%;
-
iii) \(P(X\ge 2)=P(X=2)+P(X=3)=\dfrac {3}{8}+\dfrac {1}{8}=\) \(\dfrac {1}{2}=\)0,50=50%;
-
iv) \(P(X\le 1)=P(X=1)+P(X=0)=\dfrac {3}{8}+\dfrac {1}{8}=\) \(\dfrac {1}{2}=\)0,50=50%.
-
-
c) O número esperado \(NE\) de ninhadas de \(3\) filhotes com exatamente \(1\) fêmea é dado pelo produto da probabilidade do evento \(P(X=1)\) pelo número total de ninhadas, ou seja, é \(NE=(3/8)\times 500 \approx 188\) ninhadas. Assim, das \(500\) esperamos que \(188\) tenham exatamente \(1\) fêmea.
-
-
5.2.2 Neste caso assumimos que \(X\), definida como o número de fêmeas, possui distribuição binomial com parâmetros \(n=4\) e \(p=5/8\). A probabilidade de sucesso não é \(1/2\), de acordo com as leis de Mendel, pois há um distúrbio genético na raça. Usualmente usamos a seguinte notação para dizer a mesma coisa que acabamos de explicar: \(X \sim \textrm { Binomial}(n=4,p=5/8)\).
-
a) Para obtermos a distribuição de probabilidade de \(X\), podemos utilizar o modelo binomial dado por:
\(\seteqnumber{0}{5.}{0}\)\begin{align*} P(X=x)=&\binom {n}{x} p^x(1-p)^{n-x} \end{align*} para \(x=0\), \(1\), \(\ldots \), \(4\).
Por exemplo, para a probabilidade \(P(X=0)\) temos:
\(\seteqnumber{0}{5.}{0}\)\begin{align*} P(X=x)=&\binom {4}{0} \left (\dfrac {5}{8}\right )^0\left (1-\dfrac {5}{8}\right )^{4-0}=1\times 1\times \left (\dfrac {3}{8}\right )^4=0,0198. \end{align*}
Assim, temos a seguinte distribuição de probabilidades:
\(x\) \(0\) \(1\) \(2\) \(3\) \(4\) \(P(X=x)\) 0,0198 0,1318 0,3296 0,3662 0,1526 -
b) A média é: \(\mu _X= np = 4\times 5/8=\)2,5; e a variância é: \(\sigma ^2_X=np(1-p)=4\times (5/8)\times (3/8)=\)0,9375.
-
c) O número esperado \(NE\) de ninhadas é dado pelo produto da probabilidade do evento de interesse \(P(X=x)\) pelo número total de ninhadas. Por exemplo, para \(X=0\), temos \(P(X=0)\times 1.000=\)0,0198\(\times 1.000=\)19,8\(\approx \)20 ninhadas com nenhuma fêmea. Os demais valores (arredondados) estão apresentados na tabela a seguir:
\(x\) \(0\) \(1\) \(2\) \(3\) \(4\) \(P(X=x)\) 0,0198 0,1318 0,3296 0,3662 0,1526 \(NE\) 20 132 330 366 153
-
-
5.2.3 Resposta para cada uma das questões:
-
a) O modelo probabilístico adequado é o modelo Poisson, principalmente se pudermos supor que a distribuição das bactérias pela lâmina seja aleatória. Assim, \(X \sim \) Poisson\((\lambda =4)\).
-
b) NE\(=P(X\le 1)\times 600\). Para obtermos a probabilidade do evento de interesse devemos usar o modelo Poisson dado por:
\(\seteqnumber{0}{5.}{0}\)\begin{align*} P(X=x)=& \dfrac {e^{-\lambda }\lambda ^x}{x!}, \end{align*} para \(x=0\), \(1\), \(2\), \(\ldots \) e \(\lambda =4\).
Assim, \(P(X\le 1)=P(X=1)+P(X=0)\), sendo
\(\seteqnumber{0}{5.}{0}\)\begin{align*} P(X=0)=& \dfrac {e^{-4}\times 4^0}{0!}= 0,0183 &\textrm { e }&& P(X=1)=& \dfrac {e^{-4}\times 4^1}{1!}= 0,0733. \end{align*}
Portanto,
\(\seteqnumber{0}{5.}{0}\)\begin{align*} P(X\le 1)=& P(X=0)+ P(X=1)=0,0183+0,0733=0,0916=9,16\% \end{align*} e o número esperado de quadrados com no máximo \(1\) bactéria é NE\(=P(X\le 1)\times 600=\) 0,0916\(\times 600\approx 55\).
-
c) \(P(X>2)=P(X=3)+P(X=4)+\ldots \). Como esta soma possui um número infinito de termos e sabendo que a soma de todos as probabilidades é igual a \(1\), então
\(\seteqnumber{0}{5.}{0}\)\begin{align*} P(X>2)=& 1-\left [P(X=0)+P(X=1)+P(X=2)\right ]=1-\left (0,0183+0,0733+\dfrac {e^{-4}\times 4^2}{2!}\right )\\ =& 1-(0,0183+0,0733+0,1465)= 1-0,2381=0,7619=76,19\%. \end{align*}
-
d) \(P(X=0)=\)1,83%.
-
-
5.2.4 A ocorrência de doenças por ano pode ser modelada, se for aleatória, pelo modelo Poisson. Assim, \(X\sim \) Poisson\((\hat {\lambda =\bar {X}}\).
-
a) A média é
\(\seteqnumber{0}{5.}{0}\)\begin{align*} \bar {X}=& \dfrac {0\times 55+1\times 44+ \cdots + 5\times 1}{120}=\dfrac {102}{120}=0,85\textrm { doenças/ano}. \end{align*}
-
b) O parâmetro \(\lambda \) pode ser estimado por \(\hat {\lambda }=\bar {X}=\)0,85. Assim, podemos estimar a distribuição de probabilidade utilizando o modelo Poisson por:
\(\seteqnumber{0}{5.}{0}\)\begin{align*} P(X=x)=& \dfrac {e^{-0,85}\times 0,85^x}{x!}. \end{align*}
Para \(X=0\) e \(X=1\), para fins de ilustração, temos:
\(\seteqnumber{0}{5.}{0}\)\begin{align*} P(X=0)=& \dfrac {e^{-0,85}\times 0,85^0}{0!}=0,4274 &&& P(X=1)=& \dfrac {e^{-0,85}\times 0,85^1}{1!}=0,3633. \end{align*}
Estas e as demais probabilidades são apresentadas na tabela seguinte:
\(x\) \(0\) \(1\) \(2\) \(3\) \(4\) \(5\) \(6\) ou mais \(P(X=x)\) 0,4274 0,3633 0,1544 0,0437 0,0093 0,0016 0,0003 -
c) A frequência esperada é dada pelo produtos das probabilidades por 120. Logo,
\(x\) \(0\) \(1\) \(2\) \(3\) \(4\) \(5\) \(6\) ou mais \(P(X=x)\) 0,4274 0,3633 0,1544 0,0437 0,0093 0,0016 0,0003 \(FE\) 51,29 43,60 18,53 5,24 1,12 0,19 0,04 -
d) Como as frequências observadas e esperadas estão relativamente próximas, podemos considerar que o modelo Poisson é adequado para modelar a ocorrência da doença na região estudada.
-
-
5.2.5 Distribuição uniforme discreta entre \(21\) e \(30\).
-
a) Como o suporte da variável \(X\), tamanho da amostra, é de \(S_X\) \(=\) \(\{21,\,22,\,\cdots ,30\}\), temos
\(\seteqnumber{0}{5.}{0}\)\begin{align*} P(X=x) =& \dfrac {1}{10}, \textrm { para } x\in S_X, \end{align*} e \(P(X=x)=0\), para outros valores de \(x\).
-
b) Se o custo de cada planta é de R$ 1,50, considerando \(k=10\) \(=\) \(|\Omega |\), e como a média da uniforme é
\(\seteqnumber{0}{5.}{0}\)\begin{align*} E(X)=&\mu _X = \dfrac {1}{k}\sum _{i=1}^k x_i=\dfrac {1}{10}(21+22+\cdots +30)\\ =& 25,5, \end{align*} então o custo médio semanal é de 1,50\(\times \) 25,5 \(=\) 38,25 unidades monetárias. Se denotarmos o custo por \(Y\) e verificarmos que o custo é uma função de \(X\), dada por \(Y\) \(=\) 1,50\(X\), então \(E(Y)\) \(=\) 1,5\(E(X)\). Daí obtivemos o resultado anterior.
-
c) A variância de \(X\) é
\(\seteqnumber{0}{5.}{0}\)\begin{align*} V(X) =& \sigma _X^2=\dfrac {1}{k}\left [ \sum _{i=1}^k x_i^2-\dfrac {\left (\displaystyle \sum _{i=1}^k x_i\right )^2}{k}\right ]\\ =& \dfrac {1}{10}\left (6585-\dfrac {255^2}{10}\right )\\ =& 8,25. \end{align*} Como o custo pode ser interpretado por uma transformação de \(X\), dada por \(Y\) \(=\) 1,54\(X\). Temos que a variância do custo \(Y\) é \(V(Y)\) \(=\) 1,5\(^2V(X)\) \(=\) 18,5625.
-
d) Do teorema de Tchebichev temos
\(\seteqnumber{0}{5.}{0}\)\begin{align*} P(\mu -k\sigma <X_i<\mu +k\sigma ) \ge 1-\dfrac {1}{k^2}, \quad k>1. \end{align*} Como \(X_i\) deve ser substituído pela variável aleatória \(Y\) (custo), então temos:
\(\seteqnumber{0}{5.}{0}\)\begin{align*} P(\mu _Y-k\sigma _Y < Y < \mu _Y+k\sigma _Y) \ge 1-\dfrac {1}{k^2}, \quad k>1. \end{align*} Assim, devemos achar \(k\) tal que \(1-1/k^2\ge \)0,95, que resulta em \(k\ge \) 4,4721. O intervalo almejado é portanto:
\(\seteqnumber{0}{5.}{0}\)\begin{align*} IC_{0,95}(\mu ): & [38,25-4,4721\times \sqrt {18,5625},\,\,38,25+4,4721\times \sqrt {18,5625}]\\ & [18,9823,\,\,\,57,5177]. \end{align*} Assim, ao menos \(95\%\) das semanas terão custos entre 18,98 e 57,52 unidades monetárias.
-
e) A função de distribuição é dada por
\(\seteqnumber{0}{5.}{0}\)\begin{align*} F(x)=&\sum _{x_i\le x}\dfrac {1}{k}, \forall x\in \mathbb {R} x_i\in S_X. \end{align*} Assim, temos
\(x\) 21 22 23 24 25 26 27 28 29 30 \(F(x)\) 0,10 0,20 0,30 0,40 0,50 0,60 0,70 0,80 0,90 1,00
-
-
5.2.6 Como \(X\) é binomial, então \(\mu _X\) \(=\) \(np\) e \(\sigma ^2_X\) \(=\) \(np(1-p)\). Logo:
-
a) Com \(n=30\) e \(p=\)0,1 temos \(\mu _X\) \(=\) \(3\) e \(\sigma ^2_X\) \(=\) 2,70. Assim, para \(k=1\) temos
\(\seteqnumber{0}{5.}{0}\)\begin{align*} P(X<3-\sqrt {2,7})=& P(X<1,36)= P(X=0)+P(X=1)\\ =& \binom {30}{0} \times 0,1^0 \times 0,9^{30} + \binom {30}{1} \times 0,1^1 \times 0,9^{29}\\ =& 0,0424 + 0,1413=0,1837. \end{align*} Para \(k=2\) temos,
\(\seteqnumber{0}{5.}{0}\)\begin{align*} P(X<3-2\times \sqrt {2,7})=& P(X<-0,28)= 0. \end{align*}
-
b) Com \(n=30\) e \(p=\)0,5 temos \(\mu _X\) \(=\) \(15\) e \(\sigma ^2_X\) \(=\) 7,5. Assim, para \(k=1\) temos
\(\seteqnumber{0}{5.}{0}\)\begin{align*} P(X<15-\sqrt {7,5})=& P(X<12,26)= P(X=0)+P(X=1)+\cdots +P(X=12)\\ =& \binom {30}{0} \times 0,5^0 \times 0,5^{30} + \binom {30}{1} \times 0,5^1 \times 0,5^{29}+\cdots + \binom {30}{12}\times 0,5^{12} \times 0,5^{18}\\ =& 0,1808. \end{align*} Para \(k=2\) temos
\(\seteqnumber{0}{5.}{0}\)\begin{align*} P(X<15-2\times \sqrt {7,5})=& P(X<9,52)\\ =& \binom {30}{0} \times 0,5^0 \times 0,5^{30} + \binom {30}{1} \times 0,5^1 \times 0,5^{29}+\cdots + \binom {30}{9}\times 0,5^{9} \times 0,5^{21}\\ =& 0,0214. \end{align*} Para \(k=3\) temos
\(\seteqnumber{0}{5.}{0}\)\begin{align*} P(X<15-3\times \sqrt {7,5})=& P(X<6,78) \\ =& \binom {30}{0} \times 0,5^0 \times 0,5^{30} + \binom {30}{1} \times 0,5^1 \times 0,5^{29}+ \cdots + \binom {30}{6} \times 0,5^{6} \times 0,5^{24}\\ =& 0,0007. \end{align*}
-
c) Com \(n=30\) e \(p=\)0,9 temos \(\mu _X\) \(=\) \(27\) e \(\sigma ^2_X\) \(=\) 2,7. Assim, para \(k=1\) temos
\(\seteqnumber{0}{5.}{0}\)\begin{align*} P(X<27-\sqrt {2,7})=& P(X<25,36)= P(X=0)+P(X=1)+\cdots +P(X=25)\\ =& \binom {30}{0} \times 0,9^0 \times 0,1^{30} + \binom {30}{1} \times 0,9^1 \times 0,1^{29}+ \cdots + \binom {30}{25} \times 0,9^{25} \times 0,1^{5}\\ =& 0,1755. \end{align*} Para \(k=2\) temos
\(\seteqnumber{0}{5.}{0}\)\begin{align*} P(X<27-2\times \sqrt {2,7})=& P(X<23,71)\\ =& \binom {30}{0} \times 0,9^0 \times 0,1^{30} + \binom {30}{1} \times 0,9^1 \times 0,1^{29}+\cdots +\binom {30}{23}\times 0,9^{23}\times 0,1^{7}\\ =& 0,0258. \end{align*}
-
-
5.2.7 Supondo que o modelo binomial é apropriado para modelar este caso e que \(X\) é número de sementes germinadas em um lote de \(n=100\) com \(p=\)0,95 (admitido por hipótese que é o real valor da probabilidade do sucesso), então a probabilidade almejada é: \(P(X>90)\). Logo, sob a hipótese de que \(p=\)0,95, temos
\(\seteqnumber{0}{5.}{0}\)\begin{align*} P(X>90) =& P(X=91)+\cdots +P(X=100)\\ =& \binom {100}{91}\times 0,95^{91}\times 0,05^{9}+\cdots +\binom {100}{100}\times 0,95^{100}\times 0,05^{0}\\ =& 0,9718=97,18\%. \end{align*}
O lote tem uma probabilidade de 97,18% de chance de ser comprado.
A média e a variância são: \(\mu =np\) \(=\) \(95\) e \(\sigma ^2=np(1-p)=\)4,75. Podemos expressar o resultado do teorema de Tchebichev por
\(\seteqnumber{0}{5.}{0}\)\begin{align*} P(X>\mu +k\sigma ) >& 1-\dfrac {1}{k^2}. \end{align*} Logo, temos que \(\mu +k\sigma \) \(=\) \(95+\)4,75\(k\) \(=\) \(90\). Logo, temos que o valor absoluto de \(k\) é 2,29. Assim, temos
\(\seteqnumber{0}{5.}{0}\)\begin{align*} P(X>90) =& 1-\dfrac {1}{2,29^2}=0,8093\\ =& 80,93\%, \end{align*} que é um valor conservador, como esperado pelo resultado do próprio teorema.
-
5.2.8 A função de probabilidade da hipergeométrica neste caso, com \(n_1=30\) e \(n_2=32\), é:
\(\seteqnumber{0}{5.}{0}\)\begin{align*} P(X=x) =& \dfrac {\dbinom {n_1}{x}\dbinom {N-n_1}{n_2-x}}{\dbinom {N}{n_2}}= \dfrac {\dbinom {30}{x}\dbinom {N-30}{30}}{\dbinom {N}{32}}, \end{align*} para \(\max (0, n_2 - N + n_1) \le x\le \min (n_1, n_2)\), equivalendo a que resulta em \(\max (0, 62 - N) \le x\le \min (30, 32)\), que resulta ainda em \(\max (0, 62 - N) \le x\le 30\). No experimento específico, observamos \(x=2\). Logo, o modelo fica
\(\seteqnumber{0}{5.}{0}\)\begin{align*} P(X=2) =& \dfrac {\dbinom {30}{2}\dbinom {N-30}{30}}{\dbinom {N}{32}}. \end{align*} Devemos maximizar esta probabilidade em relação a \(N\). Um caminho é fazer isso com uso de uma planilha, considerando vários valores de \(N\).
Fizemos uma função em \(R\) e observamos graficamente que o máximo se dá quando \(N=479\). O gráfico a seguir mostra este gráfico, destacando o ponto de máximo. O programa \(R\) que usamos é apresentado logo após o gráfico, tendo sido adaptado da internet.
Programa: adaptado de http://www.sci.csueastbay.edu/~btrumbo/Stat3401/Assign3401/A24.pdf
r <- 30 # red balls in urn k <- 32 # balls drawn x <- 2 # red balls drawn cand <- ceiling(r*k/x) - 1 t <- seq(round(.9*cand), round(1.1*cand)) px <- dhyper(x, r, t-r, k) mle <- t[px==max(px)] plot(t, px, type="l",ylab = "P(X=x)") lines(c(mle,mle),c(max(px),min(px)),col=2) mle # MLE as verified by program cand # MLE from theory
A segunda alternativa é direta pelo máximo da função de probabilidade geométrica em relação à \(N\). O valor de \(n_1n_2/x\) \(=\) \(30\times 32/2\) \(=\) \(480\). Assim, o máximo pode ser dado tanto por \(480\) quanto por \(479\). Assim, se calcularmos as probabilidades para estes dois valores, veremos que é maximizado quando \(N=479\). Este programa mesmo possui um erro, pois considera apenas uma possibilidade de máximo com valor inteiro da solução inicial \(n_1n_2/x\). Um exemplo em que ele falha é com \(n_1=28\), \(n_2=32\) e \(x=2\). Neste caso o máximo é \(476\) e a solução do programa é \(475\), objeto cand.
-
5.2.9 Se considerarmos que a distribuição do esporo do fungo ocorre de forma aleatória é razoável adotar o modelo Poisson para calcularmos a probabilidade. Assim, se o número médio por cm\({}^3\) é de 0,05, então em \(100\) cm\({}^3\), teremos uma média de \(5\) esporos. Portanto, se \(X\) refere-se ao número de esporos por \(100\) cm\({}^3\) de solo, então \(X\) \(\sim \) Poi\((\lambda =5)\). As probabilidades solicitadas são:
-
a) \(P(X=0)\) \(=\) \(e^{-5}\times 5^0/0!\) \(=\) \(0,0067\).
-
b) \(P(X\ge 3)\) \(=\) \(1\) \(-\) \((P(X=0)+P(X=1)+P(X=2))\) \(=\) \(1\) \(-\) \((0,0067+0,0337+0,0842)\) \(=\) \(1\) \(-\) \(0,1247\) \(=\) \(0,8753\).
-
-
5.2.10 A distribuição do número de falhas \(X\) (nascimento de machos) até a ocorrência do primeiro sucesso (nascimento de uma fêmea) em um programa de inseminação artificial é a geométrica cuja função de probabilidade é
\(\seteqnumber{0}{5.}{0}\)\begin{align*} P(X=x) =& (1-p)^x p, \end{align*} para \(x=0\), \(1\), \(2\), \(\cdots \), com \(p=\)0,5. O número de inseminações é portanto \(Y\) \(=\) \(X+1\).
-
a) Para garantir pelo menos \(95\%\) de chance de se obter um sucesso são necessários o nascimento de \(x\) macho antes da ocorrência da primeira fêmea, de acordo com a seguinte afirmativa probabilística:
\(\seteqnumber{0}{5.}{0}\)\begin{align*} P(X\le x)=&P(X\le y-1)=\sum _{t=1}^{y}(1-p)^{t-1} p \\ =& \sum _{t=1}^{y} 0,5^{t-1}0,5=\sum _{t=1}^{y} 0,5^t \ge 0,95. \end{align*} A soma da direita refere-se a soma de uma progressão geométrica com razão \(r=1-p=\)0,5 e primeiro termo igual a \(p=\)0,5. Logo, esta soma é igual a
\(\seteqnumber{0}{5.}{0}\)\begin{align*} 2\left (\dfrac {1}{2}-\dfrac {1}{2^{y+1}}\right )=&1-\dfrac {1}{2^{y}}. \end{align*}
Assim,
\(\seteqnumber{0}{5.}{0}\)\begin{align*} 1-\dfrac {1}{2^{y}} \ge & 0,95, \end{align*} cuja solução é
\(\seteqnumber{0}{5.}{0}\)\begin{align*} y \ge & -\dfrac {\ln (0,05)}{\ln (2)}=4,32. \end{align*} Portanto, são necessários ao menos \(5\) inseminações para garantir o primeiro sucesso (nascimento de uma fêmea) com pelo menos \(95\%\) de probabilidade. Se considerarmos esse mesmo problema, mas com um valor geral de \(p\) \(\in \) \((0,\,1)\), a razão da soma é \(r=1-p\) e o primeiro termo é \(p\). Consideremos que o valor de \(95\%\) seja substituído por uma probabilidade mínima \(\gamma \), para tornar geral o problema. Logo,
\(\seteqnumber{0}{5.}{0}\)\begin{align*} P(X\le x)=&P(X\le y-1)=\sum _{t=1}^{y}(1-p)^{t-1} p \ge \gamma . \end{align*} Se denotarmos, ainda, a soma das probabilidades acumuladas até \(y\) por \(S_y\), teremos \(S_y\) \(=\) \(1-(1-p)^y\). Logo, a solução geral é
\(\seteqnumber{0}{5.}{0}\)\begin{align*} y \ge & \dfrac {\ln (1-\gamma )}{\ln (1-p)}. \end{align*}
-
b) Esperar “até” a terceira tentativa para ter o primeiro sucesso significa que a probabilidade desejada implica ter \(2\) fracassos antes de nascer a primeira fêmea na terceira tentativa (inseminação) ou \(1\) fracasso na segunda tentativa ou sucesso na primeira tentativa. Essa probabilidade é dada por
\(\seteqnumber{0}{5.}{0}\)\begin{align*} P(X\le 2) =&\sum _{x=0}^{2} (1-p)^xp\\ =&\left (\dfrac {1}{2}\right )^0\dfrac {1}{2} +\left (\dfrac {1}{2}\right )^1\dfrac {1}{2}+ \left (\dfrac {1}{2}\right )^2\dfrac {1}{2}\\ =&0,5000+0,2500+ 0,1250=87,50\%. \end{align*}
-
-
5.2.11 Este caso refere-se ao mesmo experimento anterior, porém com a espera de mais de um sucesso em repetições dos ensaios Bernoulli (inseminações). Assim, temos que o modelo adequado é a binomial negativa. A função de probabilidade com \(r\) sucessos e probabilidade de sucesso \(p\) da variável \(X\) referente ao número de fracassos até o \(r\)-ésimo sucesso é:
\(\seteqnumber{0}{5.}{0}\)\begin{align*} P(X=x|r) = \dbinom {x+r-1}{x}p^r(1-p)^x, \end{align*} para \(x = 0\), \(1\), \(2\), \(3\), \(\cdots \). Temos ainda que \(p=\)0,5 é a probabilidade de nascer fêmea em uma inseminação.
-
a) Para se ter segundo sucesso no terceira inseminação, indica que tivemos \(1\) fracasso, antes de este último sucesso ocorrer. Logo, a probabilidade desejada
\(\seteqnumber{0}{5.}{0}\)\begin{align*} P(X=1|r=2) =& \dbinom {1+2-1}{1}0,5^2(1-0,5)^1=0,25=25\%. \end{align*}
-
b) Este caso é um pouco mais complexo que o caso da geométrica, pois em nossa soma dos termos das probabilidades acumuladas, não teremos uma progressão geométrica como naquele caso. Assim, a alternativa é computar as probabilidades acumuladas até que o valor mínimo da probabilidade solicitado (no caso \(95\%\)) seja alcançado. Portanto, usando um programa para auxilar temos
\(\seteqnumber{0}{5.}{0}\)\begin{align*} P(\le 0|r=3) =&\dbinom {x+r-1}{x}p^r(1-p)^x\\ =& \dbinom {0+3-1}{0}0,5^3(1-0,5)^0=0,1250, \end{align*} que não garante o mínimo de \(95\%\). Avançamos para o próximo valor de \(x\) e obtivemos
\(\seteqnumber{0}{5.}{0}\)\begin{align*} P(\le 1|r=3) =& \dbinom {0+3-1}{0}0,5^3(1-0,5)^0+ \dbinom {1+3-1}{1}0,5^3(1-0,5)^1\\ =& 0,1250+0,1875=0,3125, \end{align*} que, novamente, não garante o mínimo de \(95\%\). Se prosseguirmos com este método veremos que \(P(X\le 7|r=3)=\)0,9453125 e \(P(X\le 8|r=3)=\)0,9672852. Assim, necessitamos de ao menos \(8\) fracassos antes do terceiro sucesso. Assim, o número total de inseminações necessárias são \(r+x\) \(=\) \(3+8\) \(=\) \(11\) inseminações para garantir com ao menos \(95\%\) de chance que o terceiro sucesso (nascimento da terceira fêmea) ocorra.
-
c) O valor esperado (com \(r=3\)) é
\(\seteqnumber{0}{5.}{0}\)\begin{align*} \mu _X =& \dfrac {r(1-p)}{p} = \dfrac {3\times (1-0,5)}{0,5}=3. \end{align*} Assim precisamos de em média \(3\) fracassos para se ter para se alcançar os três sucessos. Assim, o valor médio de inseminações necessárias é igual a \(6\).
-
-
5.2.12 Este caso, temos a distribuição de uma variável binomial condicionado às condições \(X\ge 1\) e \(X\ge 2\). Logo, para o primeiro caso
\(\seteqnumber{0}{5.}{0}\)\begin{align*} P(X=x|X\ge 1) =& \dfrac {P(\{X=x\}\cap \{X\ge 1\})}{P(X\ge 1)}\\ =& \dfrac {P(X=x)}{1-P(X=0)}, \quad x=1,2,\cdots ,n. \end{align*} Assim, considerando uma binomial com \(n=8\) e \(p=\)0,5, esta função de probabilidade fica
\(\seteqnumber{0}{5.}{0}\)\begin{align*} P(X=x|X\ge 1) =&\dfrac {\binom {8}{x}p^x(1-p(8-x)}{0,9960938}, \quad x=1,2,\cdots ,8. \end{align*} Computamos as probabilidades em cada caso e os resultados são:
\(x\) 1 2 3 4 5 6 7 8 \(p(x)\) 0,0314 0,1098 0,2196 0,2745 0,2196 0,1098 0,0314 0,0039 Podemos verificar que a soma dos valores em relação ao novo conjunto suporte resulta em \(1\).
Para o segundo caso, o procedimento é semelhante:
\(\seteqnumber{0}{5.}{0}\)\begin{align*} P(X=x|X\ge 2) =& \dfrac {P(\{X=x\}\cap \{X\ge 2\})}{P(X\ge 2)}\\ =& \dfrac {P(X=x)}{1-P(X\le 1)}, \quad x=2,3,\cdots ,8. \end{align*} Assim, esta função de probabilidade é
\(\seteqnumber{0}{5.}{0}\)\begin{align*} P(X=x|X\ge 2) =&\dfrac {\binom {8}{x}p^x(1-p(8-x)}{0,9648438}, \quad x=2,3,\cdots ,8. \end{align*} Computamos as probabilidades em cada caso e os resultados são:
\(x\) 2 3 4 5 6 7 8 \(p(x)\) 0,1134 0,2267 0,2834 0,2267 0,1134 0,0324 0,0040 -
5.2.13 A função de probabilidade da distribuição beta binomial com parâmetros \(\alpha \) e \(\beta \) é dado por
\(\seteqnumber{0}{5.}{0}\)\begin{align*} P(X=x) =& \dbinom {n}{x}\dfrac {\Gamma (\alpha +\beta )}{\Gamma (\alpha ) \Gamma (\beta )}\dfrac {\Gamma (x+\alpha )\Gamma (n+ \beta -x)}{\Gamma (n+\alpha +\beta )}, \end{align*} para \(x=0\), \(1\), \(2\), \(\cdots \), \(n\). Se considerarmos \(\alpha \) \(=\) \(\beta \) \(=\) \(1\) temos que \(\Gamma (\alpha +\beta )\) \(=\) \(\Gamma (2)\) \(=\) \(1\), \(\Gamma (\alpha )\) \(=\) \(\Gamma (\beta )\) \(=\) \(1\) e
\(\seteqnumber{0}{5.}{0}\)\begin{align*} \dfrac {\Gamma (x+\alpha )\Gamma (n+ \beta -x)}{\Gamma (n+\alpha +\beta )}=& \dfrac {\Gamma (x+1)\Gamma (n+1-x)}{\Gamma (n+2)}=\dfrac {x!(n-x)!}{(n+1)!}\\ =& \dfrac {x!(n-x)!}{(n+1) n!}=\dfrac {1}{n+1}\dfrac {1}{\binom {n}{x}}. \end{align*} Assim,
\(\seteqnumber{0}{5.}{0}\)\begin{align*} P(X=x) =& \dbinom {n}{x}\dfrac {1}{1}\dfrac {1}{n+1}\dfrac {1}{\binom {n}{x}}\\ =& \dfrac {1}{n+1}, \end{align*} para \(x=0\), \(1\), \(2\), \(\cdots \), \(n\) e representa a função de probabilidade de uma uniforme discreta com \(n+1\) elementos em seu suporte, como queríamos mostrar.
A média e a variância são:
\(\seteqnumber{0}{5.}{0}\)\begin{align*} \mu _{X} =& \dfrac {n\alpha }{\alpha +\beta } & \textrm { e } && \sigma ^2_{X}=& \dfrac {n\alpha \beta (n+\alpha +\beta )}{(\alpha +\beta )^2 (\alpha +\beta +1)}, \end{align*}
\(\seteqnumber{0}{5.}{0}\)\begin{align*} \mu _{X} =& \dfrac {n}{2} & \textrm { e } && \sigma ^2_{X}=& \dfrac {n(n+2)}{12}. \end{align*} A média e a variância de uma variável aleatória \(Y\) com distribuição uniforme discreta com suporte em \(S_Y\) \(=\) \(\{a\), \(a+1\), \(\cdots \), \(b-1\), \(b\}\) são
\(\seteqnumber{0}{5.}{0}\)\begin{align*} \mu _{X} =& \dfrac {a+b}{2} & \textrm { e } && \sigma ^2_{X}=& \dfrac {(b-a+1)^2-1}{12}. \end{align*} Se fizermos \(a=0\) e \(b=n\), teremos exatamente as quantidades anteriormente apresentadas, após algumas simplificações algébricas.
-
5.2.14 Vamos demonstrar a média e a variância da uniforme discreta com suporte \(S_X\) \(=\) \(\{1\), \(2\), \(\cdots \), \(k\}\). A média
\(\seteqnumber{0}{5.}{0}\)\begin{align*} E(X)=&\mu _X = \dfrac {1}{k}\sum _{i=1}^k x_i=\dfrac {1}{k}(1+2\cdots +k)\\ =& \dfrac {k(k+1)/2}{k} \quad \textrm {(soma de uma progressão aritmética)}\\ =& \dfrac {k+1}{2}. \end{align*} A variância é:
\(\seteqnumber{0}{5.}{0}\)\begin{align*} V(X) =& \sigma _X^2=\dfrac {1}{k}\left [\sum _{i=1}^k x_i^2-\dfrac {\left (\displaystyle \sum _{i=1}^k x_i\right )^2}{k}\right ]\\ =& \dfrac {1}{k}\left [\dfrac {k^3}{3}+\dfrac {k^2}{2}+\dfrac {k}{6}- \dfrac {\left (k(k+1)/2\right )^2}{k} \right ]\\ =& \dfrac {1}{k}\left [\dfrac {k^3}{3}+\dfrac {k^2}{2}+\dfrac {k}{6}- \dfrac {k^3}{4}-\dfrac {k^2}{2}-\dfrac {k}{4}\right ]\\ =& \dfrac {k^2}{3}+ \dfrac {k}{2}+\dfrac {1}{6}- \dfrac {k^2}{4}-\dfrac {k}{2}-\dfrac {1}{4}\\ =& \dfrac {k^2-1}{12}, \end{align*} como queríamos mostrar.
A segunda parte vamos considerar que os valores do suporte fornecido são resultantes de uma transformação de variáveis Se \(X\) é a variável original com suporte entre \(1\) e \(k\), então \(Y\) \(=\) \(X-1\), é uma variável aleatória com suporte com valores inteiros entre \(0\) e \(k-1\). Usando a linearidade da esperança, temos
\(\seteqnumber{0}{5.}{0}\)\begin{align*} E(Y) =& E(X-1)=E(X)-1=\dfrac {k+1}{2}-1\\ =& \dfrac {k-1}{2}. \end{align*} Para a variância temos:
\(\seteqnumber{0}{5.}{0}\)\begin{align*} V(Y) =& V(X-1)=V(X)=\dfrac {k^2-1}{12}, \end{align*} pois a variância não se altera quando se subtrai uma constante de uma variável aleatória.