EB

Estatı́stica Básica

\(\newcommand{\footnotename}{footnote}\) \(\def \LWRfootnote {1}\) \(\newcommand {\footnote }[2][\LWRfootnote ]{{}^{\mathrm {#1}}}\) \(\newcommand {\footnotemark }[1][\LWRfootnote ]{{}^{\mathrm {#1}}}\) \(\let \LWRorighspace \hspace \) \(\renewcommand {\hspace }{\ifstar \LWRorighspace \LWRorighspace }\) \(\newcommand {\mathnormal }[1]{{#1}}\) \(\newcommand \ensuremath [1]{#1}\) \(\newcommand {\LWRframebox }[2][]{\fbox {#2}} \newcommand {\framebox }[1][]{\LWRframebox } \) \(\newcommand {\setlength }[2]{}\) \(\newcommand {\addtolength }[2]{}\) \(\newcommand {\setcounter }[2]{}\) \(\newcommand {\addtocounter }[2]{}\) \(\newcommand {\arabic }[1]{}\) \(\newcommand {\number }[1]{}\) \(\newcommand {\noalign }[1]{\text {#1}\notag \\}\) \(\newcommand {\cline }[1]{}\) \(\newcommand {\directlua }[1]{\text {(directlua)}}\) \(\newcommand {\luatexdirectlua }[1]{\text {(directlua)}}\) \(\newcommand {\protect }{}\) \(\def \LWRabsorbnumber #1 {}\) \(\def \LWRabsorbquotenumber "#1 {}\) \(\newcommand {\LWRabsorboption }[1][]{}\) \(\newcommand {\LWRabsorbtwooptions }[1][]{\LWRabsorboption }\) \(\def \mathchar {\ifnextchar "\LWRabsorbquotenumber \LWRabsorbnumber }\) \(\def \mathcode #1={\mathchar }\) \(\let \delcode \mathcode \) \(\let \delimiter \mathchar \) \(\def \oe {\unicode {x0153}}\) \(\def \OE {\unicode {x0152}}\) \(\def \ae {\unicode {x00E6}}\) \(\def \AE {\unicode {x00C6}}\) \(\def \aa {\unicode {x00E5}}\) \(\def \AA {\unicode {x00C5}}\) \(\def \o {\unicode {x00F8}}\) \(\def \O {\unicode {x00D8}}\) \(\def \l {\unicode {x0142}}\) \(\def \L {\unicode {x0141}}\) \(\def \ss {\unicode {x00DF}}\) \(\def \SS {\unicode {x1E9E}}\) \(\def \dag {\unicode {x2020}}\) \(\def \ddag {\unicode {x2021}}\) \(\def \P {\unicode {x00B6}}\) \(\def \copyright {\unicode {x00A9}}\) \(\def \pounds {\unicode {x00A3}}\) \(\let \LWRref \ref \) \(\renewcommand {\ref }{\ifstar \LWRref \LWRref }\) \( \newcommand {\multicolumn }[3]{#3}\) \(\require {textcomp}\) \(\newcommand {\intertext }[1]{\text {#1}\notag \\}\) \(\let \Hat \hat \) \(\let \Check \check \) \(\let \Tilde \tilde \) \(\let \Acute \acute \) \(\let \Grave \grave \) \(\let \Dot \dot \) \(\let \Ddot \ddot \) \(\let \Breve \breve \) \(\let \Bar \bar \) \(\let \Vec \vec \) \(\require {mathtools}\) \(\newenvironment {crampedsubarray}[1]{}{}\) \(\newcommand {\smashoperator }[2][]{#2\limits }\) \(\newcommand {\SwapAboveDisplaySkip }{}\) \(\newcommand {\LaTeXunderbrace }[1]{\underbrace {#1}}\) \(\newcommand {\LaTeXoverbrace }[1]{\overbrace {#1}}\) \(\newcommand {\LWRmultlined }[1][]{\begin {multline*}}\) \(\newenvironment {multlined}[1][]{\LWRmultlined }{\end {multline*}}\) \(\let \LWRorigshoveleft \shoveleft \) \(\renewcommand {\shoveleft }[1][]{\LWRorigshoveleft }\) \(\let \LWRorigshoveright \shoveright \) \(\renewcommand {\shoveright }[1][]{\LWRorigshoveright }\) \(\newcommand {\shortintertext }[1]{\text {#1}\notag \\}\) \(\newcommand {\vcentcolon }{\mathrel {\unicode {x2236}}}\) \(\newcommand {\bm }[1]{\boldsymbol {#1}}\) \(\require {cancel}\) \(\newcommand {\firsthdashline }[1][]{\hdashline }\) \(\let \lasthdashline \firsthdashline \) \(\let \cdashline \cline \) \(\require {colortbl}\) \(\let \LWRorigcolumncolor \columncolor \) \(\renewcommand {\columncolor }[2][named]{\LWRorigcolumncolor [#1]{#2}\LWRabsorbtwooptions }\) \(\let \LWRorigrowcolor \rowcolor \) \(\renewcommand {\rowcolor }[2][named]{\LWRorigrowcolor [#1]{#2}\LWRabsorbtwooptions }\) \(\let \LWRorigcellcolor \cellcolor \) \(\renewcommand {\cellcolor }[2][named]{\LWRorigcellcolor [#1]{#2}\LWRabsorbtwooptions }\) \(\newcommand {\tcbset }[1]{}\) \(\newcommand {\tcbsetforeverylayer }[1]{}\) \(\newcommand {\tcbox }[2][]{\boxed {\text {#2}}}\) \(\newcommand {\tcboxfit }[2][]{\boxed {#2}}\) \(\newcommand {\tcblower }{}\) \(\newcommand {\tcbline }{}\) \(\newcommand {\tcbtitle }{}\) \(\newcommand {\tcbsubtitle [2][]{\mathrm {#2}}}\) \(\newcommand {\tcboxmath }[2][]{\boxed {#2}}\) \(\newcommand {\tcbhighmath }[2][]{\boxed {#2}}\)

5.2 Resolução

  • 5.2.1 O dendrograma (diagrama de árvore) é:

    (-tikz- diagram)
    (-tikz- diagram)

    O espaço amostral é obtido considerando todos os ramos desse diagrama de árvore e resulta em:

    \begin{align*} \Omega =&\left \{(FFF),\,(FFM),\,(FMF),\,(FMM),\,(MFF),\,(MFM),\,(MMF),\,(MMM)\right \} \end{align*}

    Cada ponto deste é equiprovável, pois as probabilidades de nascimento de fêmea e macho são iguais e cada elemento de \(\Omega \) tem probabilidade \((1/2)^3=1/8\).

    • a) A distribuição de probabilidade da variável aleatória \(X\), definida como sendo o número de fêmeas, é:

      .
      \(x\) \(0\) \(1\) \(2\) \(3\)
      \(P(X=x)\) \(\dfrac {1}{8}\) \(\dfrac {3}{8}\) \(\dfrac {3}{8}\) \(\dfrac {1}{8}\)

      Por exemplo, a probabilidade \(P(X=1)\) é obtida pelo número total de pontos de \(\Omega \) em que \(X=1\), que no caso é igual a \(3\), em relação ao número total de pontos, que é igual a \(8\).

    • b) Os resultados para os eventos solicitados são:

      • i) \(P(X=2)=\dfrac {3}{8}=\)0,3750=37,50%;

      • ii) Se \(Y\) representa o número de machos, o evento \(Y\ge 1\) equivale a \(X\le 2\), pois se houver \(1\) macho na ninhada, isto implica em duas fêmeas; se houver \(2\) machos, implica em \(1\) fêmea; e se houver \(3\) machos, implica em \(0\) fêmea. Assim, a probabilidade do evento é:

        \(P(Y\ge 1)=P(X\le 2)=P(X=2)+P(X=1)+P(X=0)=\dfrac {3}{8}+\dfrac {3}{8}+\dfrac {1}{8}\) \(=\dfrac {7}{8}=\)0,8750=87,50%;

      • iii) \(P(X\ge 2)=P(X=2)+P(X=3)=\dfrac {3}{8}+\dfrac {1}{8}=\) \(\dfrac {1}{2}=\)0,50=50%;

      • iv) \(P(X\le 1)=P(X=1)+P(X=0)=\dfrac {3}{8}+\dfrac {1}{8}=\) \(\dfrac {1}{2}=\)0,50=50%.

    • c) O número esperado \(NE\) de ninhadas de \(3\) filhotes com exatamente \(1\) fêmea é dado pelo produto da probabilidade do evento \(P(X=1)\) pelo número total de ninhadas, ou seja, é \(NE=(3/8)\times 500 \approx 188\) ninhadas. Assim, das \(500\) esperamos que \(188\) tenham exatamente \(1\) fêmea.

  • 5.2.2 Neste caso assumimos que \(X\), definida como o número de fêmeas, possui distribuição binomial com parâmetros \(n=4\) e \(p=5/8\). A probabilidade de sucesso não é \(1/2\), de acordo com as leis de Mendel, pois há um distúrbio genético na raça. Usualmente usamos a seguinte notação para dizer a mesma coisa que acabamos de explicar: \(X \sim \textrm { Binomial}(n=4,p=5/8)\).

    • a) Para obtermos a distribuição de probabilidade de \(X\), podemos utilizar o modelo binomial dado por:

      \begin{align*} P(X=x)=&\binom {n}{x} p^x(1-p)^{n-x} \end{align*} para \(x=0\), \(1\), \(\ldots \), \(4\).

      Por exemplo, para a probabilidade \(P(X=0)\) temos:

      \begin{align*} P(X=x)=&\binom {4}{0} \left (\dfrac {5}{8}\right )^0\left (1-\dfrac {5}{8}\right )^{4-0}=1\times 1\times \left (\dfrac {3}{8}\right )^4=0,0198. \end{align*}

      Assim, temos a seguinte distribuição de probabilidades:

      .
      \(x\) \(0\) \(1\) \(2\) \(3\) \(4\)
      \(P(X=x)\) 0,0198 0,1318 0,3296 0,3662 0,1526
    • b) A média é: \(\mu _X= np = 4\times 5/8=\)2,5; e a variância é: \(\sigma ^2_X=np(1-p)=4\times (5/8)\times (3/8)=\)0,9375.

    • c) O número esperado \(NE\) de ninhadas é dado pelo produto da probabilidade do evento de interesse \(P(X=x)\) pelo número total de ninhadas. Por exemplo, para \(X=0\), temos \(P(X=0)\times 1.000=\)0,0198\(\times 1.000=\)19,8\(\approx \)20 ninhadas com nenhuma fêmea. Os demais valores (arredondados) estão apresentados na tabela a seguir:

      .
      \(x\) \(0\) \(1\) \(2\) \(3\) \(4\)
      \(P(X=x)\) 0,0198 0,1318 0,3296 0,3662 0,1526
      \(NE\) 20 132 330 366 153
  • 5.2.3 Resposta para cada uma das questões:

    • a) O modelo probabilístico adequado é o modelo Poisson, principalmente se pudermos supor que a distribuição das bactérias pela lâmina seja aleatória. Assim, \(X \sim \) Poisson\((\lambda =4)\).

    • b) NE\(=P(X\le 1)\times 600\). Para obtermos a probabilidade do evento de interesse devemos usar o modelo Poisson dado por:

      \begin{align*} P(X=x)=& \dfrac {e^{-\lambda }\lambda ^x}{x!}, \end{align*} para \(x=0\), \(1\), \(2\), \(\ldots \) e \(\lambda =4\).

      Assim, \(P(X\le 1)=P(X=1)+P(X=0)\), sendo

      \begin{align*} P(X=0)=& \dfrac {e^{-4}\times 4^0}{0!}= 0,0183 &\textrm { e }&& P(X=1)=& \dfrac {e^{-4}\times 4^1}{1!}= 0,0733. \end{align*}

      Portanto,

      \begin{align*} P(X\le 1)=& P(X=0)+ P(X=1)=0,0183+0,0733=0,0916=9,16\% \end{align*} e o número esperado de quadrados com no máximo \(1\) bactéria é NE\(=P(X\le 1)\times 600=\) 0,0916\(\times 600\approx 55\).

    • c) \(P(X>2)=P(X=3)+P(X=4)+\ldots \). Como esta soma possui um número infinito de termos e sabendo que a soma de todos as probabilidades é igual a \(1\), então

      \begin{align*} P(X>2)=& 1-\left [P(X=0)+P(X=1)+P(X=2)\right ]=1-\left (0,0183+0,0733+\dfrac {e^{-4}\times 4^2}{2!}\right )\\ =& 1-(0,0183+0,0733+0,1465)= 1-0,2381=0,7619=76,19\%. \end{align*}

    • d) \(P(X=0)=\)1,83%.

  • 5.2.4 A ocorrência de doenças por ano pode ser modelada, se for aleatória, pelo modelo Poisson. Assim, \(X\sim \) Poisson\((\hat {\lambda =\bar {X}}\).

    • a) A média é

      \begin{align*} \bar {X}=& \dfrac {0\times 55+1\times 44+ \cdots + 5\times 1}{120}=\dfrac {102}{120}=0,85\textrm { doenças/ano}. \end{align*}

    • b) O parâmetro \(\lambda \) pode ser estimado por \(\hat {\lambda }=\bar {X}=\)0,85. Assim, podemos estimar a distribuição de probabilidade utilizando o modelo Poisson por:

      \begin{align*} P(X=x)=& \dfrac {e^{-0,85}\times 0,85^x}{x!}. \end{align*}

      Para \(X=0\) e \(X=1\), para fins de ilustração, temos:

      \begin{align*} P(X=0)=& \dfrac {e^{-0,85}\times 0,85^0}{0!}=0,4274 &&& P(X=1)=& \dfrac {e^{-0,85}\times 0,85^1}{1!}=0,3633. \end{align*}

      Estas e as demais probabilidades são apresentadas na tabela seguinte:

      .
      \(x\) \(0\) \(1\) \(2\) \(3\) \(4\) \(5\) \(6\) ou mais
      \(P(X=x)\) 0,4274 0,3633 0,1544 0,0437 0,0093 0,0016 0,0003
    • c) A frequência esperada é dada pelo produtos das probabilidades por 120. Logo,

      .
      \(x\) \(0\) \(1\) \(2\) \(3\) \(4\) \(5\) \(6\) ou mais
      \(P(X=x)\) 0,4274 0,3633 0,1544 0,0437 0,0093 0,0016 0,0003
      \(FE\) 51,29 43,60 18,53 5,24 1,12 0,19 0,04
    • d) Como as frequências observadas e esperadas estão relativamente próximas, podemos considerar que o modelo Poisson é adequado para modelar a ocorrência da doença na região estudada.

  • 5.2.5 Distribuição uniforme discreta entre \(21\) e \(30\).

    • a) Como o suporte da variável \(X\), tamanho da amostra, é de \(S_X\) \(=\) \(\{21,\,22,\,\cdots ,30\}\), temos

      \begin{align*} P(X=x) =& \dfrac {1}{10}, \textrm { para } x\in S_X, \end{align*} e \(P(X=x)=0\), para outros valores de \(x\).

    • b) Se o custo de cada planta é de R$ 1,50, considerando \(k=10\) \(=\) \(|\Omega |\), e como a média da uniforme é

      \begin{align*} E(X)=&\mu _X = \dfrac {1}{k}\sum _{i=1}^k x_i=\dfrac {1}{10}(21+22+\cdots +30)\\ =& 25,5, \end{align*} então o custo médio semanal é de 1,50\(\times \) 25,5 \(=\) 38,25 unidades monetárias. Se denotarmos o custo por \(Y\) e verificarmos que o custo é uma função de \(X\), dada por \(Y\) \(=\) 1,50\(X\), então \(E(Y)\) \(=\) 1,5\(E(X)\). Daí obtivemos o resultado anterior.

    • c) A variância de \(X\) é

      \begin{align*} V(X) =& \sigma _X^2=\dfrac {1}{k}\left [ \sum _{i=1}^k x_i^2-\dfrac {\left (\displaystyle \sum _{i=1}^k x_i\right )^2}{k}\right ]\\ =& \dfrac {1}{10}\left (6585-\dfrac {255^2}{10}\right )\\ =& 8,25. \end{align*} Como o custo pode ser interpretado por uma transformação de \(X\), dada por \(Y\) \(=\) 1,54\(X\). Temos que a variância do custo \(Y\) é \(V(Y)\) \(=\) 1,5\(^2V(X)\) \(=\) 18,5625.

    • d) Do teorema de Tchebichev temos

      \begin{align*} P(\mu -k\sigma <X_i<\mu +k\sigma ) \ge 1-\dfrac {1}{k^2}, \quad k>1. \end{align*} Como \(X_i\) deve ser substituído pela variável aleatória \(Y\) (custo), então temos:

      \begin{align*} P(\mu _Y-k\sigma _Y < Y < \mu _Y+k\sigma _Y) \ge 1-\dfrac {1}{k^2}, \quad k>1. \end{align*} Assim, devemos achar \(k\) tal que \(1-1/k^2\ge \)0,95, que resulta em \(k\ge \) 4,4721. O intervalo almejado é portanto:

      \begin{align*} IC_{0,95}(\mu ): & [38,25-4,4721\times \sqrt {18,5625},\,\,38,25+4,4721\times \sqrt {18,5625}]\\ & [18,9823,\,\,\,57,5177]. \end{align*} Assim, ao menos \(95\%\) das semanas terão custos entre 18,98 e 57,52 unidades monetárias.

    • e) A função de distribuição é dada por

      \begin{align*} F(x)=&\sum _{x_i\le x}\dfrac {1}{k}, \forall x\in \mathbb {R} x_i\in S_X. \end{align*} Assim, temos

      .
      \(x\) 21 22 23 24 25 26 27 28 29 30
      \(F(x)\) 0,10 0,20 0,30 0,40 0,50 0,60 0,70 0,80 0,90 1,00
  • 5.2.6 Como \(X\) é binomial, então \(\mu _X\) \(=\) \(np\) e \(\sigma ^2_X\) \(=\) \(np(1-p)\). Logo:

    • a) Com \(n=30\) e \(p=\)0,1 temos \(\mu _X\) \(=\) \(3\) e \(\sigma ^2_X\) \(=\) 2,70. Assim, para \(k=1\) temos

      \begin{align*} P(X<3-\sqrt {2,7})=& P(X<1,36)= P(X=0)+P(X=1)\\ =& \binom {30}{0} \times 0,1^0 \times 0,9^{30} + \binom {30}{1} \times 0,1^1 \times 0,9^{29}\\ =& 0,0424 + 0,1413=0,1837. \end{align*} Para \(k=2\) temos,

      \begin{align*} P(X<3-2\times \sqrt {2,7})=& P(X<-0,28)= 0. \end{align*}

    • b) Com \(n=30\) e \(p=\)0,5 temos \(\mu _X\) \(=\) \(15\) e \(\sigma ^2_X\) \(=\) 7,5. Assim, para \(k=1\) temos

      \begin{align*} P(X<15-\sqrt {7,5})=& P(X<12,26)= P(X=0)+P(X=1)+\cdots +P(X=12)\\ =& \binom {30}{0} \times 0,5^0 \times 0,5^{30} + \binom {30}{1} \times 0,5^1 \times 0,5^{29}+\cdots + \binom {30}{12}\times 0,5^{12} \times 0,5^{18}\\ =& 0,1808. \end{align*} Para \(k=2\) temos

      \begin{align*} P(X<15-2\times \sqrt {7,5})=& P(X<9,52)\\ =& \binom {30}{0} \times 0,5^0 \times 0,5^{30} + \binom {30}{1} \times 0,5^1 \times 0,5^{29}+\cdots + \binom {30}{9}\times 0,5^{9} \times 0,5^{21}\\ =& 0,0214. \end{align*} Para \(k=3\) temos

      \begin{align*} P(X<15-3\times \sqrt {7,5})=& P(X<6,78) \\ =& \binom {30}{0} \times 0,5^0 \times 0,5^{30} + \binom {30}{1} \times 0,5^1 \times 0,5^{29}+ \cdots + \binom {30}{6} \times 0,5^{6} \times 0,5^{24}\\ =& 0,0007. \end{align*}

    • c) Com \(n=30\) e \(p=\)0,9 temos \(\mu _X\) \(=\) \(27\) e \(\sigma ^2_X\) \(=\) 2,7. Assim, para \(k=1\) temos

      \begin{align*} P(X<27-\sqrt {2,7})=& P(X<25,36)= P(X=0)+P(X=1)+\cdots +P(X=25)\\ =& \binom {30}{0} \times 0,9^0 \times 0,1^{30} + \binom {30}{1} \times 0,9^1 \times 0,1^{29}+ \cdots + \binom {30}{25} \times 0,9^{25} \times 0,1^{5}\\ =& 0,1755. \end{align*} Para \(k=2\) temos

      \begin{align*} P(X<27-2\times \sqrt {2,7})=& P(X<23,71)\\ =& \binom {30}{0} \times 0,9^0 \times 0,1^{30} + \binom {30}{1} \times 0,9^1 \times 0,1^{29}+\cdots +\binom {30}{23}\times 0,9^{23}\times 0,1^{7}\\ =& 0,0258. \end{align*}

  • 5.2.7 Supondo que o modelo binomial é apropriado para modelar este caso e que \(X\) é número de sementes germinadas em um lote de \(n=100\) com \(p=\)0,95 (admitido por hipótese que é o real valor da probabilidade do sucesso), então a probabilidade almejada é: \(P(X>90)\). Logo, sob a hipótese de que \(p=\)0,95, temos

    \begin{align*} P(X>90) =& P(X=91)+\cdots +P(X=100)\\ =& \binom {100}{91}\times 0,95^{91}\times 0,05^{9}+\cdots +\binom {100}{100}\times 0,95^{100}\times 0,05^{0}\\ =& 0,9718=97,18\%. \end{align*}

    O lote tem uma probabilidade de 97,18% de chance de ser comprado.

    A média e a variância são: \(\mu =np\) \(=\) \(95\) e \(\sigma ^2=np(1-p)=\)4,75. Podemos expressar o resultado do teorema de Tchebichev por

    \begin{align*} P(X>\mu +k\sigma ) >& 1-\dfrac {1}{k^2}. \end{align*} Logo, temos que \(\mu +k\sigma \) \(=\) \(95+\)4,75\(k\) \(=\) \(90\). Logo, temos que o valor absoluto de \(k\) é 2,29. Assim, temos

    \begin{align*} P(X>90) =& 1-\dfrac {1}{2,29^2}=0,8093\\ =& 80,93\%, \end{align*} que é um valor conservador, como esperado pelo resultado do próprio teorema.

  • 5.2.8 A função de probabilidade da hipergeométrica neste caso, com \(n_1=30\) e \(n_2=32\), é:

    \begin{align*} P(X=x) =& \dfrac {\dbinom {n_1}{x}\dbinom {N-n_1}{n_2-x}}{\dbinom {N}{n_2}}= \dfrac {\dbinom {30}{x}\dbinom {N-30}{30}}{\dbinom {N}{32}}, \end{align*} para \(\max (0, n_2 - N + n_1) \le x\le \min (n_1, n_2)\), equivalendo a que resulta em \(\max (0, 62 - N) \le x\le \min (30, 32)\), que resulta ainda em \(\max (0, 62 - N) \le x\le 30\). No experimento específico, observamos \(x=2\). Logo, o modelo fica

    \begin{align*} P(X=2) =& \dfrac {\dbinom {30}{2}\dbinom {N-30}{30}}{\dbinom {N}{32}}. \end{align*} Devemos maximizar esta probabilidade em relação a \(N\). Um caminho é fazer isso com uso de uma planilha, considerando vários valores de \(N\).

    Fizemos uma função em \(R\) e observamos graficamente que o máximo se dá quando \(N=479\). O gráfico a seguir mostra este gráfico, destacando o ponto de máximo. O programa \(R\) que usamos é apresentado logo após o gráfico, tendo sido adaptado da internet.

    (image)

    Programa: adaptado de http://www.sci.csueastbay.edu/~btrumbo/Stat3401/Assign3401/A24.pdf

    r <- 30 # red balls in urn
    k <- 32 # balls drawn
    x <- 2    # red balls drawn
    cand <- ceiling(r*k/x) - 1
    t <- seq(round(.9*cand), round(1.1*cand))
    px <- dhyper(x, r, t-r, k)
    mle <- t[px==max(px)]
    plot(t, px, type="l",ylab = "P(X=x)")
    lines(c(mle,mle),c(max(px),min(px)),col=2)
    mle    # MLE as verified by program
    cand # MLE from theory
    

    A segunda alternativa é direta pelo máximo da função de probabilidade geométrica em relação à \(N\). O valor de \(n_1n_2/x\) \(=\) \(30\times 32/2\) \(=\) \(480\). Assim, o máximo pode ser dado tanto por \(480\) quanto por \(479\). Assim, se calcularmos as probabilidades para estes dois valores, veremos que é maximizado quando \(N=479\). Este programa mesmo possui um erro, pois considera apenas uma possibilidade de máximo com valor inteiro da solução inicial \(n_1n_2/x\). Um exemplo em que ele falha é com \(n_1=28\), \(n_2=32\) e \(x=2\). Neste caso o máximo é \(476\) e a solução do programa é \(475\), objeto cand.

  • 5.2.9 Se considerarmos que a distribuição do esporo do fungo ocorre de forma aleatória é razoável adotar o modelo Poisson para calcularmos a probabilidade. Assim, se o número médio por cm\({}^3\) é de 0,05, então em \(100\) cm\({}^3\), teremos uma média de \(5\) esporos. Portanto, se \(X\) refere-se ao número de esporos por \(100\) cm\({}^3\) de solo, então \(X\) \(\sim \) Poi\((\lambda =5)\). As probabilidades solicitadas são:

    • a) \(P(X=0)\) \(=\) \(e^{-5}\times 5^0/0!\) \(=\) \(0,0067\).

    • b) \(P(X\ge 3)\) \(=\) \(1\) \(-\) \((P(X=0)+P(X=1)+P(X=2))\) \(=\) \(1\) \(-\) \((0,0067+0,0337+0,0842)\) \(=\) \(1\) \(-\) \(0,1247\) \(=\) \(0,8753\).

  • 5.2.10 A distribuição do número de falhas \(X\) (nascimento de machos) até a ocorrência do primeiro sucesso (nascimento de uma fêmea) em um programa de inseminação artificial é a geométrica cuja função de probabilidade é

    \begin{align*} P(X=x) =& (1-p)^x p, \end{align*} para \(x=0\), \(1\), \(2\), \(\cdots \), com \(p=\)0,5. O número de inseminações é portanto \(Y\) \(=\) \(X+1\).

    • a) Para garantir pelo menos \(95\%\) de chance de se obter um sucesso são necessários o nascimento de \(x\) macho antes da ocorrência da primeira fêmea, de acordo com a seguinte afirmativa probabilística:

      \begin{align*} P(X\le x)=&P(X\le y-1)=\sum _{t=1}^{y}(1-p)^{t-1} p \\ =& \sum _{t=1}^{y} 0,5^{t-1}0,5=\sum _{t=1}^{y} 0,5^t \ge 0,95. \end{align*} A soma da direita refere-se a soma de uma progressão geométrica com razão \(r=1-p=\)0,5 e primeiro termo igual a \(p=\)0,5. Logo, esta soma é igual a

      \begin{align*} 2\left (\dfrac {1}{2}-\dfrac {1}{2^{y+1}}\right )=&1-\dfrac {1}{2^{y}}. \end{align*}

      Assim,

      \begin{align*} 1-\dfrac {1}{2^{y}} \ge & 0,95, \end{align*} cuja solução é

      \begin{align*} y \ge & -\dfrac {\ln (0,05)}{\ln (2)}=4,32. \end{align*} Portanto, são necessários ao menos \(5\) inseminações para garantir o primeiro sucesso (nascimento de uma fêmea) com pelo menos \(95\%\) de probabilidade. Se considerarmos esse mesmo problema, mas com um valor geral de \(p\) \(\in \) \((0,\,1)\), a razão da soma é \(r=1-p\) e o primeiro termo é \(p\). Consideremos que o valor de \(95\%\) seja substituído por uma probabilidade mínima \(\gamma \), para tornar geral o problema. Logo,

      \begin{align*} P(X\le x)=&P(X\le y-1)=\sum _{t=1}^{y}(1-p)^{t-1} p \ge \gamma . \end{align*} Se denotarmos, ainda, a soma das probabilidades acumuladas até \(y\) por \(S_y\), teremos \(S_y\) \(=\) \(1-(1-p)^y\). Logo, a solução geral é

      \begin{align*} y \ge & \dfrac {\ln (1-\gamma )}{\ln (1-p)}. \end{align*}

    • b) Esperar “até” a terceira tentativa para ter o primeiro sucesso significa que a probabilidade desejada implica ter \(2\) fracassos antes de nascer a primeira fêmea na terceira tentativa (inseminação) ou \(1\) fracasso na segunda tentativa ou sucesso na primeira tentativa. Essa probabilidade é dada por

      \begin{align*} P(X\le 2) =&\sum _{x=0}^{2} (1-p)^xp\\ =&\left (\dfrac {1}{2}\right )^0\dfrac {1}{2} +\left (\dfrac {1}{2}\right )^1\dfrac {1}{2}+ \left (\dfrac {1}{2}\right )^2\dfrac {1}{2}\\ =&0,5000+0,2500+ 0,1250=87,50\%. \end{align*}

  • 5.2.11 Este caso refere-se ao mesmo experimento anterior, porém com a espera de mais de um sucesso em repetições dos ensaios Bernoulli (inseminações). Assim, temos que o modelo adequado é a binomial negativa. A função de probabilidade com \(r\) sucessos e probabilidade de sucesso \(p\) da variável \(X\) referente ao número de fracassos até o \(r\)-ésimo sucesso é:

    \begin{align*} P(X=x|r) = \dbinom {x+r-1}{x}p^r(1-p)^x, \end{align*} para \(x = 0\), \(1\), \(2\), \(3\), \(\cdots \). Temos ainda que \(p=\)0,5 é a probabilidade de nascer fêmea em uma inseminação.

    • a) Para se ter segundo sucesso no terceira inseminação, indica que tivemos \(1\) fracasso, antes de este último sucesso ocorrer. Logo, a probabilidade desejada

      \begin{align*} P(X=1|r=2) =& \dbinom {1+2-1}{1}0,5^2(1-0,5)^1=0,25=25\%. \end{align*}

    • b) Este caso é um pouco mais complexo que o caso da geométrica, pois em nossa soma dos termos das probabilidades acumuladas, não teremos uma progressão geométrica como naquele caso. Assim, a alternativa é computar as probabilidades acumuladas até que o valor mínimo da probabilidade solicitado (no caso \(95\%\)) seja alcançado. Portanto, usando um programa para auxilar temos

      \begin{align*} P(\le 0|r=3) =&\dbinom {x+r-1}{x}p^r(1-p)^x\\ =& \dbinom {0+3-1}{0}0,5^3(1-0,5)^0=0,1250, \end{align*} que não garante o mínimo de \(95\%\). Avançamos para o próximo valor de \(x\) e obtivemos

      \begin{align*} P(\le 1|r=3) =& \dbinom {0+3-1}{0}0,5^3(1-0,5)^0+ \dbinom {1+3-1}{1}0,5^3(1-0,5)^1\\ =& 0,1250+0,1875=0,3125, \end{align*} que, novamente, não garante o mínimo de \(95\%\). Se prosseguirmos com este método veremos que \(P(X\le 7|r=3)=\)0,9453125 e \(P(X\le 8|r=3)=\)0,9672852. Assim, necessitamos de ao menos \(8\) fracassos antes do terceiro sucesso. Assim, o número total de inseminações necessárias são \(r+x\) \(=\) \(3+8\) \(=\) \(11\) inseminações para garantir com ao menos \(95\%\) de chance que o terceiro sucesso (nascimento da terceira fêmea) ocorra.

    • c) O valor esperado (com \(r=3\)) é

      \begin{align*} \mu _X =& \dfrac {r(1-p)}{p} = \dfrac {3\times (1-0,5)}{0,5}=3. \end{align*} Assim precisamos de em média \(3\) fracassos para se ter para se alcançar os três sucessos. Assim, o valor médio de inseminações necessárias é igual a \(6\).

  • 5.2.12 Este caso, temos a distribuição de uma variável binomial condicionado às condições \(X\ge 1\) e \(X\ge 2\). Logo, para o primeiro caso

    \begin{align*} P(X=x|X\ge 1) =& \dfrac {P(\{X=x\}\cap \{X\ge 1\})}{P(X\ge 1)}\\ =& \dfrac {P(X=x)}{1-P(X=0)}, \quad x=1,2,\cdots ,n. \end{align*} Assim, considerando uma binomial com \(n=8\) e \(p=\)0,5, esta função de probabilidade fica

    \begin{align*} P(X=x|X\ge 1) =&\dfrac {\binom {8}{x}p^x(1-p(8-x)}{0,9960938}, \quad x=1,2,\cdots ,8. \end{align*} Computamos as probabilidades em cada caso e os resultados são:

    .
    \(x\) 1 2 3 4 5 6 7 8
    \(p(x)\) 0,0314 0,1098 0,2196 0,2745 0,2196 0,1098 0,0314 0,0039

    Podemos verificar que a soma dos valores em relação ao novo conjunto suporte resulta em \(1\).

    Para o segundo caso, o procedimento é semelhante:

    \begin{align*} P(X=x|X\ge 2) =& \dfrac {P(\{X=x\}\cap \{X\ge 2\})}{P(X\ge 2)}\\ =& \dfrac {P(X=x)}{1-P(X\le 1)}, \quad x=2,3,\cdots ,8. \end{align*} Assim, esta função de probabilidade é

    \begin{align*} P(X=x|X\ge 2) =&\dfrac {\binom {8}{x}p^x(1-p(8-x)}{0,9648438}, \quad x=2,3,\cdots ,8. \end{align*} Computamos as probabilidades em cada caso e os resultados são:

    .
    \(x\) 2 3 4 5 6 7 8
    \(p(x)\) 0,1134 0,2267 0,2834 0,2267 0,1134 0,0324 0,0040
  • 5.2.13 A função de probabilidade da distribuição beta binomial com parâmetros \(\alpha \) e \(\beta \) é dado por

    \begin{align*} P(X=x) =& \dbinom {n}{x}\dfrac {\Gamma (\alpha +\beta )}{\Gamma (\alpha ) \Gamma (\beta )}\dfrac {\Gamma (x+\alpha )\Gamma (n+ \beta -x)}{\Gamma (n+\alpha +\beta )}, \end{align*} para \(x=0\), \(1\), \(2\), \(\cdots \), \(n\). Se considerarmos \(\alpha \) \(=\) \(\beta \) \(=\) \(1\) temos que \(\Gamma (\alpha +\beta )\) \(=\) \(\Gamma (2)\) \(=\) \(1\), \(\Gamma (\alpha )\) \(=\) \(\Gamma (\beta )\) \(=\) \(1\) e

    \begin{align*} \dfrac {\Gamma (x+\alpha )\Gamma (n+ \beta -x)}{\Gamma (n+\alpha +\beta )}=& \dfrac {\Gamma (x+1)\Gamma (n+1-x)}{\Gamma (n+2)}=\dfrac {x!(n-x)!}{(n+1)!}\\ =& \dfrac {x!(n-x)!}{(n+1) n!}=\dfrac {1}{n+1}\dfrac {1}{\binom {n}{x}}. \end{align*} Assim,

    \begin{align*} P(X=x) =& \dbinom {n}{x}\dfrac {1}{1}\dfrac {1}{n+1}\dfrac {1}{\binom {n}{x}}\\ =& \dfrac {1}{n+1}, \end{align*} para \(x=0\), \(1\), \(2\), \(\cdots \), \(n\) e representa a função de probabilidade de uma uniforme discreta com \(n+1\) elementos em seu suporte, como queríamos mostrar.

    A média e a variância são:

    \begin{align*} \mu _{X} =& \dfrac {n\alpha }{\alpha +\beta } & \textrm { e } && \sigma ^2_{X}=& \dfrac {n\alpha \beta (n+\alpha +\beta )}{(\alpha +\beta )^2 (\alpha +\beta +1)}, \end{align*}

    \begin{align*} \mu _{X} =& \dfrac {n}{2} & \textrm { e } && \sigma ^2_{X}=& \dfrac {n(n+2)}{12}. \end{align*} A média e a variância de uma variável aleatória \(Y\) com distribuição uniforme discreta com suporte em \(S_Y\) \(=\) \(\{a\), \(a+1\), \(\cdots \), \(b-1\), \(b\}\) são

    \begin{align*} \mu _{X} =& \dfrac {a+b}{2} & \textrm { e } && \sigma ^2_{X}=& \dfrac {(b-a+1)^2-1}{12}. \end{align*} Se fizermos \(a=0\) e \(b=n\), teremos exatamente as quantidades anteriormente apresentadas, após algumas simplificações algébricas.

  • 5.2.14 Vamos demonstrar a média e a variância da uniforme discreta com suporte \(S_X\) \(=\) \(\{1\), \(2\), \(\cdots \), \(k\}\). A média

    \begin{align*} E(X)=&\mu _X = \dfrac {1}{k}\sum _{i=1}^k x_i=\dfrac {1}{k}(1+2\cdots +k)\\ =& \dfrac {k(k+1)/2}{k} \quad \textrm {(soma de uma progressão aritmética)}\\ =& \dfrac {k+1}{2}. \end{align*} A variância é:

    \begin{align*} V(X) =& \sigma _X^2=\dfrac {1}{k}\left [\sum _{i=1}^k x_i^2-\dfrac {\left (\displaystyle \sum _{i=1}^k x_i\right )^2}{k}\right ]\\ =& \dfrac {1}{k}\left [\dfrac {k^3}{3}+\dfrac {k^2}{2}+\dfrac {k}{6}- \dfrac {\left (k(k+1)/2\right )^2}{k} \right ]\\ =& \dfrac {1}{k}\left [\dfrac {k^3}{3}+\dfrac {k^2}{2}+\dfrac {k}{6}- \dfrac {k^3}{4}-\dfrac {k^2}{2}-\dfrac {k}{4}\right ]\\ =& \dfrac {k^2}{3}+ \dfrac {k}{2}+\dfrac {1}{6}- \dfrac {k^2}{4}-\dfrac {k}{2}-\dfrac {1}{4}\\ =& \dfrac {k^2-1}{12}, \end{align*} como queríamos mostrar.

    A segunda parte vamos considerar que os valores do suporte fornecido são resultantes de uma transformação de variáveis Se \(X\) é a variável original com suporte entre \(1\) e \(k\), então \(Y\) \(=\) \(X-1\), é uma variável aleatória com suporte com valores inteiros entre \(0\) e \(k-1\). Usando a linearidade da esperança, temos

    \begin{align*} E(Y) =& E(X-1)=E(X)-1=\dfrac {k+1}{2}-1\\ =& \dfrac {k-1}{2}. \end{align*} Para a variância temos:

    \begin{align*} V(Y) =& V(X-1)=V(X)=\dfrac {k^2-1}{12}, \end{align*} pois a variância não se altera quando se subtrai uma constante de uma variável aleatória.