Estatı́stica Básica
6.2 Resolução
-
6.2.1 A distribuição subjacente do ponto de fusão \(X\) é a uniforme contínua, com parâmetros \(\alpha =100\) e \(\beta =125\). Para \(x\) \(\in \) \([100,\,125]\) a função densidade e de distribuição de probabilidade são:
\(\seteqnumber{0}{6.}{0}\)\begin{align*} f(x;\alpha =100,\beta =125) =& \dfrac {1}{25} &\textrm { e }&&F(x;\alpha =100,\beta =125) =& \dfrac {x-100}{25}. \end{align*} Assim, as probabilidades solicitadas são:
-
a) \(P(108<X<122)=P(108<X<122)=F(122)-F(108)\) \(=\) \((122-100)/25-(108-100)/25\) \(=\) 0,88\(-\)0,32 \(=\) 0,56 \(=\) \(56\%\).
-
b) \(P(X>115)=1-F(115)=1-(115-100)/25=\)1\(-\)0,60=40%.
-
-
6.2.2 A distribuição da eficiência \(X\) subjacente é a uniforme contínua em \([0,\,100]\). O preço de venda é discretizado em quatro valores reais \(P_1\), \(P_2\), \(P_3\) e \(P_4\), cujas probabilidades dependem na divisão em \(4\) classes de valores da variável subjacente \(X\). A função de distribuição de \(X\) é \(F(x;0,100)=x/100\). Logo, a probabilidade de \(X\) produzir um valor na primeira classe é: \(P(X<20)=F(20)=\)0,20. Do mesmo modo, para a classe \(2\), temos \(P(20\le X<50)\) \(=\) \(F(50)-F(20)\) \(=\) 0,50\(-\)0,20 \(=\) 0,30. Para a classe \(3\), \(P(50\le X<80)\) \(=\) 0,30 e para a classe \(4\), \(P(X\ge 80)\) \(=\) \(1-F(80)\) \(=\) 0,20. Essas probabilidade podem ser vistas como as probabilidades associadas a cada um dos \(4\) preços e é denotada por \(P(P_i.)\). O valor esperado do preço \(P\) (preço médio) de venda é
\(\seteqnumber{0}{6.}{0}\)\begin{align*} E(P) =& \sum _{i=1}^{4} P_i \times P(P_i)=0,2P_1+0,3P_2+0,3P_3+0,2P_4. \end{align*} Portanto, as respostas às perguntas realizadas são:
-
a) O lucro médio (L) por unidade é, portanto
\(\seteqnumber{0}{6.}{0}\)\begin{align*} L =& E(P) - C=0,2P_1+0,3P_2+0,3P_3+0,2P_4-C. \end{align*}
-
b) Com \(C=10\) e \(P_1=0\) (descarte), \(P_2=P_3/2=P_4/4\) temos o preço médio dado por
\(\seteqnumber{0}{6.}{0}\)\begin{align*} E(P) =& 0,2P_1+0,3P_2+0,3P_3+0,2P_4=0,3P_2+0,3\times 2P_2+0,2\times 4P_2\\ =& 1,7P_2. \end{align*} O lucro médio por componente é
\(\seteqnumber{0}{6.}{0}\)\begin{align*} L =& E(P) - C=1,7P_2-10. \end{align*} Para responder a primeira pergunta, temos que 1,7\(P_2-10=2\), que fornece \(P_2=\)7,06 u.m. e, portanto, os preços \(P_3\) e \(P_4\) são \(P_3=\)14,12 u.m. e \(P_4=\)28,24 u.m., respectivamente.
Para a resposta à segunda pergunta temos que 1,7\(P_2-10>0\), que resulta em \(P_2=\)5,88 e, portanto, em \(P_3=\)11,76 e \(P_4=\)23,53 u.m. para não se ter prejuízos.
-
-
6.2.3 O modelo exponencial para o total diário de chuvas em mm com parâmetro \(\lambda =\)0,0696:
-
a) Valor médio é dado por \(1/\lambda \), logo, \(\mu _X=\)1/0,0696 \(=\) 14,3678 mm. Poderíamos obter tal resultado pelo método geral, que inclusive, deu origem a esta expressão para a média da exponencial. Para o caso, este processo seria
\(\seteqnumber{0}{6.}{0}\)\begin{align*} E(X) =& \int _{0}^{\infty } x\times 0,0696e^{-0,0696x}dx=14,3678. \end{align*}
-
b) Vamos usar a função de distribuição que é \(F(X)\) \(=\) \(1-e^{-0,0696x}\) para computarmos as probabilidades deste item e dos demais a seguir. Assim, \(P(X>25)\) \(=\) \(1-F(25)\) \(=\) \(1-(1-e^{-0,696\times 25})\) \(=\) 0,1755 \(=\) 17,55%.
-
c) \(P(X<5)\) \(=\) \(F(5)\) \(=\) \(1-e^{-0,696\times 5}\) \(=\) 0,2939 \(=\) 29,39%.
-
d) \(P(10< X< 18)=F(18)-F(10)=\)0,18\(-\)0,10=0,08=8%.
-
-
6.2.4 A média (primeiro momento) da exponencial é \(1/\lambda \). O estimador da média (do primeiro momento) é a média amostral \(\bar {X}\) em uma amostra de tamanho \(n\). Assim, um estimador de momentos é dado por
\(\seteqnumber{0}{6.}{0}\)\begin{align*} \bar {X} =& \dfrac {1}{\hat {\lambda }}\\ \hat {\lambda }=& \dfrac {1}{\bar {X}}. \end{align*} Um segundo estimador pode ser obtido igualando-se os segundos momentos centrados na média (variância) populacional e amostral. A variância de uma variável exponencial é \(1/\lambda ^2\). Assim, usando o mesmo raciocínio temos que \(1/\hat {\lambda }^2=S^2\), que resulta em
\(\seteqnumber{0}{6.}{0}\)\begin{align*} \hat {\lambda } =& \dfrac {1}{\sqrt {S^2}}. \end{align*} Obviamente entre os dois estimadores, deve haver (e há) um melhor que o outro. Posteriormente, veremos algumas propriedades que nos permite escolher entre um deles por algum critério de otimalidade.
-
6.2.5 Estimador de máxima verossimilhança:
-
a) A função de verossimilhança da distribuição exponencial é
\(\seteqnumber{0}{6.}{0}\)\begin{align*} L(\lambda ;x_i)=& \prod _{i=1}^n f(x_i)\\ =&\prod _{i=1}^n \lambda e^{-\lambda x_i}\\ =& \lambda ^n e^{-\lambda \sum _{i=1}^n x_i}. \end{align*}
Tomando-se o logaritmo neperiano de \(L(\lambda ;x_i)\), tem-se
\(\seteqnumber{0}{6.}{0}\)\begin{align*} \ln L(\lambda ;x_i)=& n\ln (\lambda )-\lambda \sum _{i=1}^n x_i. \end{align*}
Deriva-se \(\ln L(\lambda ;x_i)\) em relação ao parâmetro \(\lambda \), iguala-se a zero, resolve-se a equação formada e obtém-se o estimativa de máxima verossimilhança. Assim,
\(\seteqnumber{0}{6.}{0}\)\begin{align*} \dfrac {d \ln L(\lambda ;x_i)}{d \lambda }=& \dfrac {n}{\lambda } - \sum _{i=1}^n x_i, \end{align*} que se igualado a zero é
\(\seteqnumber{0}{6.}{0}\)\begin{align*} \dfrac {n}{\hat {\lambda }} - \sum _{i=1}^n x_i=&0\\ \dfrac {n}{\hat {\lambda }} =&\sum _{i=1}^n x_i\\ \hat {\lambda }=& \dfrac {n}{\displaystyle \sum _{i=1}^n x_i}= \dfrac {1}{\bar {x}}. \end{align*}
Logo, substituindo as realizações das variáveis aleatórias pelas próprias variáveis aleatórias, temos que \(\hat {\lambda }\) \(=\) \(1/\bar {X}\) é o estimador de máxima verossimilhança do parâmetro \(\lambda \) da distribuição exponencial.
-
b) Verificamos que o estimador de momentos (baseado no primeiro momento, média) e o estimador de máxima verossimilhança de \(\lambda \) da exponencial são os mesmos, ou seja, são iguais a média amostral em uma amostra de tamanho \(n\) desta distribuição.
-
-
6.2.6 As probabilidades da normal padrão podem ser obtidas diretamente da tabela ou com algumas simples operações elementares dos valores obtidos diretamente na tabela. Nas figuras que seguem o valor da probabilidade almejada estará hachurado (preto ou preto e cinza) e o valor tabelado em cinza, quando for possível fazer isso. A tabela da normal com \(P(0<Z<z|z)\) é apresentada a seguir:
\(Z_t\) 0 1 2 3 4 5 6 7 8 9 0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549 0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852 0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133 0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389 1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441 1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545 1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633 1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706 1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767 2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817 2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857 2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890 2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916 2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936 2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952 2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964 2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974 2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981 2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986 3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990 3,1 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993 3,2 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995 3,3 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997 3,4 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998 3,5 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 3,6 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 3,7 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 3,8 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 3,9 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 -
a) A probabilidade \(P(Z>\)1,50\()\) está ilustrada na figura a seguir, com a cor preta. Na cor cinza está a área que a tabela fornece:
Logo, \(P(Z> \)1,50\()=\)0,5\(-P(0<Z< \)1,50\()=\)0,5\(-\)0,4332=0,0668=6,68%.
-
b) A probabilidade \(P(Z>-\)1,50\()\) está ilustrada na figura a seguir, com as cores preta e cinza (área toda hachurada). Na cor cinza está a área que a tabela fornece (por simetria):
Logo, \(P(Z>-\)1,50\()=\)0,5+ P(\(-\)1,50
-
c) A probabilidade \(P(-\)1,50
Logo, \(P(-\)1,50
-
d) A probabilidade \(P(-\)1,96
Logo, \(P(-\)1,96
-
e) A probabilidade \(P(Z>0)\) está ilustrada na figura a seguir, com a cor preta (obtida diretamente das propriedades da normal padrão):
Logo, \(P(Z>0)=\)0,50=50%.
-
f) A probabilidade \(P(\)1,30
Logo, \(P(\)1,30
-
-
6.2.7 Para resolver este exercício precisamos sempre encontrar a área entre \(0\) e o quantil (valor) \(z\), valor de interesse a ser determinado, pois a tabela que vamos consultar (apresentada anteriormente) contém a probabilidade do seguinte evento: \(P(0<Z<z)\). Lembre-se que no interior da tabela estão estas áreas (probabilidades) sob a curva e o valor \(z\) da variável aleatória \(Z\) está na primeira coluna da tabela, com a segunda casa decimal na primeira linha dela.
-
a) Se \(P(Z>z)=\)0,9750, logo \(P(z<Z<0)=\)0,9750\(-\)0,50=0,4750. Consultando a tabela normal padrão, localizamos o valor 0,4750 em seu interior e verificamos que ele corresponde ao valor \(z=\)1,96. Mas como \(z<0\), então \(z=-\)1,96. Veja a figura ilustrativa. A área hachurada, preto e cinza, corresponde ao valor da probabilidade toda; a área em preto a \(P(Z>0)=\)0,50 e a área em cinza, a probabilidade \(P(z<Z<0)=\)0,4750.
-
b) Se \(P(Z>z)=\)0,0250, logo \(P(0<Z<z)=\)0,50\(-\)0,0250=0,4750. Consultando a tabela normal padrão, localizamos o valor 0,4750 em seu interior e verificamos que ele corresponde ao valor \(z=\)1,96. Veja a figura ilustrativa. A área em preto corresponde a probabilidade solicitada \(P(Z>z)=\)0,0250 e a área em cinza, a probabilidade \(P(0<Z<z)=\)0,4750.
-
c) Se \(P(Z<z)=\)0,9750, logo \(P(0<Z<z)=\)0,9750\(-\)0,50=0,4750. Consultando a tabela normal padrão, localizamos o valor 0,4750 em seu interior e verificamos que ele corresponde ao valor \(z=\)1,96. Veja a figura ilustrativa. A área hachurada corresponde ao valor da probabilidade toda; a área em preto, a probabilidade \(P(Z<0)=\)0,50 e a área em cinza, a \(P(0<Z<z)=\)0,4750.
-
d) \(P(\)1,00\(<Z\le z)=\)0,10,logo \(P(0<Z<1)+P(1<Z\le z)=\)0,3413\(+\)0,10=0,4413. Então, podemos dizer que a área sob a curva entre \(0\) e \(z\) é igual a 0,4413. Assim, \(P(0<Z\le z)=\)0,4413. Este valor de probabilidade corresponde ao valor \(z=\)1,57, sem interpolar, ou seja, tomando-se o valor mais próximo na tabela. A área colorida de cinza corresponde à probabilidade \(P(0<Z<1)=\)0,3413 e a área toda hachurada (cinza+preto), à probabilidade \(P(0<Z\le z)=\)0,4413.
-
e) \(P(-1<Z< z)=\)0,20, logo \(P(z<Z<0)=P(-1<Z<0)-\) 0,2000=0,3413\(-\)0,2000=0,1413. Então, podemos dizer que a área sob a curva entre \(z\) e \(0\) é igual a 0,1413. Este valor de probabilidade corresponde ao valor \(z=-\)0,36, sem realizar interpolação, ou seja, tomando-se o valor mais próximo na tabela. A área colorida de preto corresponde a probabilidade \(P(-1<Z<z)=\)0,20 e a área em cinza+preto, a probabilidade \(P(-1<Z<0)=\)0,3413. A área em cinza corresponde a probabilidade \(P(z<Z<0)=\)0,1413. Veja a figura ilustrativa.
-
f) \(P(-1<Z< z)=\)0,40, logo \(P(0<Z< z)=\)0,40\(-P(-1<Z<0)=\)0,40\(-\)0,3413=0,0587. Então, podemos dizer que a área sob a curva entre \(z\) e \(0\) é igual a 0,0587. Este valor de probabilidade corresponde ao valor \(z=\)0,15, sem realizar interpolação, ou seja, tomando-se o valor mais próximo na tabela. A área colorida de preto corresponde a probabilidade \(P(-1<Z< 0)=\)0,3413 e a área em cinza, a probabilidade \(P(0<Z<z)=\)0,0587. Veja a figura ilustrativa.
-
-
6.2.8 Se o peso dos coelhos ao abate \(X \sim N(\mu =\)2,60, \(\sigma ^2=\)0,04\()\), então podemos resolver as questões apresentadas da seguinte forma:
-
a) Se \(P(X>\)2,70\()= P[Z>(\)2,70-2,60\()/0,20]=P(Z>\)0,50\()\) \(=\) 0,50\(-\)0,1915 \(=\) 30,75%. Existe uma equivalência entre as áreas sob uma curva normal qualquer e as áreas sob a curva normal padrão, cujos limites que delineiam estas regiões são obtidos pela padronização dos limites da variável original que limitam as regiões que determinam as probabilidades desejadas. Neste exemplo, o valor de \(X\) de 2,70 que limita a região \(X>\)2,70 equivale na escala padronizada ao valor de \(Z\) de 0,50. A forma geral para padronizarmos um valor \(X_c\) de uma variável \(X\) é dada por
\(\seteqnumber{0}{6.}{0}\)\begin{align*} Z_c=& \dfrac {X_c-\mu }{\sigma }. \end{align*}
Nos dois gráficos a seguir apresentamos a probabilidade (área) sob a normal \(N(\mu =\)2,60, \(\sigma ^2=\)0,04\()\) e a mesma probabilidade na normal padrão \(N(\mu =0,\,\, \sigma ^2=1)\). O gráfico da direita é o da normal padrão, em que o valor 0,50 representa o valor 2,70 na escala padronizada. A área em preto representa a probabilidade almejada e área em cinza, a probabilidade obtida da consulta da tabela da normal padrão (0,1915).
-
b) Se \(P(X<\)2,45\()=P[Z<(\)2,45\(-\)2,60)/0,20\(]=P(Z<\)-0,75\()\) \(=\) 0,50\(-P(0<Z<\)0,75\()\) \(=\) 0,50\(-\)0,2734=22,66%.
Nos dois gráficos a seguir apresentamos a probabilidade (área) sob a normal \(N(\mu =\)2,6; \(\sigma ^2=\)0,04\()\) e a mesma probabilidade na normal padrão \(N(\mu =0;\,\, \sigma ^2=1)\). O gráfico da direita é o da normal padrão, em que o valor \(-\)0,75 representa o valor 2,45 na escala padronizada. A área em preto representa a probabilidade almejada e área em cinza, a probabilidade obtida da consulta da tabela da normal padrão (0,2734).
-
c) Se P(2,55
Nos dois gráficos a seguir apresentamos a probabilidade (área) sob a normal \(N(\mu =\)2,60, \(\sigma ^2=\)0,04\()\) e a mesma probabilidade na normal padrão \(N(\mu =0,\,\, \sigma ^2=1)\). O segundo gráfico é o da normal padrão, em que os valores padronizados são \(-\)0,25 e 0,25 e representam os valores 2,55 e 2,65 na escala padronizada.
-
d) Para obter o peso \(x\), tal que \(P(X>x)=\)0,80, temos que \(x<\)2,60 e que \(P(x<X<\)2,60\()=\)0,80\(-P(X>\)2,60\()\) \(=\) 0,3000. Se \(z\) é o valor correspondente ao valor padronizado de \(x\) na escala padronizada, ou seja, \(z=(x-\)2,60\()/\)0,20, temos que \(P(z<Z<0)=\)0,3000, para \(Z\sim N(0\), \(1)\). Os gráficos a seguir ilustram estas quantidades nas escalas original e padronizada. A busca na tabela pelo valor mais próximo de 0,30 (interior da tabela) resulta em \(-\)0,84 (por simetria). Assim, o valor padronizado de \(x\) é \(z=-\)0,84. Usando a fórmula da despadronização temos
\(\seteqnumber{0}{6.}{0}\)\begin{align*} x =& \sigma z + \mu =-0,84\times 0,2+2,60=2,43, \end{align*} que é o valor almejado.
-
e) Obter \(x\), tal que \(P(\mu -x<X<\mu +x)=\)0,95. Temos, considerando que \(x>0\) e que \(\mu =\)2,60, que \(P(\)2,60\(<X<\)2,60\(+x)=\)0,95/2 \(=\) 0,4750. Se \(z\) é o valor correspondente ao valor padronizado de 2,60\(+x\) na escala padronizada, ou seja, \(z=(\)2,60\(+x-\)2,60\()/\)0,20 \(=\) \(5x\), temos que \(P(0<Z<z)=\)0,4750, para \(Z\sim N(0\), \(1)\). Os gráficos a seguir ilustram estas quantidades nas escalas original e padronizada. A busca na tabela pelo valor mais próximo de 0,4750 (interior da tabela) resulta em 1,96. Assim, o valor padronizado de \(\mu +x\) é \(z=\)1,96. Usando a fórmula da despadronização temos
\(\seteqnumber{0}{6.}{0}\)\begin{align*} \mu +x =& \sigma z + \mu =1,96\times 0,2+2,60=2,99. \end{align*} Isso implica que \(x\) \(=\) \(0,392\). Assim, o outro valor buscado \(\mu -x\) é \(2,21\) kg. Logo, os valores buscados são \(2,21\) e \(2,99\) kg.
-
f) Semelhante ao caso anterior desejamos obter \(x\), tal que \(P(\mu -x<X<\mu +x)=\)0,80. Pressupondo novamente que \(x>0\) e sabendo que \(\mu =\)2,60, temos que \(P(\)2,60\(<X<\)2,60\(+x)=\)0,80/2 \(=\) 0,40. Se \(z\) é o valor correspondente ao valor padronizado de 2,60\(+x\) na escala padronizada, ou seja, \(z=(\)2,60\(+x-\)2,60\()/\)0,20 \(=\) \(5x\), temos que \(P(0<Z<z)=\)0,40, para \(Z\sim N(0\), \(1)\). Os gráficos a seguir ilustram estas quantidades nas escalas original e padronizada. A busca na tabela pelo valor mais próximo de 0,40 (interior da tabela) resulta em 1,96. Assim, o valor padronizado de \(\mu +x\) é \(z=\)1,28. Usando a fórmula da despadronização temos
\(\seteqnumber{0}{6.}{0}\)\begin{align*} \mu +x =& \sigma z + \mu =1,28\times 0,2+2,60=2,86. \end{align*} Isso implica que \(x\) \(=\) 0,256. Assim, o outro valor buscado \(\mu -x\) é 2,34 kg. Logo, os valores buscados são 2,34 e 2,86 kg.
-
g) Ainda para o caso dos coelhos temos:
-
i) Para acharmos os limites de peso de cada classe vamos considerar, para ilustrar, a situação determinada pelo valor \(x_1\) que delimita a categoria \(E\) e que é o limite inferior da categoria \(D\) (veja figura a seguir). Neste caso vamos detalhar todos os passos e fazer os gráficos correspondentes. Nos demais limites, não faremos todos os gráficos correspondentes.
Se \(P(X<x_1)=15\%\) e \(x_1\) pode ser padronizado por
\(\seteqnumber{0}{6.}{0}\)\begin{align*} z_1=& \dfrac {x_1-\mu }{\sigma }=\dfrac {x_1-2,60}{0,20}. \end{align*}
Assim, \(P(X<x_1)=P(Z<z_1)=\)0,15; logo, \(P(z_1<Z<0)=\)0,5\(-\)0,15=0,35. Se consultarmos a tabela da normal padrão, sem interpolação, ou seja buscando o valor \(z_1\) cuja área entre \(z_1\) e \(0\) é aproximadamente 0,35, temos \(z_1=-\)1,04 (confira na tabela). Assim, como \(z_1\) é o valor padronizado de \(x_1\), podemos obter \(x_1\) substituindo \(z_1=-\)1,04 na fórmula de padronização anterior e resolvendo para \(x_1\), da seguinte forma
\(\seteqnumber{0}{6.}{0}\)\begin{align*} -1,04=& \dfrac {x_1-2,60}{0,20} \textrm { logo,}\\ x_1=& 0,20\times (-1,04)+2,60=2,392 \textrm { kg}. \end{align*}
Nos dois gráficos a seguir apresentamos a probabilidade (área) sob a normal \(N(\mu =\)2,60, \(\sigma ^2=\)0,04\()\) e a mesma probabilidade na normal padrão \(N(\mu =0;\,\, \sigma ^2=1)\), correspondente ao evento \(X<x_1\), para os valores de \(x_1\) e \(z_1\), respectivamente. O segundo gráfico é o da normal padrão. Observe que \(z_1\) é negativo (\(-\)1,04).
Para os demais valores, que não vamos ilustrar com os gráficos correspondentes, temos:
Se \(P(X<x_2)=15\%+20\%=35\%\), então \(x_2\) pode ser padronizado por
\(\seteqnumber{0}{6.}{0}\)\begin{align*} z_2=& \dfrac {x_2-\mu }{\sigma }=\dfrac {x_2-2,60}{0,20}. \end{align*}
Assim, \(P(X<x_2)=P(Z<z_2)=\)0,35; logo, \(P(z_2<Z<0)=\)0,5\(-\)0,35=0,15. Se consultarmos a tabela da normal padrão, sem interpolação, ou seja, buscando o valor \(z_2\) cuja área entre \(z_2\) e \(0\) é aproximadamente 0,15, temos \(z_2=-\)0,39 (confira na tabela). Assim, como \(z_2\) é o valor padronizado de \(x_2\), podemos obter \(x_2\) substituindo \(z_2=-\)0,39 na fórmula da despadronização \(x_2=\sigma z_2+\mu \) da seguinte forma
\(\seteqnumber{0}{6.}{0}\)\begin{align*} x_2=& 0,20\times (-0,39)+2,60=2,552 \textrm { kg}. \end{align*}
Para o limite \(x_3\), temos que \(P(X<x_3)=P(Z<z_3)=\)0,60; logo, \(P(0<Z<z_3)=\)0,65\(-\)0,5=0,10. Se consultarmos a tabela da normal padrão, sem interpolação, ou seja, buscando o valor \(z_3\) cuja área entre \(0\) e \(z_3\) é aproximadamente 0,10, temos \(z_3=\)0,25 (confira na tabela). Assim, como \(z_3\) é o valor padronizado de \(x_3\), podemos obter \(x_3\) substituindo \(z_3=\)0,25 na fórmula da despadronização \(x_3=\sigma z_3+\mu \) da seguinte forma
\(\seteqnumber{0}{6.}{0}\)\begin{align*} x_3=& 0,20\times 0,25+2,60=2,650 \textrm { kg}. \end{align*}
Finalmente para o limite \(x_4\) temos que \(P(X<x_4)=P(Z<z_4)=\)0,90; logo, \(P(0<Z<z_4)=\)0,9\(-\)0,5=0,40. Se consultarmos a tabela da normal padrão, sem interpolação, ou seja, buscando o valor \(z_4\) cuja área entre \(0\) e \(z_4\) é aproximadamente 0,40, temos \(z_4=\)1,28 (confira na tabela). Assim, como \(z_4\) é o valor padronizado de \(x_4\), podemos obter \(x_4\) substituindo \(z_4=\)1,28 na fórmula da despadronização \(x_4=\sigma z_4+\mu \) da seguinte forma
\(\seteqnumber{0}{6.}{0}\)\begin{align*} x_4=& 0,20\times 1,28+2,60=2,856 \textrm { kg}. \end{align*}
Portanto devemos classificar os coelhos na categoria \(E\) se o seu peso ao abate for inferior a 2,392 kg, na categoria \(D\) se seu peso estiver entre 2,392 kg e 2,552 kg, na categoria \(C\) se o seu peso estiver entre 2,552 kg e 2,650 kg, na categoria \(B\) se o seu peso estiver entre 2,650 kg e 2,856 kg e na categoria \(A\) se seu peso for superior a 2,856 kg.
-
ii) A receita média é de
\(\seteqnumber{0}{6.}{0}\)\begin{align*} \mu _R =& 2,1\times 0,15+ 3,0\times 0,20+5,0\times 0,25+5,2\times 0,30+2,5\times 0,10\\ =& 3,975. \end{align*} Se o custo médio é de \(C=\)2,60, então o lucro médio esperado é \(\mu _R-C\) \(=\) 1,375 u.m. por coelho.
-
-
-
6.2.9 A variável \(Y\) referente ao número de sementes que germinam possui distribuição binomial com probabilidade do sucesso \(p=\)0,70 e \(n=5\). Assim, \(Y\) \(\sim \) Binomial\((p=\)0,70, \(n=5)\). Logo, as soluções almejadas estão apresentadas na sequência.
-
a) Se utilizarmos a distribuição binomial a probabilidade almejada é:
\(\seteqnumber{0}{6.}{0}\)\begin{align*} P(Y\ge 4)=& P(X=4)+P(X=5)\\ =& \binom {5}{4}\left (0,70\right )^4\left (0,30\right )^{5-4}+ \binom {5}{5}\left (0,70\right )^5\left (0,30\right )^{5-5}\\ =& 0,2734375+0,21875\\ =& 0,6367187 \end{align*}
A probabilidade de que pelo menos \(4\) das \(5\) sementes germinem é de 63,67187%.
-
b) Vamos considerar que \(X\) é o número de vasos com pelo menos \(4\) sementes germinadas (mínimo de \(4\) plantas). Um experimento com \(m\) vasos a serem semeados com \(5\) sementes será realizado se houver ao menos \(30\) vasos com \(4\) plantas (ao menos \(4\) sementes germinadas). Logo, \(X\) \(\sim \) Binomial\((\theta =\)0,6367187, \(m)\), em que \(\theta \) \(=\) \(P(Y\ge 4)\) \(=\) 0,6367187 é a probabilidade de sucesso, ou seja, que um vaso escolhido ao acaso e que tenha sido semeado com ao menos \(5\) sementes tenha ao menos \(4\) sementes germinadas e \(m\) é o tamanho da amostra, desconhecido, no caso. A probabilidade requerida para que o experimento seja realizado é de \(95\%\) e pode ser enunciada da seguinte forma:
\(\seteqnumber{0}{6.}{0}\)\begin{align*} P(X\ge 30) =& \sum _{t=30}^{m} \binom {m}{t} \theta ^t(1-\theta )^{m-t}=0,95. \end{align*}
Queremos determinar \(m\), o tamanho da amostra, para que esta condição seja atendida. Este tamanho da amostra é o número de vasos que devem ser semeados com \(5\) sementes para que ao início do experimento tenhamos ao menos \(30\) deles com pelo menos \(4\) plantas. Podemos resolver isso por tentativa e erro. Por exemplo, se iniciarmos com \(m=50\) e calcularmos a probabilidade anterior teremos 0,7560, que é menor que \(95\%\). Se aumentarmos para \(m=58\), teremos \(P(X\ge 30)\) \(=\) 0,9773, que ultrapassa \(95\%\). Assim, repetimos este processo para \(m=55\) e obtivemos \(P(X\ge 30)\) \(=\) 0,9375 e para \(m=56\) e obtivemos \(P(X\ge 30)\) \(=\) 0,9547. Assim, concluímos que são necessários \(m=56\) vasos para garantir com 95,47% a probabilidade do evento almejado.
Para uma solução deste tipo, foi feito um programa em R usando a função uniroot e a relação exata entre as funções de distribuição binomial e beta. Se \(I_z(\alpha ,\beta )\) for a função de distribuição beta avaliada em \(z\) com parâmetros \(\alpha >0\) e \(\beta >0\), esta relação é dada por
\(\seteqnumber{0}{6.}{0}\)\begin{align*} P(X\le x|m,\theta ) =& I_{1-\theta }(m-x,x+1). \end{align*} O programa em R é:
theta <- 0.6367187 # Usando a relação exata entre as distribuições # binomial e beta dada por: # 1-pbinom(29,m,theta) = 1-pbeta(1-theta,x-29,30) fx <- function(x) 1-pbeta(1-theta,x-29,30) - 0.95 m <- uniroot(fx,c(30,400))$root # 30 a 400 é o intervalo da raíz m
O resultado para \(m\) neste caso foi de 55,7. Como \(m\) é um valor inteiro, \(55\) vasos são insuficientes para garantir a probabilidade e, portanto, o valor que deve ser adotado é \(m=56\), como anteriormente afirmado.
Para o nível do livro, podemos usar uma segunda estratégia para determinarmos este valor. Vamos considerar a aproximação normal da binomial. Como \(X\) é uma variável binomial com parâmetros \(\theta =\)0,6367187 e \(m\) (desconhecido), então se \(W\) corresponde a versão contínua da variável \(X\), \(W\) \(\dot {\sim }\) \(N(\mu =\)0,6367187\(m\), \(\sigma ^2=\)0,231308\(m)\), em que \(\dot {\sim }\) significa “se distribui aproximadamente como”. De forma aproximada temos as seguintes correspondências probabilísticas:
\(\seteqnumber{0}{6.}{0}\)\begin{align*} P(X\ge 30) \cong & P(W\ge 29,5)=0,95, \end{align*} em que o valor \(30\) foi ajustado para 29,5 na escala contínua (normal) para termos uma melhor aproximação (correção de continuidade).
Portanto, se usarmos a escala normal temos:
\(\seteqnumber{0}{6.}{0}\)\begin{align*} P(W\ge 29,5)=& P\left (Z\ge \dfrac {29,5-0,6367187m}{\sqrt {0,231308m}}\right )=0,95. \end{align*} Denotando \(z_1\) \(=\) (29,5\(-\)0,6367187\(m)/\sqrt {0,231308m}\), temos que \(z_1\) é um valor da distribuição normal padrão que tem área acima dele sob a curva de \(95\%\), o que indica que \(z_1<0\). O esquema a seguir ilustra o valor \(z_1\) na normal padrão.
Portanto, \(z_1=-\)1,645 \(=\) (29,5\(-\)0,6367187\(m)/\sqrt {0,231308m}\), que deve ser solucionado para \(m\). Assim,
\(\seteqnumber{0}{6.}{0}\)\begin{align*} 29,5-0,6367187m =& -1,645\sqrt {0,231308m}. \end{align*}
Tomando os quadrados de ambos os lados, temos, após algumas simplificações
\(\seteqnumber{0}{6.}{0}\)\begin{align*} 870,25-37,5664m+0,4054107m^2 =& 0,6259252m\\ 0,4054107m^2-38,19233m+870,25=&0. \end{align*}
Solucionando a equação quadrática em \(m\) (número de vasos), temos que
\(\seteqnumber{0}{6.}{0}\)\begin{align*} m =& \dfrac {38,19233\pm \sqrt {47,4193}}{\sqrt {0,8108214}} = \left \{\begin{array}{r} 38,61043 \\ 55,59609 \end {array} \right . \end{align*}
Com \(m=\)38,61043, temos \(z_1=\)1,645, que corresponde a uma área acima de apenas \(5\%\). Já se \(m=\)55,59609, o valor de \(z_1\) correspondente é \(z_1=-\)1,645, fornecendo tanto o sinal quanto a probabilidade corretamente, ou seja, \(P(Z>-\)1,645)=0,95, como requerido. Logo, a única solução apropriada é 55,60. Como o valor final de \(m\) é um valor inteiro, o valor \(55\) é insuficiente e o valor final deve ser \(m=56\), como obtido no primeiro método e como já era esperado.
-
-
6.2.10 A probabilidade de sucesso é \(p=\)0,02 e a variável é uma binomial, ou seja, \(X\) \(\sim \) binomial\((n=100\), \(p=\)0,02\()\), sendo \(X\) o número de animais com a peste suína na amostra aleatória. Esse modelo é possível desde que assumamos que a probabilidade de sucesso (evento de interesse) não seja alterada quando se amostra algum animal e que os ensaios Bernoulli (amostragens) sejam independentes. A questão então é determinar a probabilidade de se obter pelo menos um animal doente na amostra de tamanho \(100\), ou seja, \(P(X\ge 1)\). São propostas três maneiras diferentes, sendo uma delas uma forma exata que é o uso do modelo binomial. A seguir estão os resultados obtidos pelas três maneiras solicitadas.
-
a) Usando o modelo binomial:
\(\seteqnumber{0}{6.}{0}\)\begin{align*} P(X\ge 1) =& 1-P(X=0)=1-\binom {100}{0}\times 0,02^0\times 0,98^100=1-0,1326196\\ =& 0,8673804. \end{align*} Assim, há 86,74% de chance de se amostrar ao menos um animal com a peste suína.
-
b) Usando a aproximação da binomial temos que o parâmetro \(\lambda \) \(=\) \(np\) \(=\) \(100\times \) 0,02 \(=\) \(2\). Assim, a probabilidade usando o modelo \(P(X=x)\) \(\lambda ^xe^{-\lambda }/x!\) é:
\(\seteqnumber{0}{6.}{0}\)\begin{align*} P(X\ge 1) =& 1-P(X=0)=1-\dfrac {2^0e^{-2}}{0!}=1-0,1353353\\ =& 0,8646647. \end{align*} Assim, há aproximadamente 86,47% de chance de se amostrar ao menos um animal com a peste suína.
-
c) Usando a aproximação normal, temos que \(\mu \) \(=\) \(np\) \(=\) \(2\) e \(\sigma ^2\) \(=\) \(np(1-p)\) \(=\) 1,96. Assim, usando a correção de continuidade e denotando por \(Y\) a variável correspondente na escala contínua (normal), a probabilidade é
\(\seteqnumber{0}{6.}{0}\)\begin{align*} P(X\ge 1) \approx & P(Y\ge 0,5)=P\left (Z\ge \dfrac {0,5-\mu }{\sigma }\right )=P\left (Z\ge \dfrac {0,5-2}{\sqrt {1,96}}\right )=P(Z\ge -1,07)\\ \approx & P( -1,07\le Z<0)+0,50=0,3577+0,50\\ \approx & 0,8577. \end{align*} Assim, há aproximadamente 85,77% de chance de se amostrar ao menos um animal com a peste suína.
-
d) Para comparar os três valores, devemos considerar que o valor da binomial é o valor exato e, portanto, de referência. Assim, para o caso Poisson, o erro absoluto foi de 0,0027157 para menos (Poisson subestimou o verdadeiro valor) e o erro relativo absoluto foi de 0,31%. Para a normal, estes valores foram 0,0096804 e 1,12%. Assim, os maiores erros, em valores absolutos ou relativos foram com a normal. A aproximação normal da binomial é esperada ser adequada quando \(np>5\), o que não ocorreu neste exemplo, embora o valor encontrado não tenha sido expressivamente distante do valor real. Quando \(n\ge 100\) e \(p\le \)0,10, a distribuição Poisson da binomial é considerada adequada (Leemis & Trivedi 1996), o que ocorreu aqui, justificando as melhores estimativas da probabilidade exata obtida em relação à aproximação normal da binomial.
-