Estatı́stica Básica
7.2 Resolução
-
7.2.1 De acordo com a tabela fornecida e com as afirmativas probabilísticas temos as seguintes respostas aos exercícios propostos, considerando a distribuição \(t\) de Student.
-
a) \(P(t>t_c)=\)0,05 com \(\nu =10\), logo ao consultarmos a tabela miniatura da distribuição \(t\) de Student obtivemos \(t_c=\)1,812. Veja esquema a seguir, considerando que \(\alpha =\)0,05 e \(1-\alpha =\)0,95. Para esta consulta devemos encontrar os \(\nu =10\) graus de liberdade na primeira coluna e o valor da área à direita do quantil (quantil superior) igual a \(\alpha =\)0,05 na primeira linha. No cruzamento da linha e da coluna correspondentes aos valores mencionados encontramos o valor de \(t_c\), que é neste caso 1,812.
-
b) \(t_{0,95}\) com \(\nu =20-1\) é o mesmo que \(P(t>t_{0,95})=\)0,95. Como não temos o valor 0,95 na primeira linha da tabela, mas sabemos que a distribuição \(t\) de Student é simétrica, temos que \(T_{0,95}=-t_{0,05}\). Assim consultamos a tabela miniatura da distribuição \(t\) de Student obtivemos \(t_{0,05}=\)1,729. Veja esquema a seguir, considerando que \(\alpha =\)0,05 e \(1-\alpha =\)0,95. Para esta consulta devemos encontrar os \(\nu =19\) graus de liberdade na primeira coluna e o valor da área à direita do quantil (quantil superior) igual a \(\alpha =\)0,05 na primeira linha. No cruzamento da linha e da coluna correspondentes aos valores mencionados encontramos o valor \(t_{0,05}=\)1,729. Portanto, a resposta ao caso é \(t_{0,95}=-\)1,729.
Na figura, a área em preto possui área de \(1-2\alpha \) \(=\) 0,90 e a soma das áreas em preto e cinza é 0,95 (índice do quantil \(t_{0,95}\)). A área em cinza equivale a 0,05. Por essa razão (simetria), as tabelas de \(t\) só possuem valores menores de 0,50 para suas probabilidades à direita do quantil superior. Para valores de \(\alpha \) maiores que 0,50 usamos a propriedade:
\(\seteqnumber{0}{7.}{0}\)\begin{align*} t_{\gamma ;\nu } =& -t_{1-\gamma ;\nu }, \end{align*} para 0,5\(<\gamma <\)1 e, podermos, assim, consultar a tabela dos quantis superiores \(t\) de Student nas tabelas dos Livros.
-
c) \(t_{0,025}\) com \(\nu =10-1=9\) graus de liberdade. Se consultarmos a tabela miniatura da distribuição \(t\) de Student temos \(t_{0,025}=\)2,262. Veja esquema a seguir.
-
d) Para determinarmos \(t_{\alpha /2}\) dado que \(P(-t_{\alpha /2} < t < t_{\alpha /2})=\)0,95, temos que \(\alpha =\)0,05 e \(\alpha /2=\)0,025. Consultando a tabela com \(\nu =10\) graus de liberdade observamos \(t_{0,025;\nu =10}=\)2,228. Veja esquema ilustrativo a seguir.
-
e) Podemos escrever a expressão \(\int _{t_c}^\infty f(t)dt=\)0,025 por \(P(t>t_c)=\)0,025, logo \(t_c=t_{0,025;\nu =9}\). Assim, se consultarmos a tabela miniatura da distribuição \(t\) de Student temos \(t_c=\)2,262. Veja esquema a seguir e perceba de uma maneira geral as diferentes formas (notações) que possuímos para obter quantis superiores da distribuição \(t\) de Student.
-
-
7.2.2 De acordo com a tabela fornecida e com as afirmativas probabilísticas temos as seguintes respostas aos exercícios propostos, considerando a distribuição qui-quadrado.
-
a) \(\chi ^2_{0,025;\nu =10}=\)20,483, de acordo com a consulta que realizamos na tabela miniatura da distribuição qui-quadrado que apresentamos. Devemos utilizar a probabilidade 0,025 (coluna da tabela) e a linha correspondente aos graus de liberdade \(\nu =10\). Veja a figura a seguir, em que \(\chi ^2_t\) é o quantil superior da distribuição qui-quadrado tabelado (qui-quadrado tabelado).
-
b) \(\chi ^2_{0,01;\nu =6}=\)16,812, de acordo com a consulta que realizamos na tabela miniatura da distribuição qui-quadrado que apresentamos. Devemos utilizar a probabilidade 0,01 (coluna da tabela) e a linha correspondente aos graus de liberdade \(\nu =6\). Veja a figura a seguir.
-
c) \(\chi ^2_{0,05;\nu =10}=\)18,307, de acordo com a consulta que realizamos na tabela miniatura da distribuição qui-quadrado que apresentamos. Devemos utilizar a probabilidade 0,05 (coluna da tabela) e a linha correspondente aos graus de liberdade \(\nu =10\). Veja a figura a seguir.
-
d) \(\chi ^2_{\alpha /2;\nu =8}=\chi ^2_{0,05;\nu =8}=\)15,507, pois se \(P(\chi ^2\le \chi _{\alpha /2}^2)=\)0,95, significa que \(P(\chi ^2>\chi ^2_{\alpha /2})=\)0,05, sendo \(\alpha =\)0,10.
-
e) Este caso apresentamos apenas uma alteração de notação. Temos que a integral definida anunciada determina uma área sob a curva (distribuição qui-quadrado com \(\nu =8\) graus de liberdade) entre \(0\) e o valor de \(k\) igual a 0,95. A área sob a curva delimitada por \(k\) e \(\infty \) representa \(5\%\). Portanto, \(k=\chi ^2_{0,05;\nu =8}=\)15,507. Veja esquema ilustrativo, com área em cinza para \(P(\chi ^2_{\nu =8}> k)=\)0,05 e em ciano para \(P(\chi ^2_{\nu =8}\le k)=\)0,95.
-
-
7.2.3 De acordo com a tabela fornecida e com as afirmativas probabilísticas temos as seguintes respostas aos exercícios propostos, considerando a distribuição \(F\) de Snedecor.
-
a) \(F_{0,05;\nu _1=5;\nu _2=5}=\)5,05, valor resultante da consulta à tabela miniatura da distribuição \(F\). Veja figura ilustrativa a seguir.
-
b) \(F_{0,05;\nu _1=9;\nu _2=5}=\)4,77, valor resultante da consulta à tabela miniatura da distribuição \(F\). Veja figura ilustrativa a seguir.
-
c) \(F_{0,05;\nu _1=1;\nu _2=10}=\)4,96, valor resultante da consulta à tabela miniatura da distribuição \(F\). Se consultarmos a tabela \(t\) de Student veremos que \(t_{0,025;\nu =10}=\)2,228. Se tomarmos o quadrado do quantil \(t\), temos 2,228\(^2\) \(=\) 4,963, que é igual ao valor tabelado de \(F\). Assim, esta relação é sempre válida, e pode ser colocada de forma geral por
\[F_{\alpha ;\nu _1=1,\nu _2}=t^2_{\alpha /2;\nu =\nu _2}.\]
Observe que a probabilidade acima do quantil na \(t\) é metade \((\alpha /2)\) da apresentada na distribuição \(F\) \((\alpha )\); os graus de liberdade \(\nu _1\) são sempre iguais a \(1\); e os graus de liberdade da \(t\), \(\nu \), é igual a \(\nu _2\) da \(F\).
-
-
7.2.4 A variável \(X\) \(\sim \) exponencial\((\lambda =1/120)\) refere-se ao tempo de vida de mangueiras (plantas). A média e a variância da exponencial são \(\mu =1/\lambda =120\) e \(\sigma ^2\) \(=\) \(1/\lambda ^2\) \(=\) \(120^2\), respectivamente. A média de uma amostra de tamanho \(n\), pelo teorema do limite central tem aproximadamente distribuição normal, ou seja, \(\bar {X}\) \(\sim \) \(N(\mu \), \(\sigma ^2/n)\), que no caso resulta em \(\bar {X}\) \(\sim \) \(N(120\), \(144)\), para \(n\) \(=\) \(100\).
-
a) Determinar \(P(\bar {X}>250)\):
\(\seteqnumber{0}{7.}{0}\)\begin{align*} P(\bar {X}>250) =& P\left (Z>\dfrac {250-120}{\sqrt {144}}\right )\\ =& P(Z>10,83)\\ =& 0. \end{align*}
-
b) Determinar \(P(\bar {X}<60)\):
\(\seteqnumber{0}{7.}{0}\)\begin{align*} P(\bar {X}<60) =& P\left (Z<\dfrac {60-120}{\sqrt {144}}\right )\\ =& P(Z<-5)\\ =& 2,87\times 10^{-7}. \end{align*}
-
c) Determinar \(P(100<\bar {X}<140)\):
\(\seteqnumber{0}{7.}{0}\)\begin{align*} P(100<\bar {X}<140) =& P\left (\dfrac {100-120}{\sqrt {144}}< Z< \dfrac {140-120}{\sqrt {144}}\right )\\ =& P(-1,67<Z<1,67)\\ =& 0,9044. \end{align*}
Como poder visto, mesmo usando uma aproximação para o cálculo, a probabilidade de se encontrar uma amostra apresentando média amostral muito afastada do valor médio \(120\) é praticamente nula. Já a grande maioria, 90,44%, das médias em amostras de tamanho \(100\) se situa entre \(100\) e \(120\) anos.
-
-
7.2.5 No caso da exponencial, sabemos que \(\bar {X}\) \(\sim \) gama\((r=n\), \(n\lambda )\) em uma amostra aleatória de tamanho \(n\) de uma exponencial com parâmetro \(\lambda \), que para o exercício em questão resulta em \(\bar {X}\) \(\sim \) gama\((r=100\), \(5/6)\).
-
a) Determinar \(P(\bar {X}>250)\):
\(\seteqnumber{0}{7.}{0}\)\begin{align*} P(\bar {X}>250) =& 1-P(\bar {X}\le 250)\\ =& 1 - \int _0^{250}\dfrac {5/6}{\Gamma (100)}(5/6\times u)^{100-1}e^{-5/6\times u} du\\ =& 1-1=0, \end{align*} usando o comando pgamma(250,shape=100,rate=5/6) do R para obter o valor da função de distribuição da gama avaliado em \(250\).
Como tanto o valor exato quanto o valor aproximado foram iguais a zero, dentro da precisão limitada dos cálculos em computador, não há erros cometidos.
-
b) Determinar \(P(\bar {X}<60)\):
\(\seteqnumber{0}{7.}{0}\)\begin{align*} P(\bar {X}<60) =& P(\bar {X}\le 60)\\ =& \int _0^{60}\dfrac {5/6}{\Gamma (100)}(5/6\times u)^{100-1}e^{-5/6\times u} du\\ =& 3,2\times 10^{-7}, \end{align*} com auxílio do R, comando pgamma(60,shape=100,rate=5/6). O valor aproximado foi 2,87\(\times 10^{-7}\) e o exato 3,2\(\times 10^{-7}\), então o erro absoluto foi de 3,3\(\times 10^{-8}\) no sentido de subestimar o valor exato. O erro relativo absoluto foi 10,31%.
-
c) Determinar \(P(100<\bar {X}<140)\):
\(\seteqnumber{0}{7.}{0}\)\begin{align*} P(100<\bar {X}<140) =& P(\bar {X}\le 140)-P(\bar {X}\le 100)\\ =& \int _0^{140}\dfrac {5/6}{\Gamma (100)}(5/6\times u)^{100-1}e^{-5/6\times u} du - \\ & - \int _0^{100}\dfrac {5/6}{\Gamma (100)}(5/6\times u)^{100-1}e^{-5/6\times u} du\\ =& 0,94685-0,0413149\\ =& 0,905535, \end{align*} usando pgamma(140,shape=100,rate=5/6) - pgamma(100,shape=100,rate=5/6) do programa R. O erro absoluto foi de \(|\)0,9044\(-\)0,905535\(|\) \(=\) 0,001135 e o erro relativo absoluto percentual 0,12534%, que pode ser considerado bem pequeno.
-
-
7.2.6 Se \(X\) \(\sim \) binomial\((n\), \(p)\), então \(\hat {p}\) \(\dot {\sim }\) \(N(p\), \(p(1-p)/n)\), que no caso resulta em \(\hat {p}\) \(\dot {\sim }\) \(N(\)0,20, 0,0016\()\). Veja que a variável aleatória \(\hat {p}\) é uma média de variáveis Bernoulli, que são binárias \((0\) ou \(1)\), então a variável \(X\) \(=\) \(n\hat {p}\) (total de plantas infestadas) pode ser aproximada por uma distribuição normal. Se na escala contínua \(X\) for representada por \(Y\) \(=\) \(n\hat {p}\), então \(Y\) \(\dot {\sim }\) \(N(np\), \(np(1-p))\), usando-se propriedades da média e da variância quando uma variável aleatória é multiplicada por uma constante, no caso \(n\). Portanto, \(Y\) \(\dot {\sim }\) \(N(20\), \(16)\). Vamos usar, em todos os casos a seguir, a correção de continuidade.
-
a) A probabilidade de se ter plantas infestadas entre \(10\) e \(30\), exclui estes dois limites e é dada de forma aproximada por
\(\seteqnumber{0}{7.}{0}\)\begin{align*} P(10<X<30)\approx & P(10,5<Y<29,5)=P\left (\dfrac {10,5-20}{4}<Z< \dfrac {29,5-20}{4} \right )\\ \approx & P(-2,38<Z<2,38)=0,9913-0,00866\\ \approx & 0,9827. \end{align*}
-
b) A probabilidade de o número de plantas infestadas ser superior a \(40\) é:
\(\seteqnumber{0}{7.}{0}\)\begin{align*} P(X>40)\approx & P(Y>40,5)=P\left (Z>\dfrac {40,5-20}{4} \right )\\ \approx & P(Z>5,13)\\ \approx & 1,49\times 10^{-7}. \end{align*}
-
-
7.2.7 A variável aleatória \(X\) \(\sim \) binomial\((n\), \(p)\), no caso, \(X\) \(\sim \) binomial\((100\), 0,20\()\). Usando a distribuição exata binomial temos:
-
a) A probabilidade de se ter plantas infestadas entre \(10\) e \(30\), exclui estes dois limites e é dada de forma aproximada por
\(\seteqnumber{0}{7.}{0}\)\begin{align*} P(10<X<30)=& P(X=11)+\cdots +P(X=29)\\ =& \binom {100}{11}\times 0,2^{11}\times 0,8^{99}+\cdots +\binom {100}{29}\times 0,2^{29}\times 0,8^{71}\\ =& 0,006878495+\cdots +0,008771228\\ =& 0,9830546. \end{align*} Como o valor aproximado foi de 0,9827, então o erro absoluto é de 0,0003546 e o erro relativo absoluto percentual é 0,03607%.
-
b) A probabilidade de o número de plantas infestadas ser superior a \(40\) é:
\(\seteqnumber{0}{7.}{0}\)\begin{align*} P(X>40) =&P(X=41)+\cdots +P(X=100)\\ =& 8,47\times 10^{-7}+\cdots +1,27\times 10^{-7}\\ =& 1,29\times 10^{-6} \end{align*} Como o valor aproximado foi de 1,49\(\times 10^{-7}\), então o erro absoluto é de 1,14\(\times 10^{-6}\) e o erro relativo absoluto percentual é 88,45%. Apesar de o erro relativo ter sido muito alto, em termos absolutos ele é muito pequeno. Os erros relativos tendem a ser muito altos, quanto menor for, em geral, o valor exato de referência, pois pequenos erros em escala absoluto podem representar uma grande porção do verdadeiro valor, que também é muito pequeno (próximo a zero).
-
-
7.2.8 Se forem considerados os quantis superiores \(\chi ^2_{1-\alpha /2;\nu }\) e \(\chi ^2_{\alpha /2;\nu }\) da distribuição qui-quadrado com \(\nu =n-1\) graus de liberdade e a afirmativa probabilística
\(\seteqnumber{0}{7.}{0}\)\begin{align*} P\left (\chi ^2_{1-\alpha /2;\nu } \le \dfrac {\nu S^2}{\sigma ^2} \le \chi ^2_{\alpha /2;\nu }\right )=& 1-\alpha \\ P\left (\dfrac {\chi ^2_{1-\alpha /2;\nu }}{\nu S^2}\le \dfrac {1}{\sigma ^2} \le \dfrac {\chi ^2_{\alpha /2;\nu }}{\nu S^2}\right )=& 1-\alpha \\ P\left (\dfrac {\nu S^2}{\chi ^2_{1-\alpha /2;\nu }}\ge \sigma ^2 \ge \dfrac {\nu S^2}{\chi ^2_{\alpha /2;\nu }}\right )=& 1-\alpha \end{align*} se obtém
\(\seteqnumber{0}{7.}{0}\)\begin{align*} P\left (\dfrac {(n-1)S^2}{\chi ^2_{\alpha /2;\nu }}\le \sigma ^2 \le \dfrac {(n-1) S^2}{\chi ^2_{1-\alpha /2;\nu }}\right )=& 1-\alpha . \end{align*}
-
a) A afirmativa probabilística anterior possibilita a construção do intervalo de \(1-\alpha \) de confiança para o parâmetro \(\sigma ^2\). O intervalo resultante é
\(\seteqnumber{0}{7.}{0}\)\begin{align*} IC_{1-\alpha }\left (\sigma ^2\right ):\,\,\left [\dfrac {(n-1)S^2}{\chi ^2_{\alpha /2;\nu }}, \,\, \dfrac {(n-1) S^2}{\chi ^2_{1-\alpha /2;\nu }}\right ]. \end{align*}
-
b) Obter limites na prática para estimar o parâmetro \(\sigma ^2\) e determinar a precisão do processo de estimação. A lógica é se repetirmos infinitas vezes a amostragem de tamanho \(n\) de uma população normal e construirmos este intervalo de confiança, em média \(100(1-\alpha )\%\) deles conterão (cobrirão) o verdadeiro valor \(\sigma ^2\) da variância da população. Em muitas aplicações de genética, tanto no melhoramento animal quanto vegetal e nas aplicações de controle de qualidade, entre muito outros casos, este parâmetro tem fundamental importância.
-
-
7.2.9 Desenvolvendo a expressão apresentada, temos:
\(\seteqnumber{0}{7.}{0}\)\begin{align*} P\left (-t_{\alpha /2}\le \dfrac {\bar {X}-\mu }{\dfrac {S}{\sqrt {n}}}\le t_{\alpha /2}\right )=& 1-\alpha \\ P\left (-t_{\alpha /2}\dfrac {S}{\sqrt {n}}\le \bar {X}-\mu \le t_{\alpha /2}\dfrac {S}{\sqrt {n}}\right )= 1-\alpha & \\ P\left (-\bar {X}-t_{\alpha /2}\dfrac {S}{\sqrt {n}}\le -\mu \le -\bar {X}+ t_{\alpha /2}\dfrac {S}{\sqrt {n}}\right )=&1-\alpha \\ P\left (\bar {X}+t_{\alpha /2}\dfrac {S}{\sqrt {n}}\ge \mu \ge \bar {X}-t_{\alpha /2}\dfrac {S}{\sqrt {n}}\right )=&1-\alpha \\ P\left (\bar {X}-t_{\alpha /2}\dfrac {S}{\sqrt {n}}\le \mu \le \bar {X}+ t_{\alpha /2}\dfrac {S}{\sqrt {n}}\right )=& 1-\alpha . \end{align*}
-
a) A afirmativa probabilística anterior possibilita a construção do intervalo de \(1-\alpha \) de confiança para o parâmetro \(\mu \). O intervalo resultante é
\(\seteqnumber{0}{7.}{0}\)\begin{align*} IC_{1-\alpha }(\mu ):& \bar {X} \pm t_{\alpha /2;\nu } \dfrac {S}{\sqrt {n}}. \end{align*}
-
b) Obter intervalos de confiança para a média \(\mu \) de uma população normal, que pode ser aplica em situações de trabalhos corriqueiros, como em uma amostragem para determinar qual será a produção por ha de uma plantação de eucaliptos, como em áreas científicas.
-
-
7.2.10 Vamos considerar \(X\) \(\sim \) \(N(\mu =\)9,5, \(\sigma ^2=9)\), então podemos determinar a distribuição de \(\bar {X}\), \(\min (X_i's)\) e \(\max (X_i)\) em uma amostra de tamanho \(n=20\).
-
a) No caso de \(\bar {X}\), temos que \(\bar {X}\) \(\sim \) \(N(\mu _{\bar {X}}=\)9,5 e \(\sigma ^2_{\bar {X}}=9/20)\). Portanto,
\(\seteqnumber{0}{7.}{0}\)\begin{align*} P(\bar {X} < 8) =& P\left (Z<\dfrac {8-9,5}{\frac {3}{\sqrt {20}}} \right )=P(Z<-2,24)\\ =& 0,0125=1,25\%. \end{align*}
-
b) Se \(X_{(1)}\) \(=\) \(\min (X_i,i=1,\cdots ,n)\), temos que a função de distribuição, sendo \(X_i\)’s normais independentes e identicamente distribuídas, é dada por
\(\seteqnumber{0}{7.}{0}\)\begin{align*} F_{X_{(1)}}(x) =& P(X_{(1)}\le x)=1-\left [1-F_X(x)\right ]^{20}, \end{align*} em que \(F_X(x)\) é a função de distribuição de uma variável aleatória \(X\) \(\sim \) \(N(\mu =\)9,5, \(\sigma ^2=9)\). Desejamos obter \(F_{X_{(1)}}(8)\). Logo,
\(\seteqnumber{0}{7.}{0}\)\begin{align*} F_{X_{(1)}}(8) =& P(X_{(1)}\le 8)=1-\left [1-P(X\le 8)\right ]^{20}\\ =& 1-\left [1-P\left (Z<\dfrac {8-9,5}{3}\right )\right ]^{20}\\ =& 1-\left [1-P\left (Z<-0,50\right )\right ]^{20}=1- \left (1-0,3085375\right )^{20}\\ =& 0,9993757. \end{align*} Assim, 99,94% das amostras normais desta população apresentam valor mínimo inferior a \(8\). Fizemos um programa em R para mostrar como isso acontece. Neste programa realizamos \(1000000\) de simulações e a estimativa que obtivemos foi de 0,999409 (vai variar se você repetir este processo, por se tratar de um processo aleatório). Veja o programa abaixo:
mu <- 9.5 sig <- 3 x1 <- 11 #probabilidade exata mínimo 1 - (1 - pnorm(x1, mu, sig))^20 #probabilidade exata máximo (pnorm(x1, mu, sig))^20 N <- 1000000 n <- 20 X <- matrix(c(rnorm(N * n, mu, sig)), N, n) #estimativa da probabilidade #exata do mínimo por simulação x <- apply(X, 1, min) length(x[x < x1]) / N #estimativa da probabilidade #exata do máximo por simulação y <- apply(X, 1, max) length(y[y < x1]) / N
-
c) Se \(X_{(n)}\) \(=\) \(\max (X_i,i=1,\cdots ,n)\), temos que a função de distribuição, sendo \(X_i\)’s normais independentes e identicamente distribuídas, é dada por
\(\seteqnumber{0}{7.}{0}\)\begin{align*} F_{X_{(n)}}(x) =& P(X_{(n)}\le x)=\left [F_X(x)\right ]^{20}, \end{align*} em que \(F_X(x)\) é a função de distribuição de uma variável aleatória \(X\) \(\sim \) \(N(\mu =\)9,5, \(\sigma ^2=9)\). Desejamos obter \(F_{X_{(n)}}(11)\). Logo,
\(\seteqnumber{0}{7.}{0}\)\begin{align*} F_{X_{(n)}}(11) =& P(X_{(n)}\le 11)=\left [P(X\le 11)\right ]^{20}\\ =& \left [P\left (Z<\dfrac {11-9,5}{3}\right )\right ]^{20}\\ =& \left [P\left (Z\le 0,50\right )\right ]^{20}= \left (0,6914625\right )^{20}\\ =& 0,0006242696. \end{align*} Assim, 0,062% das amostras normais desta população apresentam valor máximo inferior a \(11\). Na simulação, cujo programa anterior incluí o caso do máximo, é de 0,0606%, que é uma estimativa razoável do valor encontrado. Assim, existe uma grande probabilidade de que as amostras desta população normal apresentem máximos superiores a \(11\), que é o complemento para \(1\) do valor apresentado.
-