EB

Estatı́stica Básica

\(\newcommand{\footnotename}{footnote}\) \(\def \LWRfootnote {1}\) \(\newcommand {\footnote }[2][\LWRfootnote ]{{}^{\mathrm {#1}}}\) \(\newcommand {\footnotemark }[1][\LWRfootnote ]{{}^{\mathrm {#1}}}\) \(\let \LWRorighspace \hspace \) \(\renewcommand {\hspace }{\ifstar \LWRorighspace \LWRorighspace }\) \(\newcommand {\mathnormal }[1]{{#1}}\) \(\newcommand \ensuremath [1]{#1}\) \(\newcommand {\LWRframebox }[2][]{\fbox {#2}} \newcommand {\framebox }[1][]{\LWRframebox } \) \(\newcommand {\setlength }[2]{}\) \(\newcommand {\addtolength }[2]{}\) \(\newcommand {\setcounter }[2]{}\) \(\newcommand {\addtocounter }[2]{}\) \(\newcommand {\arabic }[1]{}\) \(\newcommand {\number }[1]{}\) \(\newcommand {\noalign }[1]{\text {#1}\notag \\}\) \(\newcommand {\cline }[1]{}\) \(\newcommand {\directlua }[1]{\text {(directlua)}}\) \(\newcommand {\luatexdirectlua }[1]{\text {(directlua)}}\) \(\newcommand {\protect }{}\) \(\def \LWRabsorbnumber #1 {}\) \(\def \LWRabsorbquotenumber "#1 {}\) \(\newcommand {\LWRabsorboption }[1][]{}\) \(\newcommand {\LWRabsorbtwooptions }[1][]{\LWRabsorboption }\) \(\def \mathchar {\ifnextchar "\LWRabsorbquotenumber \LWRabsorbnumber }\) \(\def \mathcode #1={\mathchar }\) \(\let \delcode \mathcode \) \(\let \delimiter \mathchar \) \(\def \oe {\unicode {x0153}}\) \(\def \OE {\unicode {x0152}}\) \(\def \ae {\unicode {x00E6}}\) \(\def \AE {\unicode {x00C6}}\) \(\def \aa {\unicode {x00E5}}\) \(\def \AA {\unicode {x00C5}}\) \(\def \o {\unicode {x00F8}}\) \(\def \O {\unicode {x00D8}}\) \(\def \l {\unicode {x0142}}\) \(\def \L {\unicode {x0141}}\) \(\def \ss {\unicode {x00DF}}\) \(\def \SS {\unicode {x1E9E}}\) \(\def \dag {\unicode {x2020}}\) \(\def \ddag {\unicode {x2021}}\) \(\def \P {\unicode {x00B6}}\) \(\def \copyright {\unicode {x00A9}}\) \(\def \pounds {\unicode {x00A3}}\) \(\let \LWRref \ref \) \(\renewcommand {\ref }{\ifstar \LWRref \LWRref }\) \( \newcommand {\multicolumn }[3]{#3}\) \(\require {textcomp}\) \(\newcommand {\intertext }[1]{\text {#1}\notag \\}\) \(\let \Hat \hat \) \(\let \Check \check \) \(\let \Tilde \tilde \) \(\let \Acute \acute \) \(\let \Grave \grave \) \(\let \Dot \dot \) \(\let \Ddot \ddot \) \(\let \Breve \breve \) \(\let \Bar \bar \) \(\let \Vec \vec \) \(\require {mathtools}\) \(\newenvironment {crampedsubarray}[1]{}{}\) \(\newcommand {\smashoperator }[2][]{#2\limits }\) \(\newcommand {\SwapAboveDisplaySkip }{}\) \(\newcommand {\LaTeXunderbrace }[1]{\underbrace {#1}}\) \(\newcommand {\LaTeXoverbrace }[1]{\overbrace {#1}}\) \(\newcommand {\LWRmultlined }[1][]{\begin {multline*}}\) \(\newenvironment {multlined}[1][]{\LWRmultlined }{\end {multline*}}\) \(\let \LWRorigshoveleft \shoveleft \) \(\renewcommand {\shoveleft }[1][]{\LWRorigshoveleft }\) \(\let \LWRorigshoveright \shoveright \) \(\renewcommand {\shoveright }[1][]{\LWRorigshoveright }\) \(\newcommand {\shortintertext }[1]{\text {#1}\notag \\}\) \(\newcommand {\vcentcolon }{\mathrel {\unicode {x2236}}}\) \(\newcommand {\bm }[1]{\boldsymbol {#1}}\) \(\require {cancel}\) \(\newcommand {\firsthdashline }[1][]{\hdashline }\) \(\let \lasthdashline \firsthdashline \) \(\let \cdashline \cline \) \(\require {colortbl}\) \(\let \LWRorigcolumncolor \columncolor \) \(\renewcommand {\columncolor }[2][named]{\LWRorigcolumncolor [#1]{#2}\LWRabsorbtwooptions }\) \(\let \LWRorigrowcolor \rowcolor \) \(\renewcommand {\rowcolor }[2][named]{\LWRorigrowcolor [#1]{#2}\LWRabsorbtwooptions }\) \(\let \LWRorigcellcolor \cellcolor \) \(\renewcommand {\cellcolor }[2][named]{\LWRorigcellcolor [#1]{#2}\LWRabsorbtwooptions }\) \(\newcommand {\tcbset }[1]{}\) \(\newcommand {\tcbsetforeverylayer }[1]{}\) \(\newcommand {\tcbox }[2][]{\boxed {\text {#2}}}\) \(\newcommand {\tcboxfit }[2][]{\boxed {#2}}\) \(\newcommand {\tcblower }{}\) \(\newcommand {\tcbline }{}\) \(\newcommand {\tcbtitle }{}\) \(\newcommand {\tcbsubtitle [2][]{\mathrm {#2}}}\) \(\newcommand {\tcboxmath }[2][]{\boxed {#2}}\) \(\newcommand {\tcbhighmath }[2][]{\boxed {#2}}\)

7.2 Resolução

  • 7.2.1 De acordo com a tabela fornecida e com as afirmativas probabilísticas temos as seguintes respostas aos exercícios propostos, considerando a distribuição \(t\) de Student.

    • a) \(P(t>t_c)=\)0,05 com \(\nu =10\), logo ao consultarmos a tabela miniatura da distribuição \(t\) de Student obtivemos \(t_c=\)1,812. Veja esquema a seguir, considerando que \(\alpha =\)0,05 e \(1-\alpha =\)0,95. Para esta consulta devemos encontrar os \(\nu =10\) graus de liberdade na primeira coluna e o valor da área à direita do quantil (quantil superior) igual a \(\alpha =\)0,05 na primeira linha. No cruzamento da linha e da coluna correspondentes aos valores mencionados encontramos o valor de \(t_c\), que é neste caso 1,812.

      (-tikz- diagram)

    • b) \(t_{0,95}\) com \(\nu =20-1\) é o mesmo que \(P(t>t_{0,95})=\)0,95. Como não temos o valor 0,95 na primeira linha da tabela, mas sabemos que a distribuição \(t\) de Student é simétrica, temos que \(T_{0,95}=-t_{0,05}\). Assim consultamos a tabela miniatura da distribuição \(t\) de Student obtivemos \(t_{0,05}=\)1,729. Veja esquema a seguir, considerando que \(\alpha =\)0,05 e \(1-\alpha =\)0,95. Para esta consulta devemos encontrar os \(\nu =19\) graus de liberdade na primeira coluna e o valor da área à direita do quantil (quantil superior) igual a \(\alpha =\)0,05 na primeira linha. No cruzamento da linha e da coluna correspondentes aos valores mencionados encontramos o valor \(t_{0,05}=\)1,729. Portanto, a resposta ao caso é \(t_{0,95}=-\)1,729.

      Na figura, a área em preto possui área de \(1-2\alpha \) \(=\) 0,90 e a soma das áreas em preto e cinza é 0,95 (índice do quantil \(t_{0,95}\)). A área em cinza equivale a 0,05. Por essa razão (simetria), as tabelas de \(t\) só possuem valores menores de 0,50 para suas probabilidades à direita do quantil superior. Para valores de \(\alpha \) maiores que 0,50 usamos a propriedade:

      \begin{align*} t_{\gamma ;\nu } =& -t_{1-\gamma ;\nu }, \end{align*} para 0,5\(<\gamma <\)1 e, podermos, assim, consultar a tabela dos quantis superiores \(t\) de Student nas tabelas dos Livros.

      (-tikz- diagram)

    • c) \(t_{0,025}\) com \(\nu =10-1=9\) graus de liberdade. Se consultarmos a tabela miniatura da distribuição \(t\) de Student temos \(t_{0,025}=\)2,262. Veja esquema a seguir.

      (-tikz- diagram)

    • d) Para determinarmos \(t_{\alpha /2}\) dado que \(P(-t_{\alpha /2} < t < t_{\alpha /2})=\)0,95, temos que \(\alpha =\)0,05 e \(\alpha /2=\)0,025. Consultando a tabela com \(\nu =10\) graus de liberdade observamos \(t_{0,025;\nu =10}=\)2,228. Veja esquema ilustrativo a seguir.

      (-tikz- diagram)

    • e) Podemos escrever a expressão \(\int _{t_c}^\infty f(t)dt=\)0,025 por \(P(t>t_c)=\)0,025, logo \(t_c=t_{0,025;\nu =9}\). Assim, se consultarmos a tabela miniatura da distribuição \(t\) de Student temos \(t_c=\)2,262. Veja esquema a seguir e perceba de uma maneira geral as diferentes formas (notações) que possuímos para obter quantis superiores da distribuição \(t\) de Student.

      (-tikz- diagram)

  • 7.2.2 De acordo com a tabela fornecida e com as afirmativas probabilísticas temos as seguintes respostas aos exercícios propostos, considerando a distribuição qui-quadrado.

    • a) \(\chi ^2_{0,025;\nu =10}=\)20,483, de acordo com a consulta que realizamos na tabela miniatura da distribuição qui-quadrado que apresentamos. Devemos utilizar a probabilidade 0,025 (coluna da tabela) e a linha correspondente aos graus de liberdade \(\nu =10\). Veja a figura a seguir, em que \(\chi ^2_t\) é o quantil superior da distribuição qui-quadrado tabelado (qui-quadrado tabelado).

      (-tikz- diagram)

    • b) \(\chi ^2_{0,01;\nu =6}=\)16,812, de acordo com a consulta que realizamos na tabela miniatura da distribuição qui-quadrado que apresentamos. Devemos utilizar a probabilidade 0,01 (coluna da tabela) e a linha correspondente aos graus de liberdade \(\nu =6\). Veja a figura a seguir.

      (-tikz- diagram)

    • c) \(\chi ^2_{0,05;\nu =10}=\)18,307, de acordo com a consulta que realizamos na tabela miniatura da distribuição qui-quadrado que apresentamos. Devemos utilizar a probabilidade 0,05 (coluna da tabela) e a linha correspondente aos graus de liberdade \(\nu =10\). Veja a figura a seguir.

      (-tikz- diagram)

    • d) \(\chi ^2_{\alpha /2;\nu =8}=\chi ^2_{0,05;\nu =8}=\)15,507, pois se \(P(\chi ^2\le \chi _{\alpha /2}^2)=\)0,95, significa que \(P(\chi ^2>\chi ^2_{\alpha /2})=\)0,05, sendo \(\alpha =\)0,10.

      (-tikz- diagram)

    • e) Este caso apresentamos apenas uma alteração de notação. Temos que a integral definida anunciada determina uma área sob a curva (distribuição qui-quadrado com \(\nu =8\) graus de liberdade) entre \(0\) e o valor de \(k\) igual a 0,95. A área sob a curva delimitada por \(k\) e \(\infty \) representa \(5\%\). Portanto, \(k=\chi ^2_{0,05;\nu =8}=\)15,507. Veja esquema ilustrativo, com área em cinza para \(P(\chi ^2_{\nu =8}> k)=\)0,05 e em ciano para \(P(\chi ^2_{\nu =8}\le k)=\)0,95.

      (-tikz- diagram)

  • 7.2.3 De acordo com a tabela fornecida e com as afirmativas probabilísticas temos as seguintes respostas aos exercícios propostos, considerando a distribuição \(F\) de Snedecor.

    • a) \(F_{0,05;\nu _1=5;\nu _2=5}=\)5,05, valor resultante da consulta à tabela miniatura da distribuição \(F\). Veja figura ilustrativa a seguir.

      (-tikz- diagram)

    • b) \(F_{0,05;\nu _1=9;\nu _2=5}=\)4,77, valor resultante da consulta à tabela miniatura da distribuição \(F\). Veja figura ilustrativa a seguir.

      (-tikz- diagram)

    • c) \(F_{0,05;\nu _1=1;\nu _2=10}=\)4,96, valor resultante da consulta à tabela miniatura da distribuição \(F\). Se consultarmos a tabela \(t\) de Student veremos que \(t_{0,025;\nu =10}=\)2,228. Se tomarmos o quadrado do quantil \(t\), temos 2,228\(^2\) \(=\) 4,963, que é igual ao valor tabelado de \(F\). Assim, esta relação é sempre válida, e pode ser colocada de forma geral por

      \[F_{\alpha ;\nu _1=1,\nu _2}=t^2_{\alpha /2;\nu =\nu _2}.\]

      Observe que a probabilidade acima do quantil na \(t\) é metade \((\alpha /2)\) da apresentada na distribuição \(F\) \((\alpha )\); os graus de liberdade \(\nu _1\) são sempre iguais a \(1\); e os graus de liberdade da \(t\), \(\nu \), é igual a \(\nu _2\) da \(F\).

      (-tikz- diagram)

  • 7.2.4 A variável \(X\) \(\sim \) exponencial\((\lambda =1/120)\) refere-se ao tempo de vida de mangueiras (plantas). A média e a variância da exponencial são \(\mu =1/\lambda =120\) e \(\sigma ^2\) \(=\) \(1/\lambda ^2\) \(=\) \(120^2\), respectivamente. A média de uma amostra de tamanho \(n\), pelo teorema do limite central tem aproximadamente distribuição normal, ou seja, \(\bar {X}\) \(\sim \) \(N(\mu \), \(\sigma ^2/n)\), que no caso resulta em \(\bar {X}\) \(\sim \) \(N(120\), \(144)\), para \(n\) \(=\) \(100\).

    • a) Determinar \(P(\bar {X}>250)\):

      \begin{align*} P(\bar {X}>250) =& P\left (Z>\dfrac {250-120}{\sqrt {144}}\right )\\ =& P(Z>10,83)\\ =& 0. \end{align*}

    • b) Determinar \(P(\bar {X}<60)\):

      \begin{align*} P(\bar {X}<60) =& P\left (Z<\dfrac {60-120}{\sqrt {144}}\right )\\ =& P(Z<-5)\\ =& 2,87\times 10^{-7}. \end{align*}

    • c) Determinar \(P(100<\bar {X}<140)\):

      \begin{align*} P(100<\bar {X}<140) =& P\left (\dfrac {100-120}{\sqrt {144}}< Z< \dfrac {140-120}{\sqrt {144}}\right )\\ =& P(-1,67<Z<1,67)\\ =& 0,9044. \end{align*}

      Como poder visto, mesmo usando uma aproximação para o cálculo, a probabilidade de se encontrar uma amostra apresentando média amostral muito afastada do valor médio \(120\) é praticamente nula. Já a grande maioria, 90,44%, das médias em amostras de tamanho \(100\) se situa entre \(100\) e \(120\) anos.

  • 7.2.5 No caso da exponencial, sabemos que \(\bar {X}\) \(\sim \) gama\((r=n\), \(n\lambda )\) em uma amostra aleatória de tamanho \(n\) de uma exponencial com parâmetro \(\lambda \), que para o exercício em questão resulta em \(\bar {X}\) \(\sim \) gama\((r=100\), \(5/6)\).

    • a) Determinar \(P(\bar {X}>250)\):

      \begin{align*} P(\bar {X}>250) =& 1-P(\bar {X}\le 250)\\ =& 1 - \int _0^{250}\dfrac {5/6}{\Gamma (100)}(5/6\times u)^{100-1}e^{-5/6\times u} du\\ =& 1-1=0, \end{align*} usando o comando pgamma(250,shape=100,rate=5/6) do R para obter o valor da função de distribuição da gama avaliado em \(250\).

      Como tanto o valor exato quanto o valor aproximado foram iguais a zero, dentro da precisão limitada dos cálculos em computador, não há erros cometidos.

    • b) Determinar \(P(\bar {X}<60)\):

      \begin{align*} P(\bar {X}<60) =& P(\bar {X}\le 60)\\ =& \int _0^{60}\dfrac {5/6}{\Gamma (100)}(5/6\times u)^{100-1}e^{-5/6\times u} du\\ =& 3,2\times 10^{-7}, \end{align*} com auxílio do R, comando pgamma(60,shape=100,rate=5/6). O valor aproximado foi 2,87\(\times 10^{-7}\) e o exato 3,2\(\times 10^{-7}\), então o erro absoluto foi de 3,3\(\times 10^{-8}\) no sentido de subestimar o valor exato. O erro relativo absoluto foi 10,31%.

    • c) Determinar \(P(100<\bar {X}<140)\):

      \begin{align*} P(100<\bar {X}<140) =& P(\bar {X}\le 140)-P(\bar {X}\le 100)\\ =& \int _0^{140}\dfrac {5/6}{\Gamma (100)}(5/6\times u)^{100-1}e^{-5/6\times u} du - \\ & - \int _0^{100}\dfrac {5/6}{\Gamma (100)}(5/6\times u)^{100-1}e^{-5/6\times u} du\\ =& 0,94685-0,0413149\\ =& 0,905535, \end{align*} usando pgamma(140,shape=100,rate=5/6) - pgamma(100,shape=100,rate=5/6) do programa R. O erro absoluto foi de \(|\)0,9044\(-\)0,905535\(|\) \(=\) 0,001135 e o erro relativo absoluto percentual 0,12534%, que pode ser considerado bem pequeno.

  • 7.2.6 Se \(X\) \(\sim \) binomial\((n\), \(p)\), então \(\hat {p}\) \(\dot {\sim }\) \(N(p\), \(p(1-p)/n)\), que no caso resulta em \(\hat {p}\) \(\dot {\sim }\) \(N(\)0,20, 0,0016\()\). Veja que a variável aleatória \(\hat {p}\) é uma média de variáveis Bernoulli, que são binárias \((0\) ou \(1)\), então a variável \(X\) \(=\) \(n\hat {p}\) (total de plantas infestadas) pode ser aproximada por uma distribuição normal. Se na escala contínua \(X\) for representada por \(Y\) \(=\) \(n\hat {p}\), então \(Y\) \(\dot {\sim }\) \(N(np\), \(np(1-p))\), usando-se propriedades da média e da variância quando uma variável aleatória é multiplicada por uma constante, no caso \(n\). Portanto, \(Y\) \(\dot {\sim }\) \(N(20\), \(16)\). Vamos usar, em todos os casos a seguir, a correção de continuidade.

    • a) A probabilidade de se ter plantas infestadas entre \(10\) e \(30\), exclui estes dois limites e é dada de forma aproximada por

      \begin{align*} P(10<X<30)\approx & P(10,5<Y<29,5)=P\left (\dfrac {10,5-20}{4}<Z< \dfrac {29,5-20}{4} \right )\\ \approx & P(-2,38<Z<2,38)=0,9913-0,00866\\ \approx & 0,9827. \end{align*}

    • b) A probabilidade de o número de plantas infestadas ser superior a \(40\) é:

      \begin{align*} P(X>40)\approx & P(Y>40,5)=P\left (Z>\dfrac {40,5-20}{4} \right )\\ \approx & P(Z>5,13)\\ \approx & 1,49\times 10^{-7}. \end{align*}

  • 7.2.7 A variável aleatória \(X\) \(\sim \) binomial\((n\), \(p)\), no caso, \(X\) \(\sim \) binomial\((100\), 0,20\()\). Usando a distribuição exata binomial temos:

    • a) A probabilidade de se ter plantas infestadas entre \(10\) e \(30\), exclui estes dois limites e é dada de forma aproximada por

      \begin{align*} P(10<X<30)=& P(X=11)+\cdots +P(X=29)\\ =& \binom {100}{11}\times 0,2^{11}\times 0,8^{99}+\cdots +\binom {100}{29}\times 0,2^{29}\times 0,8^{71}\\ =& 0,006878495+\cdots +0,008771228\\ =& 0,9830546. \end{align*} Como o valor aproximado foi de 0,9827, então o erro absoluto é de 0,0003546 e o erro relativo absoluto percentual é 0,03607%.

    • b) A probabilidade de o número de plantas infestadas ser superior a \(40\) é:

      \begin{align*} P(X>40) =&P(X=41)+\cdots +P(X=100)\\ =& 8,47\times 10^{-7}+\cdots +1,27\times 10^{-7}\\ =& 1,29\times 10^{-6} \end{align*} Como o valor aproximado foi de 1,49\(\times 10^{-7}\), então o erro absoluto é de 1,14\(\times 10^{-6}\) e o erro relativo absoluto percentual é 88,45%. Apesar de o erro relativo ter sido muito alto, em termos absolutos ele é muito pequeno. Os erros relativos tendem a ser muito altos, quanto menor for, em geral, o valor exato de referência, pois pequenos erros em escala absoluto podem representar uma grande porção do verdadeiro valor, que também é muito pequeno (próximo a zero).

  • 7.2.8 Se forem considerados os quantis superiores \(\chi ^2_{1-\alpha /2;\nu }\) e \(\chi ^2_{\alpha /2;\nu }\) da distribuição qui-quadrado com \(\nu =n-1\) graus de liberdade e a afirmativa probabilística

    \begin{align*} P\left (\chi ^2_{1-\alpha /2;\nu } \le \dfrac {\nu S^2}{\sigma ^2} \le \chi ^2_{\alpha /2;\nu }\right )=& 1-\alpha \\ P\left (\dfrac {\chi ^2_{1-\alpha /2;\nu }}{\nu S^2}\le \dfrac {1}{\sigma ^2} \le \dfrac {\chi ^2_{\alpha /2;\nu }}{\nu S^2}\right )=& 1-\alpha \\ P\left (\dfrac {\nu S^2}{\chi ^2_{1-\alpha /2;\nu }}\ge \sigma ^2 \ge \dfrac {\nu S^2}{\chi ^2_{\alpha /2;\nu }}\right )=& 1-\alpha \end{align*} se obtém

    \begin{align*} P\left (\dfrac {(n-1)S^2}{\chi ^2_{\alpha /2;\nu }}\le \sigma ^2 \le \dfrac {(n-1) S^2}{\chi ^2_{1-\alpha /2;\nu }}\right )=& 1-\alpha . \end{align*}

    • a) A afirmativa probabilística anterior possibilita a construção do intervalo de \(1-\alpha \) de confiança para o parâmetro \(\sigma ^2\). O intervalo resultante é

      \begin{align*} IC_{1-\alpha }\left (\sigma ^2\right ):\,\,\left [\dfrac {(n-1)S^2}{\chi ^2_{\alpha /2;\nu }}, \,\, \dfrac {(n-1) S^2}{\chi ^2_{1-\alpha /2;\nu }}\right ]. \end{align*}

    • b) Obter limites na prática para estimar o parâmetro \(\sigma ^2\) e determinar a precisão do processo de estimação. A lógica é se repetirmos infinitas vezes a amostragem de tamanho \(n\) de uma população normal e construirmos este intervalo de confiança, em média \(100(1-\alpha )\%\) deles conterão (cobrirão) o verdadeiro valor \(\sigma ^2\) da variância da população. Em muitas aplicações de genética, tanto no melhoramento animal quanto vegetal e nas aplicações de controle de qualidade, entre muito outros casos, este parâmetro tem fundamental importância.

  • 7.2.9 Desenvolvendo a expressão apresentada, temos:

    \begin{align*} P\left (-t_{\alpha /2}\le \dfrac {\bar {X}-\mu }{\dfrac {S}{\sqrt {n}}}\le t_{\alpha /2}\right )=& 1-\alpha \\ P\left (-t_{\alpha /2}\dfrac {S}{\sqrt {n}}\le \bar {X}-\mu \le t_{\alpha /2}\dfrac {S}{\sqrt {n}}\right )= 1-\alpha & \\ P\left (-\bar {X}-t_{\alpha /2}\dfrac {S}{\sqrt {n}}\le -\mu \le -\bar {X}+ t_{\alpha /2}\dfrac {S}{\sqrt {n}}\right )=&1-\alpha \\ P\left (\bar {X}+t_{\alpha /2}\dfrac {S}{\sqrt {n}}\ge \mu \ge \bar {X}-t_{\alpha /2}\dfrac {S}{\sqrt {n}}\right )=&1-\alpha \\ P\left (\bar {X}-t_{\alpha /2}\dfrac {S}{\sqrt {n}}\le \mu \le \bar {X}+ t_{\alpha /2}\dfrac {S}{\sqrt {n}}\right )=& 1-\alpha . \end{align*}

    • a) A afirmativa probabilística anterior possibilita a construção do intervalo de \(1-\alpha \) de confiança para o parâmetro \(\mu \). O intervalo resultante é

      \begin{align*} IC_{1-\alpha }(\mu ):& \bar {X} \pm t_{\alpha /2;\nu } \dfrac {S}{\sqrt {n}}. \end{align*}

    • b) Obter intervalos de confiança para a média \(\mu \) de uma população normal, que pode ser aplica em situações de trabalhos corriqueiros, como em uma amostragem para determinar qual será a produção por ha de uma plantação de eucaliptos, como em áreas científicas.

  • 7.2.10 Vamos considerar \(X\) \(\sim \) \(N(\mu =\)9,5, \(\sigma ^2=9)\), então podemos determinar a distribuição de \(\bar {X}\), \(\min (X_i's)\) e \(\max (X_i)\) em uma amostra de tamanho \(n=20\).

    • a) No caso de \(\bar {X}\), temos que \(\bar {X}\) \(\sim \) \(N(\mu _{\bar {X}}=\)9,5 e \(\sigma ^2_{\bar {X}}=9/20)\). Portanto,

      \begin{align*} P(\bar {X} < 8) =& P\left (Z<\dfrac {8-9,5}{\frac {3}{\sqrt {20}}} \right )=P(Z<-2,24)\\ =& 0,0125=1,25\%. \end{align*}

    • b) Se \(X_{(1)}\) \(=\) \(\min (X_i,i=1,\cdots ,n)\), temos que a função de distribuição, sendo \(X_i\)’s normais independentes e identicamente distribuídas, é dada por

      \begin{align*} F_{X_{(1)}}(x) =& P(X_{(1)}\le x)=1-\left [1-F_X(x)\right ]^{20}, \end{align*} em que \(F_X(x)\) é a função de distribuição de uma variável aleatória \(X\) \(\sim \) \(N(\mu =\)9,5, \(\sigma ^2=9)\). Desejamos obter \(F_{X_{(1)}}(8)\). Logo,

      \begin{align*} F_{X_{(1)}}(8) =& P(X_{(1)}\le 8)=1-\left [1-P(X\le 8)\right ]^{20}\\ =& 1-\left [1-P\left (Z<\dfrac {8-9,5}{3}\right )\right ]^{20}\\ =& 1-\left [1-P\left (Z<-0,50\right )\right ]^{20}=1- \left (1-0,3085375\right )^{20}\\ =& 0,9993757. \end{align*} Assim, 99,94% das amostras normais desta população apresentam valor mínimo inferior a \(8\). Fizemos um programa em R para mostrar como isso acontece. Neste programa realizamos \(1000000\) de simulações e a estimativa que obtivemos foi de 0,999409 (vai variar se você repetir este processo, por se tratar de um processo aleatório). Veja o programa abaixo:

      mu <- 9.5
      sig <- 3
      x1 <- 11
      #probabilidade exata mínimo
      1 - (1 - pnorm(x1, mu, sig))^20
      #probabilidade exata máximo
      (pnorm(x1, mu, sig))^20
      N <- 1000000
      n <- 20
      X <- matrix(c(rnorm(N * n, mu, sig)), N, n)
      #estimativa da probabilidade
      #exata do mínimo por simulação
      x <- apply(X, 1, min)
      length(x[x < x1]) / N
      #estimativa da probabilidade
      #exata do máximo por simulação
      y <- apply(X, 1, max)
      length(y[y < x1]) / N
      
    • c) Se \(X_{(n)}\) \(=\) \(\max (X_i,i=1,\cdots ,n)\), temos que a função de distribuição, sendo \(X_i\)’s normais independentes e identicamente distribuídas, é dada por

      \begin{align*} F_{X_{(n)}}(x) =& P(X_{(n)}\le x)=\left [F_X(x)\right ]^{20}, \end{align*} em que \(F_X(x)\) é a função de distribuição de uma variável aleatória \(X\) \(\sim \) \(N(\mu =\)9,5, \(\sigma ^2=9)\). Desejamos obter \(F_{X_{(n)}}(11)\). Logo,

      \begin{align*} F_{X_{(n)}}(11) =& P(X_{(n)}\le 11)=\left [P(X\le 11)\right ]^{20}\\ =& \left [P\left (Z<\dfrac {11-9,5}{3}\right )\right ]^{20}\\ =& \left [P\left (Z\le 0,50\right )\right ]^{20}= \left (0,6914625\right )^{20}\\ =& 0,0006242696. \end{align*} Assim, 0,062% das amostras normais desta população apresentam valor máximo inferior a \(11\). Na simulação, cujo programa anterior incluí o caso do máximo, é de 0,0606%, que é uma estimativa razoável do valor encontrado. Assim, existe uma grande probabilidade de que as amostras desta população normal apresentem máximos superiores a \(11\), que é o complemento para \(1\) do valor apresentado.