EB

Estatı́stica Básica

\(\newcommand{\footnotename}{footnote}\) \(\def \LWRfootnote {1}\) \(\newcommand {\footnote }[2][\LWRfootnote ]{{}^{\mathrm {#1}}}\) \(\newcommand {\footnotemark }[1][\LWRfootnote ]{{}^{\mathrm {#1}}}\) \(\let \LWRorighspace \hspace \) \(\renewcommand {\hspace }{\ifstar \LWRorighspace \LWRorighspace }\) \(\newcommand {\mathnormal }[1]{{#1}}\) \(\newcommand \ensuremath [1]{#1}\) \(\newcommand {\LWRframebox }[2][]{\fbox {#2}} \newcommand {\framebox }[1][]{\LWRframebox } \) \(\newcommand {\setlength }[2]{}\) \(\newcommand {\addtolength }[2]{}\) \(\newcommand {\setcounter }[2]{}\) \(\newcommand {\addtocounter }[2]{}\) \(\newcommand {\arabic }[1]{}\) \(\newcommand {\number }[1]{}\) \(\newcommand {\noalign }[1]{\text {#1}\notag \\}\) \(\newcommand {\cline }[1]{}\) \(\newcommand {\directlua }[1]{\text {(directlua)}}\) \(\newcommand {\luatexdirectlua }[1]{\text {(directlua)}}\) \(\newcommand {\protect }{}\) \(\def \LWRabsorbnumber #1 {}\) \(\def \LWRabsorbquotenumber "#1 {}\) \(\newcommand {\LWRabsorboption }[1][]{}\) \(\newcommand {\LWRabsorbtwooptions }[1][]{\LWRabsorboption }\) \(\def \mathchar {\ifnextchar "\LWRabsorbquotenumber \LWRabsorbnumber }\) \(\def \mathcode #1={\mathchar }\) \(\let \delcode \mathcode \) \(\let \delimiter \mathchar \) \(\def \oe {\unicode {x0153}}\) \(\def \OE {\unicode {x0152}}\) \(\def \ae {\unicode {x00E6}}\) \(\def \AE {\unicode {x00C6}}\) \(\def \aa {\unicode {x00E5}}\) \(\def \AA {\unicode {x00C5}}\) \(\def \o {\unicode {x00F8}}\) \(\def \O {\unicode {x00D8}}\) \(\def \l {\unicode {x0142}}\) \(\def \L {\unicode {x0141}}\) \(\def \ss {\unicode {x00DF}}\) \(\def \SS {\unicode {x1E9E}}\) \(\def \dag {\unicode {x2020}}\) \(\def \ddag {\unicode {x2021}}\) \(\def \P {\unicode {x00B6}}\) \(\def \copyright {\unicode {x00A9}}\) \(\def \pounds {\unicode {x00A3}}\) \(\let \LWRref \ref \) \(\renewcommand {\ref }{\ifstar \LWRref \LWRref }\) \( \newcommand {\multicolumn }[3]{#3}\) \(\require {textcomp}\) \(\newcommand {\intertext }[1]{\text {#1}\notag \\}\) \(\let \Hat \hat \) \(\let \Check \check \) \(\let \Tilde \tilde \) \(\let \Acute \acute \) \(\let \Grave \grave \) \(\let \Dot \dot \) \(\let \Ddot \ddot \) \(\let \Breve \breve \) \(\let \Bar \bar \) \(\let \Vec \vec \) \(\require {mathtools}\) \(\newenvironment {crampedsubarray}[1]{}{}\) \(\newcommand {\smashoperator }[2][]{#2\limits }\) \(\newcommand {\SwapAboveDisplaySkip }{}\) \(\newcommand {\LaTeXunderbrace }[1]{\underbrace {#1}}\) \(\newcommand {\LaTeXoverbrace }[1]{\overbrace {#1}}\) \(\newcommand {\LWRmultlined }[1][]{\begin {multline*}}\) \(\newenvironment {multlined}[1][]{\LWRmultlined }{\end {multline*}}\) \(\let \LWRorigshoveleft \shoveleft \) \(\renewcommand {\shoveleft }[1][]{\LWRorigshoveleft }\) \(\let \LWRorigshoveright \shoveright \) \(\renewcommand {\shoveright }[1][]{\LWRorigshoveright }\) \(\newcommand {\shortintertext }[1]{\text {#1}\notag \\}\) \(\newcommand {\vcentcolon }{\mathrel {\unicode {x2236}}}\) \(\newcommand {\bm }[1]{\boldsymbol {#1}}\) \(\require {cancel}\) \(\newcommand {\firsthdashline }[1][]{\hdashline }\) \(\let \lasthdashline \firsthdashline \) \(\let \cdashline \cline \) \(\require {colortbl}\) \(\let \LWRorigcolumncolor \columncolor \) \(\renewcommand {\columncolor }[2][named]{\LWRorigcolumncolor [#1]{#2}\LWRabsorbtwooptions }\) \(\let \LWRorigrowcolor \rowcolor \) \(\renewcommand {\rowcolor }[2][named]{\LWRorigrowcolor [#1]{#2}\LWRabsorbtwooptions }\) \(\let \LWRorigcellcolor \cellcolor \) \(\renewcommand {\cellcolor }[2][named]{\LWRorigcellcolor [#1]{#2}\LWRabsorbtwooptions }\) \(\newcommand {\tcbset }[1]{}\) \(\newcommand {\tcbsetforeverylayer }[1]{}\) \(\newcommand {\tcbox }[2][]{\boxed {\text {#2}}}\) \(\newcommand {\tcboxfit }[2][]{\boxed {#2}}\) \(\newcommand {\tcblower }{}\) \(\newcommand {\tcbline }{}\) \(\newcommand {\tcbtitle }{}\) \(\newcommand {\tcbsubtitle [2][]{\mathrm {#2}}}\) \(\newcommand {\tcboxmath }[2][]{\boxed {#2}}\) \(\newcommand {\tcbhighmath }[2][]{\boxed {#2}}\)

4.2 Resolução

  • 4.2.1 A probabilidade é uma parte essencial da estatística para aqueles que querem desenvolver novos métodos de estimação e testes de hipóteses. A fundamentação de qualquer método estatístico só pode ser alcançada com o entendimento apropriado da sua teoria, que está contida na fundamentação da teoria probabilística. Assim, a formação adequada de um estatístico só pode ser conseguida após o aprendizado e entendimento das teorias desta área. Para os que pretendem fazer apenas uso da estatística, os conceitos de probabilidade são fundamentais para que se possa entender e aplicar métodos de inferência estatística.

  • 4.2.2 O dendrograma (diagrama de árvore) para ajudar na construção do espaço amostral é:

    (-tikz- diagram)
    (-tikz- diagram)

    O espaço amostral é obtido considerando todos os ramos desse diagrama de árvore e resulta em:

    \begin{align*} \Omega =&\big \{(FFFF),\,(FFFM),\,(FFMF),\,(FFMM),\,(FMFF),\,(FMFM),\\ & \,\,(FMMF),\,(FMMM),\, (MFFF),\,(MFFM),\,(MFMF),\,(MFMM),\\ & \,\,(MMFF),\,(MMFM),\,(MMMF),\,(MMMM)\big \}. \end{align*}

    Cada ponto deste é equiprovável, pois as probabilidades de nascimento de fêmea e macho são iguais (leis da segregação de gametas de Mendel) e cada elemento de \(\Omega \) tem probabilidade \((1/2)^4=1/16\).

  • 4.2.3 O espaço amostral para este exemplo deve retratar o tempo de vida operacional das máquinas agrícolas. Obviamente que este tempo é maior ou igual a \(0\), mas também é limitado. Embora seja limitado, na prática (vida real) não há como estabelecermos o valor deste limite com segurança, que se o fizéssemos seria um limite superior arbitrário (Mittelhammer 2013). Daí consideramos o limite superior como sendo \(+\infty \). Logo, o espaço amostral para este caso é

    \begin{align*} \Omega =& \left \{x|x\in \mathbb {R}, x\ge 0\right \}. \end{align*}

  • 4.2.4 As probabilidades dos eventos de interesse são dadas a seguir, usando a medida clássica de probabilidade, considerando as cardinalidades dos eventos e do espaço amostral do exercício 4.2.2. A cardinalidade de \(\Omega \) é \(|\Omega |=16\) e a cardinalidade de um evento \(A\) é representada por \(|A|\), significando o número de elementos do subconjunto de \(\Omega \) determinado pelo evento \(A\).

    • a) nascimento de no máximo três fêmeas:

      O evento de interesse “nascimento de no máximo três fêmeas” é dado pelo subconjunto de \(\Omega \):

      \begin{align*} A=&\big \{(FFFM),\,(FFMF),\,(FFMM),\,(FMFF),\,(FMFM),\,(FMMF),\\ & \,\,(FMMM),\,(MFFF),\,(MFFM),\,(MFMF),\,(MFMM),\,(MMFF),\\ & \,\,(MMFM),\,(MMMF),\,(MMMM)\big \}. \end{align*} Logo,

      \begin{align*} P(\textrm {nascimento de no máximo três fêmeas:}) =& P(A) = \dfrac {|A|}{|\Omega |} = \dfrac {15}{16}. \end{align*}

    • b) nascimento de pelo menos três fêmeas é representado pelo subconjunto:

      \begin{align*} B=&\big \{(FFFF),\,(FFFM),\,(FFMF),\,(FMFF),\,(MFFF)\big \}. \end{align*} Assim,

      \begin{align*} P(\textrm {nascimento de pelo menos três fêmeas}) =& P(B) =\dfrac {|B|}{|\Omega |}=\dfrac {5}{16}. \end{align*}

    • c) nascimento de exatamente três fêmeas é representado pelo subconjunto \(C\) de \(\Omega \):

      \begin{align*} C=&\big \{(FFFM),\,(FFMF),\,(FMFF),\,(MFFF)\big \}. \end{align*} Portanto,

      \begin{align*} P(\textrm {nascimento de exatamente três fêmeas}) =&P(C)=\dfrac {|C|}{|\Omega |}= \dfrac {4}{16}=\dfrac {1}{4}. \end{align*}

    • d) evento complementar de \(C\), \(C^c\):

      \begin{align*} P(C^c) =&P(\textrm {nascimento de um número diferente de três fêmeas})=1-P(C) \\ =& 1-\dfrac {1}{4}=\dfrac {3}{4}. \end{align*}

  • 4.2.5 Exemplo da amostragem das famílias vegetais:

    • a) O espaço amostral é:

      \begin{align*} \Omega = & \left \{ \begin{array}{ccccc} (A,B),& (A,C),& (A,D),& (A,E),& (B,C), \\ (B,D),& (B,E),& (C,D),& (C,E),& (D,E) \\ \end {array} \right \} \end{align*}

    • b) O evento \(E_1\) é:

      \begin{align*} E_1 =& \left \{(D,E)\right \}. \end{align*}

    • c) O evento \(E_2\) é:

      \begin{align*} E_2 =& \left \{(A,B), (A,C), (B,C)\right \}. \end{align*}

    • d) Os eventos \(E_1\) e \(E_2\) são mutuamente excludentes, pois \(E_1\cap E_2\) \(=\) \(\phi \), ou seja, eles não possuem nenhum resultado em comum.

    • e) Eles não são complementares, pois apesar de serem mutuamente excludentes, a união deles não forma o espaço amostral \(\Omega \), ou seja, \(E_1\cup E_2\) \(\ne \) \(\Omega \).

    • f) O evento \(E_3\) é:

      \begin{align*} E_3 =& \left \{(A,B), (A,C), (A,D), (A,E) \right \}. \end{align*} O evento \(E_4\) é

      \begin{align*} E_4 =& \left \{(A,D),(B,D), (C,D), (D,E) \right \}. \end{align*} i) Os eventos \(E_3\) e \(E_4\) não são excludentes, pois possuem um resultado em comum;

      ii) \(E_3\cap E_4\) \(=\) \(\left \{(A,D)\right \}\) \(\ne \) \(\phi \), corroborando a afirmação anterior.

  • 4.2.6 Para o exemplo da amostragem das famílias vegetais e os eventos apresentados no exercício anterior, vamos considerar a definição clássica de probabilidade com espaço amostral com elementos equiprováveis.

    • a) As probabilidades de cada evento são:

      \begin{align*} P(E_1) =& \dfrac {|E_1|}{|\Omega |}= \dfrac {1}{10}=0,10,\\ P(E_2) =& \dfrac {|E_2|}{|\Omega |}= \dfrac {3}{10}=0,30,\\ P(E_3) =& \dfrac {|E_3|}{|\Omega |}= \dfrac {4}{10}=0,40,\\ P(E_4) =& \dfrac {|E_4|}{|\Omega |}= \dfrac {4}{10}=0,40.\\ \end{align*}

    • b) Temos que \(P(E_3\cap E_4)=\)0,10, \(P(E_4|E_3)=P(E_3\cap E_4)/P(E_3)\) \(=\) 0,10/0,40 \(=\) 0,25 e \(P(E_3|E_4)=P(E_3\cap E_4)/P(E_4)\) \(=\) 0,10/0,40 \(=\) 0,25. Logo, \(P(E_3)P(E_4|E_3)\) \(=\) 0,40\(\times \) 0,25 \(=\) 0,10 e \(P(E_4)P(E_3|E_4)\) \(=\) 0,40\(\times \) 0,25 \(=\) 0,10. Portanto, podemos confirmar que:

      \begin{align*} P(E_3\cap E_4) =& P(E_3)P(E_4|E_3)=P(E_4)P(E_3|E_4)=0,10, \end{align*} como esperado pelas propriedades das probabilidades condicionais.

    • c) As propriedades das probabilidades estão apresentadas a seguir. Do exercício anterior temos: \(P(E_3^c)\) \(=\) \(1-P(E_3)\) \(=\) 0,60, \(P(E_4^c)\) \(=\) 0,60, \(E_3^c\) \(=\) \(\{(B,C), (B,D), (B,E), (C,D), (C,E), (D,E)\}\), \(E_4^c\) \(=\) \(\{(A,B), (A,C), (A,E), (B,C), (B,E), (C,E)\}\), \(E_3^c\cup E_4^c\) \(=\) \(\{(A,B), (A,C), (A,E), (B,C), (B,D), (B,E), (C,D), (C,E), (D,E)\}\), \(P(E_3^c\cup E_4^c)\) \(=\) \(9/10\) \(=\) 0,90. Do mesmo modo

      \begin{align*} E_3\cup E_4 =& \{(A,B),(AC),(AD),(AE),(BD),(CD),(DE)\}\\ (E_3\cup E_4)^c =& \{(BC),(BE),(CE)\}\\ (E_3\cap E_4)^c =& \{(A,B),(AC),(AE),(BD),(BC),(BE),(CE), (CD),(DE)\}\\ (E_3^c\cap E_4^c)=&\{(B,C),\,(B,E),\,(C,E)\}\\ (E_3^c\cap E_4)=&\{(B,D),\,(C,D),\,(D,E)\} \end{align*} Assim, se usarmos a definição clássica em cada caso, temos a comprovação numérica a seguir. Neste Livro não fizemos provas algébricas (analíticas) destes casos.

      • i) \(P[(E_3 \cap E_4)^c]=P(E_3^c \cup E_4^c)=1-P(E_3 \cap E_4)\)

        \begin{align*} 1-P(E_3 \cap E_4)=& 0,90=1-0,10\\ 1-0,10=&0,90=0,90, \quad \textrm {CQM.} \end{align*}

      • ii) \(P[(E_3 \cup E_4)^c]=P(E_3^c \cap E_4^c)=1-P(E_3\cup E_4)\)

        \begin{align*} 0,30=& 0,30= 1-0,7=0,3, \quad \textrm {CQM.} \end{align*}

      • iii) \(P(E_3 \cap \phi )=P(\phi )=0\)

      • iv) \(P(E_3\cap \Omega )=P(E_3)=\)0,40

      • v) \(P(E_3\cup \phi )=P(E_3)=\)0,4

      • vi) \(P(E_3\cup \Omega )=P(\Omega )=1\)

      • vii) \(P(E_3\cap E_3^c)= P(\phi )=0\)

      • viii) \(P(E_3\cup E_3^c)= P(\Omega )=1\)

      • ix) \(P(\phi ^c)=P(\Omega )=1\)

      • x) \(P(\Omega ^c)=P(\phi )=0\)

      • xi) \(P(E_3^c)=1-P(E_3)\)

        \begin{align*} 0,60 =& 1-0,40=0,60, \quad \textrm {CQM.} \end{align*}

      • xii) \(P(E_4^c)=1-P(E_4)\)

        \begin{align*} 0,40=& 1-0,60=0,40, \quad \textrm {CQM.} \end{align*}

      • xiii) \(P(E_3^c\cap E_4)=P(E_4)-P(E_3\cap E_4)\)

        \begin{align*} 0,30 =& 0,40 - 0,10=0,30, \quad \textrm {CQM.} \end{align*}

    • d) Como \(P(E_3|E_4)=\)0,25 \(\ne \) \(P(E_3)\) e, do mesmo jeito, \(P(E_3\cap E_4)=\)0,1 \(\ne \) \(P(E_3)P(E_4)=\)0,16, então os eventos \(E_3\) e \(E_4\) não são independentes.

    • e) Como \(E_1\) e \(E_3\) são excludentes, eles não são independentes. Essa é uma confusão comum entre muitos leitores, não distinguir entre mutuamente excludentes e independência. Na verdade, se dois eventos são excludentes, eles não podem ser independentes. De outro modo, como \(P(E_1\cap E_3)=\)0,00 \(\ne \) \(P(E_1)P(E_3)\) \(=\) 0,04, os eventos \(E_1\) e \(E_3\) não são independentes.

  • 4.2.7 Exemplo do gene marcador \(B\) e gene da resistência \(A\):

    • a) Para ser resistente o evento em relação aos genótipos deve ser \(AA\) ou \(Aa\), uma vez que o alelo \(A\) dominante confere a resistência e o alelo \(a\) é recessivo. Chamamos estes genótipos simplificadamente de \(A-\). A Tabela anterior relaciona este evento para os genótipos chamando-o de fenótipo “Resistente”. O fenótipo susceptível refere-se ao fenótipo \(aa\). Esta tabela é um resumo de uma tabela mais complexa (mostrada no último exercício) da distribuição conjunta dos dois genes em relação às suas classes genotípicas possíveis. Se denotarmos o evento “ser resistente” por \(R\) e genótipo marcador \(BB\) o outro evento. Assim, queremos \(P(R|BB)\), que é depende do evento \(R\cap BB\). A probabilidade deste caso é \(P(R\cap BB)\) \(=\) \((1-r^2)/4\). Logo,

      \begin{align*} P(R|BB) =& \dfrac {P(R\cap BB)}{P(BB)}=\dfrac {(1-r^2)/4}{(1-r^2)/4+ r^2/4}=1-r^2. \end{align*}

    • b) O gráfico almejado:

      (-tikz- diagram)

      Se os genes forem independentes \((r=0,5)\), esta probabilidade é 0,75. Essa é frequência esperada em uma geração \(F_2\), para os genótipos \(AA\) (0,25) e \(Aa\) (0,50), olhando marginalmente para a segregação do gene \(A\). Assim, a probabilidade marginal é igual à probabilidade condicional. Se \(r<\)0,5, a probabilidade \(P(R|BB)>\)0,75, aumentando a chance de selecionar os genótipos relativos à resistência.

    • c) A tabela completa da distribuição genotípica é dada a seguir com as probabilidades dada em cada célula:

      .
      Genótipo do Marcador B
      Genótipo(A) \(BB\) \(Bb\) \(bb\)
      \(AA\) \((1-r)^2/4\) \(r(1-r)/2\) \(r^2/4\)
      \(Aa\) \(r(1-r)/2\) \((1-r)^2/2\) \(+\) \(r^2/2\) \(r(1-r)/2\)
      \(aa\) \(r^2/4\) \(r(1-r)/2\) \((1-r)^2/4\)

    A probabilidade requerida é: \(P(AA|BB)\) \(=\) \(P(AABB)/P(BB)\) \(=\) \((1-r)^2/4/(1/4)\) \(=\) \((1-r)^2\), pois \(P(BB)\) \(=\) \((1-r)^2/4\) \(+\) \(r(-r)/2\) \(+\) \(r^2/4\) \(=\) \(1/4\). Se refizermos o gráfico para este caso, temos:

    (-tikz- diagram)

    Se os genes forem independentes \((r=\)0,5\()\), esta probabilidade é 0,25. Essa é frequência esperada em uma geração \(F_2\), para os genótipos \(AA\) (0,25), olhando marginalmente para a segregação do gene \(A\). Assim, a probabilidade marginal é igual à probabilidade condicional. Se \(r<\)0,5, a probabilidade \(P(AA|BB)>\)0,25, aumentando a chance de selecionar os genótipos relativos à resistência na classe genotípica \(AA\) apenas. Este procedimento é muitas vezes usados, pois na vida real não podemos ver os genótipos das plantas em relação aos genes de interesse (o da resistência no caso) e muitas vezes, nem podemos selecionar pelo fenótipo, pela impossibilidade de inocular o microorganismo no campo. Portanto, tomamos um marcador ligado e selecionamos por meio dele. Quanto maior a ligação, ou seja, quanto mais próximo de \(0\) estiver \(r\), maior será a chance de termos sucesso em obtermos um genótipo favorável entre os selecionados pelo genótipo do marcador (o qual podemos ver usando técnicas de laboratórios).