Estatı́stica Básica
4.2 Resolução
-
4.2.1 A probabilidade é uma parte essencial da estatística para aqueles que querem desenvolver novos métodos de estimação e testes de hipóteses. A fundamentação de qualquer método estatístico só pode ser alcançada com o entendimento apropriado da sua teoria, que está contida na fundamentação da teoria probabilística. Assim, a formação adequada de um estatístico só pode ser conseguida após o aprendizado e entendimento das teorias desta área. Para os que pretendem fazer apenas uso da estatística, os conceitos de probabilidade são fundamentais para que se possa entender e aplicar métodos de inferência estatística.
-
4.2.2 O dendrograma (diagrama de árvore) para ajudar na construção do espaço amostral é:
O espaço amostral é obtido considerando todos os ramos desse diagrama de árvore e resulta em:
\(\seteqnumber{0}{4.}{0}\)\begin{align*} \Omega =&\big \{(FFFF),\,(FFFM),\,(FFMF),\,(FFMM),\,(FMFF),\,(FMFM),\\ & \,\,(FMMF),\,(FMMM),\, (MFFF),\,(MFFM),\,(MFMF),\,(MFMM),\\ & \,\,(MMFF),\,(MMFM),\,(MMMF),\,(MMMM)\big \}. \end{align*}
Cada ponto deste é equiprovável, pois as probabilidades de nascimento de fêmea e macho são iguais (leis da segregação de gametas de Mendel) e cada elemento de \(\Omega \) tem probabilidade \((1/2)^4=1/16\).
-
4.2.3 O espaço amostral para este exemplo deve retratar o tempo de vida operacional das máquinas agrícolas. Obviamente que este tempo é maior ou igual a \(0\), mas também é limitado. Embora seja limitado, na prática (vida real) não há como estabelecermos o valor deste limite com segurança, que se o fizéssemos seria um limite superior arbitrário (Mittelhammer 2013). Daí consideramos o limite superior como sendo \(+\infty \). Logo, o espaço amostral para este caso é
\(\seteqnumber{0}{4.}{0}\)\begin{align*} \Omega =& \left \{x|x\in \mathbb {R}, x\ge 0\right \}. \end{align*}
-
4.2.4 As probabilidades dos eventos de interesse são dadas a seguir, usando a medida clássica de probabilidade, considerando as cardinalidades dos eventos e do espaço amostral do exercício 4.2.2. A cardinalidade de \(\Omega \) é \(|\Omega |=16\) e a cardinalidade de um evento \(A\) é representada por \(|A|\), significando o número de elementos do subconjunto de \(\Omega \) determinado pelo evento \(A\).
-
a) nascimento de no máximo três fêmeas:
O evento de interesse “nascimento de no máximo três fêmeas” é dado pelo subconjunto de \(\Omega \):
\(\seteqnumber{0}{4.}{0}\)\begin{align*} A=&\big \{(FFFM),\,(FFMF),\,(FFMM),\,(FMFF),\,(FMFM),\,(FMMF),\\ & \,\,(FMMM),\,(MFFF),\,(MFFM),\,(MFMF),\,(MFMM),\,(MMFF),\\ & \,\,(MMFM),\,(MMMF),\,(MMMM)\big \}. \end{align*} Logo,
\(\seteqnumber{0}{4.}{0}\)\begin{align*} P(\textrm {nascimento de no máximo três fêmeas:}) =& P(A) = \dfrac {|A|}{|\Omega |} = \dfrac {15}{16}. \end{align*}
-
b) nascimento de pelo menos três fêmeas é representado pelo subconjunto:
\(\seteqnumber{0}{4.}{0}\)\begin{align*} B=&\big \{(FFFF),\,(FFFM),\,(FFMF),\,(FMFF),\,(MFFF)\big \}. \end{align*} Assim,
\(\seteqnumber{0}{4.}{0}\)\begin{align*} P(\textrm {nascimento de pelo menos três fêmeas}) =& P(B) =\dfrac {|B|}{|\Omega |}=\dfrac {5}{16}. \end{align*}
-
c) nascimento de exatamente três fêmeas é representado pelo subconjunto \(C\) de \(\Omega \):
\(\seteqnumber{0}{4.}{0}\)\begin{align*} C=&\big \{(FFFM),\,(FFMF),\,(FMFF),\,(MFFF)\big \}. \end{align*} Portanto,
\(\seteqnumber{0}{4.}{0}\)\begin{align*} P(\textrm {nascimento de exatamente três fêmeas}) =&P(C)=\dfrac {|C|}{|\Omega |}= \dfrac {4}{16}=\dfrac {1}{4}. \end{align*}
-
d) evento complementar de \(C\), \(C^c\):
\(\seteqnumber{0}{4.}{0}\)\begin{align*} P(C^c) =&P(\textrm {nascimento de um número diferente de três fêmeas})=1-P(C) \\ =& 1-\dfrac {1}{4}=\dfrac {3}{4}. \end{align*}
-
-
4.2.5 Exemplo da amostragem das famílias vegetais:
-
a) O espaço amostral é:
\(\seteqnumber{0}{4.}{0}\)\begin{align*} \Omega = & \left \{ \begin{array}{ccccc} (A,B),& (A,C),& (A,D),& (A,E),& (B,C), \\ (B,D),& (B,E),& (C,D),& (C,E),& (D,E) \\ \end {array} \right \} \end{align*}
-
b) O evento \(E_1\) é:
\(\seteqnumber{0}{4.}{0}\)\begin{align*} E_1 =& \left \{(D,E)\right \}. \end{align*}
-
c) O evento \(E_2\) é:
\(\seteqnumber{0}{4.}{0}\)\begin{align*} E_2 =& \left \{(A,B), (A,C), (B,C)\right \}. \end{align*}
-
d) Os eventos \(E_1\) e \(E_2\) são mutuamente excludentes, pois \(E_1\cap E_2\) \(=\) \(\phi \), ou seja, eles não possuem nenhum resultado em comum.
-
e) Eles não são complementares, pois apesar de serem mutuamente excludentes, a união deles não forma o espaço amostral \(\Omega \), ou seja, \(E_1\cup E_2\) \(\ne \) \(\Omega \).
-
f) O evento \(E_3\) é:
\(\seteqnumber{0}{4.}{0}\)\begin{align*} E_3 =& \left \{(A,B), (A,C), (A,D), (A,E) \right \}. \end{align*} O evento \(E_4\) é
\(\seteqnumber{0}{4.}{0}\)\begin{align*} E_4 =& \left \{(A,D),(B,D), (C,D), (D,E) \right \}. \end{align*} i) Os eventos \(E_3\) e \(E_4\) não são excludentes, pois possuem um resultado em comum;
ii) \(E_3\cap E_4\) \(=\) \(\left \{(A,D)\right \}\) \(\ne \) \(\phi \), corroborando a afirmação anterior.
-
-
4.2.6 Para o exemplo da amostragem das famílias vegetais e os eventos apresentados no exercício anterior, vamos considerar a definição clássica de probabilidade com espaço amostral com elementos equiprováveis.
-
a) As probabilidades de cada evento são:
\(\seteqnumber{0}{4.}{0}\)\begin{align*} P(E_1) =& \dfrac {|E_1|}{|\Omega |}= \dfrac {1}{10}=0,10,\\ P(E_2) =& \dfrac {|E_2|}{|\Omega |}= \dfrac {3}{10}=0,30,\\ P(E_3) =& \dfrac {|E_3|}{|\Omega |}= \dfrac {4}{10}=0,40,\\ P(E_4) =& \dfrac {|E_4|}{|\Omega |}= \dfrac {4}{10}=0,40.\\ \end{align*}
-
b) Temos que \(P(E_3\cap E_4)=\)0,10, \(P(E_4|E_3)=P(E_3\cap E_4)/P(E_3)\) \(=\) 0,10/0,40 \(=\) 0,25 e \(P(E_3|E_4)=P(E_3\cap E_4)/P(E_4)\) \(=\) 0,10/0,40 \(=\) 0,25. Logo, \(P(E_3)P(E_4|E_3)\) \(=\) 0,40\(\times \) 0,25 \(=\) 0,10 e \(P(E_4)P(E_3|E_4)\) \(=\) 0,40\(\times \) 0,25 \(=\) 0,10. Portanto, podemos confirmar que:
\(\seteqnumber{0}{4.}{0}\)\begin{align*} P(E_3\cap E_4) =& P(E_3)P(E_4|E_3)=P(E_4)P(E_3|E_4)=0,10, \end{align*} como esperado pelas propriedades das probabilidades condicionais.
-
c) As propriedades das probabilidades estão apresentadas a seguir. Do exercício anterior temos: \(P(E_3^c)\) \(=\) \(1-P(E_3)\) \(=\) 0,60, \(P(E_4^c)\) \(=\) 0,60, \(E_3^c\) \(=\) \(\{(B,C), (B,D), (B,E), (C,D), (C,E), (D,E)\}\), \(E_4^c\) \(=\) \(\{(A,B), (A,C), (A,E), (B,C), (B,E), (C,E)\}\), \(E_3^c\cup E_4^c\) \(=\) \(\{(A,B), (A,C), (A,E), (B,C), (B,D), (B,E), (C,D), (C,E), (D,E)\}\), \(P(E_3^c\cup E_4^c)\) \(=\) \(9/10\) \(=\) 0,90. Do mesmo modo
\(\seteqnumber{0}{4.}{0}\)\begin{align*} E_3\cup E_4 =& \{(A,B),(AC),(AD),(AE),(BD),(CD),(DE)\}\\ (E_3\cup E_4)^c =& \{(BC),(BE),(CE)\}\\ (E_3\cap E_4)^c =& \{(A,B),(AC),(AE),(BD),(BC),(BE),(CE), (CD),(DE)\}\\ (E_3^c\cap E_4^c)=&\{(B,C),\,(B,E),\,(C,E)\}\\ (E_3^c\cap E_4)=&\{(B,D),\,(C,D),\,(D,E)\} \end{align*} Assim, se usarmos a definição clássica em cada caso, temos a comprovação numérica a seguir. Neste Livro não fizemos provas algébricas (analíticas) destes casos.
-
i) \(P[(E_3 \cap E_4)^c]=P(E_3^c \cup E_4^c)=1-P(E_3 \cap E_4)\)
\(\seteqnumber{0}{4.}{0}\)\begin{align*} 1-P(E_3 \cap E_4)=& 0,90=1-0,10\\ 1-0,10=&0,90=0,90, \quad \textrm {CQM.} \end{align*}
-
ii) \(P[(E_3 \cup E_4)^c]=P(E_3^c \cap E_4^c)=1-P(E_3\cup E_4)\)
\(\seteqnumber{0}{4.}{0}\)\begin{align*} 0,30=& 0,30= 1-0,7=0,3, \quad \textrm {CQM.} \end{align*}
-
iii) \(P(E_3 \cap \phi )=P(\phi )=0\)
-
iv) \(P(E_3\cap \Omega )=P(E_3)=\)0,40
-
v) \(P(E_3\cup \phi )=P(E_3)=\)0,4
-
vi) \(P(E_3\cup \Omega )=P(\Omega )=1\)
-
vii) \(P(E_3\cap E_3^c)= P(\phi )=0\)
-
viii) \(P(E_3\cup E_3^c)= P(\Omega )=1\)
-
ix) \(P(\phi ^c)=P(\Omega )=1\)
-
x) \(P(\Omega ^c)=P(\phi )=0\)
-
xi) \(P(E_3^c)=1-P(E_3)\)
\(\seteqnumber{0}{4.}{0}\)\begin{align*} 0,60 =& 1-0,40=0,60, \quad \textrm {CQM.} \end{align*}
-
xii) \(P(E_4^c)=1-P(E_4)\)
\(\seteqnumber{0}{4.}{0}\)\begin{align*} 0,40=& 1-0,60=0,40, \quad \textrm {CQM.} \end{align*}
-
xiii) \(P(E_3^c\cap E_4)=P(E_4)-P(E_3\cap E_4)\)
\(\seteqnumber{0}{4.}{0}\)\begin{align*} 0,30 =& 0,40 - 0,10=0,30, \quad \textrm {CQM.} \end{align*}
-
-
d) Como \(P(E_3|E_4)=\)0,25 \(\ne \) \(P(E_3)\) e, do mesmo jeito, \(P(E_3\cap E_4)=\)0,1 \(\ne \) \(P(E_3)P(E_4)=\)0,16, então os eventos \(E_3\) e \(E_4\) não são independentes.
-
e) Como \(E_1\) e \(E_3\) são excludentes, eles não são independentes. Essa é uma confusão comum entre muitos leitores, não distinguir entre mutuamente excludentes e independência. Na verdade, se dois eventos são excludentes, eles não podem ser independentes. De outro modo, como \(P(E_1\cap E_3)=\)0,00 \(\ne \) \(P(E_1)P(E_3)\) \(=\) 0,04, os eventos \(E_1\) e \(E_3\) não são independentes.
-
-
4.2.7 Exemplo do gene marcador \(B\) e gene da resistência \(A\):
-
a) Para ser resistente o evento em relação aos genótipos deve ser \(AA\) ou \(Aa\), uma vez que o alelo \(A\) dominante confere a resistência e o alelo \(a\) é recessivo. Chamamos estes genótipos simplificadamente de \(A-\). A Tabela anterior relaciona este evento para os genótipos chamando-o de fenótipo “Resistente”. O fenótipo susceptível refere-se ao fenótipo \(aa\). Esta tabela é um resumo de uma tabela mais complexa (mostrada no último exercício) da distribuição conjunta dos dois genes em relação às suas classes genotípicas possíveis. Se denotarmos o evento “ser resistente” por \(R\) e genótipo marcador \(BB\) o outro evento. Assim, queremos \(P(R|BB)\), que é depende do evento \(R\cap BB\). A probabilidade deste caso é \(P(R\cap BB)\) \(=\) \((1-r^2)/4\). Logo,
\(\seteqnumber{0}{4.}{0}\)\begin{align*} P(R|BB) =& \dfrac {P(R\cap BB)}{P(BB)}=\dfrac {(1-r^2)/4}{(1-r^2)/4+ r^2/4}=1-r^2. \end{align*}
-
b) O gráfico almejado:
Se os genes forem independentes \((r=0,5)\), esta probabilidade é 0,75. Essa é frequência esperada em uma geração \(F_2\), para os genótipos \(AA\) (0,25) e \(Aa\) (0,50), olhando marginalmente para a segregação do gene \(A\). Assim, a probabilidade marginal é igual à probabilidade condicional. Se \(r<\)0,5, a probabilidade \(P(R|BB)>\)0,75, aumentando a chance de selecionar os genótipos relativos à resistência.
-
c) A tabela completa da distribuição genotípica é dada a seguir com as probabilidades dada em cada célula:
Genótipo do Marcador B Genótipo(A) \(BB\) \(Bb\) \(bb\) \(AA\) \((1-r)^2/4\) \(r(1-r)/2\) \(r^2/4\) \(Aa\) \(r(1-r)/2\) \((1-r)^2/2\) \(+\) \(r^2/2\) \(r(1-r)/2\) \(aa\) \(r^2/4\) \(r(1-r)/2\) \((1-r)^2/4\)
A probabilidade requerida é: \(P(AA|BB)\) \(=\) \(P(AABB)/P(BB)\) \(=\) \((1-r)^2/4/(1/4)\) \(=\) \((1-r)^2\), pois \(P(BB)\) \(=\) \((1-r)^2/4\) \(+\) \(r(-r)/2\) \(+\) \(r^2/4\) \(=\) \(1/4\). Se refizermos o gráfico para este caso, temos:
Se os genes forem independentes \((r=\)0,5\()\), esta probabilidade é 0,25. Essa é frequência esperada em uma geração \(F_2\), para os genótipos \(AA\) (0,25), olhando marginalmente para a segregação do gene \(A\). Assim, a probabilidade marginal é igual à probabilidade condicional. Se \(r<\)0,5, a probabilidade \(P(AA|BB)>\)0,25, aumentando a chance de selecionar os genótipos relativos à resistência na classe genotípica \(AA\) apenas. Este procedimento é muitas vezes usados, pois na vida real não podemos ver os genótipos das plantas em relação aos genes de interesse (o da resistência no caso) e muitas vezes, nem podemos selecionar pelo fenótipo, pela impossibilidade de inocular o microorganismo no campo. Portanto, tomamos um marcador ligado e selecionamos por meio dele. Quanto maior a ligação, ou seja, quanto mais próximo de \(0\) estiver \(r\), maior será a chance de termos sucesso em obtermos um genótipo favorável entre os selecionados pelo genótipo do marcador (o qual podemos ver usando técnicas de laboratórios).
-