Estatı́stica Básica
5.2 Resolução
-
5.2.1 O dendrograma (diagrama de árvore) é:
O espaço amostral é obtido considerando todos os ramos desse diagrama de árvore e resulta em:
Cada ponto deste é equiprovável, pois as probabilidades de nascimento de fêmea e macho são iguais e cada elemento de
tem probabilidade .-
a) A distribuição de probabilidade da variável aleatória
, definida como sendo o número de fêmeas, é:Por exemplo, a probabilidade
é obtida pelo número total de pontos de em que , que no caso é igual a , em relação ao número total de pontos, que é igual a . -
b) Os resultados para os eventos solicitados são:
-
i)
0,3750=37,50%; -
ii) Se
representa o número de machos, o evento equivale a , pois se houver macho na ninhada, isto implica em duas fêmeas; se houver machos, implica em fêmea; e se houver machos, implica em fêmea. Assim, a probabilidade do evento é: 0,8750=87,50%; -
iii)
0,50=50%; -
iv)
0,50=50%.
-
-
c) O número esperado
de ninhadas de filhotes com exatamente fêmea é dado pelo produto da probabilidade do evento pelo número total de ninhadas, ou seja, é ninhadas. Assim, das esperamos que tenham exatamente fêmea.
-
-
5.2.2 Neste caso assumimos que
, definida como o número de fêmeas, possui distribuição binomial com parâmetros e . A probabilidade de sucesso não é , de acordo com as leis de Mendel, pois há um distúrbio genético na raça. Usualmente usamos a seguinte notação para dizer a mesma coisa que acabamos de explicar: .-
a) Para obtermos a distribuição de probabilidade de
, podemos utilizar o modelo binomial dado por: para , , , .Por exemplo, para a probabilidade
temos:Assim, temos a seguinte distribuição de probabilidades:
0,0198 0,1318 0,3296 0,3662 0,1526 -
b) A média é:
2,5; e a variância é: 0,9375. -
c) O número esperado
de ninhadas é dado pelo produto da probabilidade do evento de interesse pelo número total de ninhadas. Por exemplo, para , temos 0,0198 19,8 20 ninhadas com nenhuma fêmea. Os demais valores (arredondados) estão apresentados na tabela a seguir:0,0198 0,1318 0,3296 0,3662 0,1526 20 132 330 366 153
-
-
5.2.3 Resposta para cada uma das questões:
-
a) O modelo probabilístico adequado é o modelo Poisson, principalmente se pudermos supor que a distribuição das bactérias pela lâmina seja aleatória. Assim,
Poisson . -
b) NE
. Para obtermos a probabilidade do evento de interesse devemos usar o modelo Poisson dado por: para , , , e .Assim,
, sendoPortanto,
e o número esperado de quadrados com no máximo bactéria é NE 0,0916 . -
c)
. Como esta soma possui um número infinito de termos e sabendo que a soma de todos as probabilidades é igual a , então -
d)
1,83%.
-
-
5.2.4 A ocorrência de doenças por ano pode ser modelada, se for aleatória, pelo modelo Poisson. Assim,
Poisson .-
a) A média é
-
b) O parâmetro
pode ser estimado por 0,85. Assim, podemos estimar a distribuição de probabilidade utilizando o modelo Poisson por:Para
e , para fins de ilustração, temos:Estas e as demais probabilidades são apresentadas na tabela seguinte:
ou mais0,4274 0,3633 0,1544 0,0437 0,0093 0,0016 0,0003 -
c) A frequência esperada é dada pelo produtos das probabilidades por 120. Logo,
ou mais0,4274 0,3633 0,1544 0,0437 0,0093 0,0016 0,0003 51,29 43,60 18,53 5,24 1,12 0,19 0,04 -
d) Como as frequências observadas e esperadas estão relativamente próximas, podemos considerar que o modelo Poisson é adequado para modelar a ocorrência da doença na região estudada.
-
-
5.2.5 Distribuição uniforme discreta entre
e .-
a) Como o suporte da variável
, tamanho da amostra, é de , temos e , para outros valores de . -
b) Se o custo de cada planta é de R$ 1,50, considerando
, e como a média da uniforme é então o custo médio semanal é de 1,50 25,5 38,25 unidades monetárias. Se denotarmos o custo por e verificarmos que o custo é uma função de , dada por 1,50 , então 1,5 . Daí obtivemos o resultado anterior. -
c) A variância de
é Como o custo pode ser interpretado por uma transformação de , dada por 1,54 . Temos que a variância do custo é 1,5 18,5625. -
d) Do teorema de Tchebichev temos
Como deve ser substituído pela variável aleatória (custo), então temos: Assim, devemos achar tal que 0,95, que resulta em 4,4721. O intervalo almejado é portanto: Assim, ao menos das semanas terão custos entre 18,98 e 57,52 unidades monetárias. -
e) A função de distribuição é dada por
Assim, temos21 22 23 24 25 26 27 28 29 30 0,10 0,20 0,30 0,40 0,50 0,60 0,70 0,80 0,90 1,00
-
-
5.2.6 Como
é binomial, então e . Logo:-
a) Com
e 0,1 temos e 2,70. Assim, para temos Para temos, -
b) Com
e 0,5 temos e 7,5. Assim, para temos Para temos Para temos -
c) Com
e 0,9 temos e 2,7. Assim, para temos Para temos
-
-
5.2.7 Supondo que o modelo binomial é apropriado para modelar este caso e que
é número de sementes germinadas em um lote de com 0,95 (admitido por hipótese que é o real valor da probabilidade do sucesso), então a probabilidade almejada é: . Logo, sob a hipótese de que 0,95, temosO lote tem uma probabilidade de 97,18% de chance de ser comprado.
A média e a variância são:
e 4,75. Podemos expressar o resultado do teorema de Tchebichev por Logo, temos que 4,75 . Logo, temos que o valor absoluto de é 2,29. Assim, temos que é um valor conservador, como esperado pelo resultado do próprio teorema. -
5.2.8 A função de probabilidade da hipergeométrica neste caso, com
e , é: para , equivalendo a que resulta em , que resulta ainda em . No experimento específico, observamos . Logo, o modelo fica Devemos maximizar esta probabilidade em relação a . Um caminho é fazer isso com uso de uma planilha, considerando vários valores de .Fizemos uma função em
e observamos graficamente que o máximo se dá quando . O gráfico a seguir mostra este gráfico, destacando o ponto de máximo. O programa que usamos é apresentado logo após o gráfico, tendo sido adaptado da internet.Programa: adaptado de http://www.sci.csueastbay.edu/~btrumbo/Stat3401/Assign3401/A24.pdf
r <- 30 # red balls in urn k <- 32 # balls drawn x <- 2 # red balls drawn cand <- ceiling(r*k/x) - 1 t <- seq(round(.9*cand), round(1.1*cand)) px <- dhyper(x, r, t-r, k) mle <- t[px==max(px)] plot(t, px, type="l",ylab = "P(X=x)") lines(c(mle,mle),c(max(px),min(px)),col=2) mle # MLE as verified by program cand # MLE from theory
A segunda alternativa é direta pelo máximo da função de probabilidade geométrica em relação à
. O valor de . Assim, o máximo pode ser dado tanto por quanto por . Assim, se calcularmos as probabilidades para estes dois valores, veremos que é maximizado quando . Este programa mesmo possui um erro, pois considera apenas uma possibilidade de máximo com valor inteiro da solução inicial . Um exemplo em que ele falha é com , e . Neste caso o máximo é e a solução do programa é , objeto cand. -
5.2.9 Se considerarmos que a distribuição do esporo do fungo ocorre de forma aleatória é razoável adotar o modelo Poisson para calcularmos a probabilidade. Assim, se o número médio por cm
é de 0,05, então em cm , teremos uma média de esporos. Portanto, se refere-se ao número de esporos por cm de solo, então Poi . As probabilidades solicitadas são:-
a)
. -
b)
.
-
-
5.2.10 A distribuição do número de falhas
(nascimento de machos) até a ocorrência do primeiro sucesso (nascimento de uma fêmea) em um programa de inseminação artificial é a geométrica cuja função de probabilidade é para , , , , com 0,5. O número de inseminações é portanto .-
a) Para garantir pelo menos
de chance de se obter um sucesso são necessários o nascimento de macho antes da ocorrência da primeira fêmea, de acordo com a seguinte afirmativa probabilística: A soma da direita refere-se a soma de uma progressão geométrica com razão 0,5 e primeiro termo igual a 0,5. Logo, esta soma é igual aAssim,
cuja solução é Portanto, são necessários ao menos inseminações para garantir o primeiro sucesso (nascimento de uma fêmea) com pelo menos de probabilidade. Se considerarmos esse mesmo problema, mas com um valor geral de , a razão da soma é e o primeiro termo é . Consideremos que o valor de seja substituído por uma probabilidade mínima , para tornar geral o problema. Logo, Se denotarmos, ainda, a soma das probabilidades acumuladas até por , teremos . Logo, a solução geral é -
b) Esperar “até” a terceira tentativa para ter o primeiro sucesso significa que a probabilidade desejada implica ter
fracassos antes de nascer a primeira fêmea na terceira tentativa (inseminação) ou fracasso na segunda tentativa ou sucesso na primeira tentativa. Essa probabilidade é dada por
-
-
5.2.11 Este caso refere-se ao mesmo experimento anterior, porém com a espera de mais de um sucesso em repetições dos ensaios Bernoulli (inseminações). Assim, temos que o modelo adequado é a binomial negativa. A função de probabilidade com
sucessos e probabilidade de sucesso da variável referente ao número de fracassos até o -ésimo sucesso é: para , , , , . Temos ainda que 0,5 é a probabilidade de nascer fêmea em uma inseminação.-
a) Para se ter segundo sucesso no terceira inseminação, indica que tivemos
fracasso, antes de este último sucesso ocorrer. Logo, a probabilidade desejada -
b) Este caso é um pouco mais complexo que o caso da geométrica, pois em nossa soma dos termos das probabilidades acumuladas, não teremos uma progressão geométrica como naquele caso. Assim, a alternativa é computar as probabilidades acumuladas até que o valor mínimo da probabilidade solicitado (no caso
) seja alcançado. Portanto, usando um programa para auxilar temos que não garante o mínimo de . Avançamos para o próximo valor de e obtivemos que, novamente, não garante o mínimo de . Se prosseguirmos com este método veremos que 0,9453125 e 0,9672852. Assim, necessitamos de ao menos fracassos antes do terceiro sucesso. Assim, o número total de inseminações necessárias são inseminações para garantir com ao menos de chance que o terceiro sucesso (nascimento da terceira fêmea) ocorra. -
c) O valor esperado (com
) é Assim precisamos de em média fracassos para se ter para se alcançar os três sucessos. Assim, o valor médio de inseminações necessárias é igual a .
-
-
5.2.12 Este caso, temos a distribuição de uma variável binomial condicionado às condições
e . Logo, para o primeiro caso Assim, considerando uma binomial com e 0,5, esta função de probabilidade fica Computamos as probabilidades em cada caso e os resultados são:1 2 3 4 5 6 7 8 0,0314 0,1098 0,2196 0,2745 0,2196 0,1098 0,0314 0,0039 Podemos verificar que a soma dos valores em relação ao novo conjunto suporte resulta em
.Para o segundo caso, o procedimento é semelhante:
Assim, esta função de probabilidade é Computamos as probabilidades em cada caso e os resultados são:2 3 4 5 6 7 8 0,1134 0,2267 0,2834 0,2267 0,1134 0,0324 0,0040 -
5.2.13 A função de probabilidade da distribuição beta binomial com parâmetros
e é dado por para , , , , . Se considerarmos temos que , e Assim, para , , , , e representa a função de probabilidade de uma uniforme discreta com elementos em seu suporte, como queríamos mostrar.A média e a variância são:
A média e a variância de uma variável aleatória com distribuição uniforme discreta com suporte em , , , , são Se fizermos e , teremos exatamente as quantidades anteriormente apresentadas, após algumas simplificações algébricas. -
5.2.14 Vamos demonstrar a média e a variância da uniforme discreta com suporte
, , , . A média A variância é: como queríamos mostrar.A segunda parte vamos considerar que os valores do suporte fornecido são resultantes de uma transformação de variáveis Se
é a variável original com suporte entre e , então , é uma variável aleatória com suporte com valores inteiros entre e . Usando a linearidade da esperança, temos Para a variância temos: pois a variância não se altera quando se subtrai uma constante de uma variável aleatória.