Introdução

Calcular probabidades de ocorrência de eventos é uma tarefa comum quando se trabalhamos com estatística, e através de softwares como o R, esses cálculos podem ser realizados de forma mais prática e rápida. O documento em questão não tem o objetivo de ensinar sobre probabilidade e seus modelos probabilísticos, mas sim de fazer com que o leitor pratique cálculos de diferentes probabilidades por meio do R.

Os exemplos utilizados ao longo do roteiro são apenas fictícios para fins didáticos, assim seus resultados não retratam a realidade de nenhuma informação.

Modelo Binomial

Utilizado para cálculos com variáveis aleatórias discretas, se baseia nos ensaios de Bernoulli, onde os experimentos podem ter como respota “sucesso” ou “fracasso”. Com base em uma probabilidade constante de sucessos, se torna possível calcular a probabilidade do total de sucessos de uma amostra através do modelo binomial.


Suponha que uma certa cirurgia tenha 85% de probabilidade de sucesso. Qual a probabilidade de ter sucesso em todas as cirurgias em uma amostra aleatória de 10 pacientes?

Essa probabilidade de sucesso em todas as cirurgias pode ser calculada com a seguinte função:

dbinom(x=10, size=10, prob=0.85)
## [1] 0.1968744


Gatos machos tricolores são raros por serem originados de uma anomalia crossômica. Suponha que entre gatos tricolores a probabilidade de ser macho é de 10%. Em uma amostra aleatória, qual a probabilidade de que entre 15 gatos tricolores 5 sejam machos?

A probabilidade de 5 em 15 gatos tricolores serem machos é dada pela função abaixo:

dbinom(x=5, size=15, prob=0.10)
## [1] 0.01047081


Para uma determinada lesão é elaborado um programa de fisioterapia, talque a probabilidade de alta do paciente após esse programa é de 90%. Para uma amostra aleatória de 20 pacientes, qual a probabilidade de que exatamante 15 tenham alta?

Para obter a probabilidade de 15 em 20 terem alta utilize a função e os seguintes argumentos:

dbinom(x=15, size=20, prob=0.90)
## [1] 0.03192136


É possível também calcular probabilidades acumuladas em modelos binomiais.


Suponha que uma cirurgia tenha 70% de probabilidade de sucesso. Qual a probabilidade de que em uma amostra de 15 pacientes pelo menos 12 tenham sucesso no procedimento cirúrgico?

A probabilidade de pelo menos 12 em 15 pacientes terem sucesso cirúrgico pode ser calculada como mostra abaixo:

1-pbinom(q=11, size=15, prob=0.70)
## [1] 0.2968679


Considerando novamente o exemplo de que gatos machos tricolores serem raros por serem originados de uma anomalia crossômica. Supondo que entre gatos tricolores a probabilidade de ser macho é de 10%, qual a probabilidade de se ter menos de 4 gatos machos em uma amostra aleatória de 20 gatos tricolores?

O calculo da probabilida de se ter menos de 4 gatos machos tricolores em 20 é dado por:

pbinom(q=3, size=20, prob=0.10)
## [1] 0.8670467


Para uma determinada lesão é elaborado um programa de fisioterapia, tal que a probabilidade de alta do paciente após esse programa é de 90%. Desta vez, calcule a probabilidade de que em uma amostra aleatória de 30 pacientes, pelo menos 28 recebam alta.

Repita a função abaixo para obter a probabbilidade de que pelos menos 28 em 30 pacientes recebam alta após o programa de fisioterapia:

1-pbinom(q=27, size=30, prob=0.90)
## [1] 0.4113512

Perceba o quão útil é utilizar essas funções quando se trata de cálculos de probabilidades com tamanho número amostral, visto que realizado à mão demandaria bastante tempo.

Existe a possibilidade de calcular os quantis da distribuição, utilizando um percentil de uma ordem específica e obtendo o número de sucessos como resultado.


Considerando a mesma cirurgia com 70% de probabilidade de sucesso. Em amostras aleatórias de 20 pacientes, qual o número de sucessos cujo a probabilidade de ter menos sucessos do que este número em uma amostra aleatória é de, aproximadamente, 50%?

O número é obtido da seguinte maneira:

qbinom(p=0.50, size=20, prob=0.70)
## [1] 14


Novamente com o exemplo dos gatos tricolores, qual a quantidade que em 90% (aproximadamente) das amostras de tamanho 30 sorteadas, o número de gatos machos tricolores que ocorrerá será menor do que este número?

o valor procurado pode ser calculado com a função e argumentos abaixo:

qbinom(p=0.90, size=30, prob=0.10)
## [1] 5


Para uma determinada lesão é elaborado um programa de fisioterapia, a probabilidade de alta do paciente após esse programa é de 90%. Calcule o número que em aproximadamente 70% das amostras de 50 pacientes, o número de paciente que receberam alta após esse programa de fisioterapia é menor que este número procurado.

O quantil procurado através do código a seguir:

qbinom(p=0.70, size=50, prob=0.90)
## [1] 46


Modelo de Poisson

A distribuição de Poisson é utilizada quando se quer calcular o número de ocorrências de eventos de interesse em um determinado período de tempo.


Uma Unidade de Pronto Atendimento (UPA) recebe em média 10 pacientes por dia. Supondo o modelo de Poisson adequado, qual a probabilidade de que essa mesma UPA receba 12 pacientes em um dia sorteado aleatoriamente?

dpois(x=12, lambda=10)
## [1] 0.09478033


Suponha que uma abelha polinize, em média 20 flores, a cada hora. Qual a probabilidade de que uma abelha polinize apenas 16 flores em uma hora?

dpois(x=16, lambda=20)
## [1] 0.06456107


Suponha que em um laboratório de uma determinada cidade diagnostique em média 2 pessoas com Covid-19 a cada 30 minutos. Qual a probabilidade de que este mesmo laboratório diagnostique 3 pessoas nesse mesmo período de tempo?

dpois(x=3, lambda=2)
## [1] 0.180447


Uma Unidade de Pronto Atendimento (UPA) recebe em média 10 pacientes por dia. Qual a probabilidade de ir no máximo 8 pacientes em um dia nessa UPA?

ppois(q=8, lambda=10)
## [1] 0.3328197


Suponha que uma abelha polinize, em média 20 flores, a cada hora. Qual a probabilidade de uma abelha polinizar mais de 25 flores em uma hora?

1 - ppois(q=25, lambda=20)
## [1] 0.112185


Suponha que em um laboratório de uma determinada cidade diagnostique em média 2 pessoas com Covid-19 a cada 30 minutos. Qual a probabilidade de que este laboratório diagnostique mais de 4 pessoas em 30 minutos?

1 - ppois(q=4, lambda=2)
## [1] 0.05265302

Os próximos exemplos são referentes ao calculo percentis da distribuição Poisson.


Considere que a mesma UPA citada anteriormente quer se preparar para receber, sem ultrapassar a lotação máxima, pacientes em 90% dos dias. Qual o número máximo de pacientes que eles devem estar preparados para receber por dia nessa situação?

qpois(p=0.90, lambda=10)
## [1] 14


Um pesquisador quer definir o número de flores tal que, aproximadamente, 30% das abelhas polinizam menos do que este número e 70% mais do que ele. Considerando a média de 20 flores polinizadas por hora, qual será esta quantidade?

qpois(p=0.30, lambda=20)
## [1] 18


Imagine que o mesmo laboratório quer criar um estoque de testes para covid, baseando-se na quantidade de pessoas que realizam o teste. Considere que eles realizam o teste em média 50 vezes por dia. Qual o número de testes que eles precisam ter em seu estoque para atender a demanda em 80% dos dias?

qpois(p=0.80, lambda=50)
## [1] 56


Modelo Normal

A distribuição Normal é uma das mais utilizadas e considerada para variáveis aleatórias contínuas. Para os exemplos abaixo, considere que todos tenham distribuição normal.


Suponha que uma a baleia orca tenha comprimento médio de 8 metros, com desvio padrão de 1 metro. Qual a probabilidade de encontrar uma baleia orca com comprimento menor que 7 metros?

pnorm(q=7, mean=8, sd=1)
## [1] 0.1586553


Considere uma população com pressão sistólica média de 120 e desvio padrão 10. Qual a probabilidade de se encontrar uma pessoa nessa população com pressão sistólica maior que 140?

1 - pnorm(q=140, mean=120, sd=10)
## [1] 0.02275013


Suponha que um determinado medicamento demore em média 180 minutos para ser metabolizado por ratos de laboratórios, com desvio padrão de 20 minutos. Qual a probabilidade de que esse medicamento seja metabolizado entre 120 a 150 minutos?

pnorm(q=150, mean=180, sd=20) - pnorm(q=120, mean=180, sd=20)
## [1] 0.0654573


Considerando os dados da questão anterior, qual a probabilidade de que uma amostra de 100 ratos metabolizem esse mesmo medicamento em um intervalo de 150 a 170 minutos?

pnorm(q=170, mean=180, sqrt(100) - pnorm(q=150, mean=180, sqrt(100)))
## [1] 0.1586226


Um grupo de pesquisa de farmacêuticos estuda um medicamento que possui dosagem média indicada de 80mg com desvio padrão de 10mg para uma certa população. Eles querem criar uma faixa de referência dessa dosagem que atenda 95% da população, qual será esse faixa?

Valor inferior da faixa de referência:

80 + ( qnorm(0.025, mean=0, sd=1) * 10 )
## [1] 60.40036
qnorm(0.025, mean = 80, sd = 10)
## [1] 60.40036

Valor superior da faixa de referência:

80 + ( qnorm(0.975, mean=0, sd=1) * 10)
## [1] 99.59964
qnorm(0.975, mean = 80, sd = 10)
## [1] 99.59964


Na distribuição a respeito do comprimento de baleias orcas, com média 8 e desvio padrão 1, qual o comprimento que 95% das baleias é inferior à ele?

qnorm(p=0.95, mean=8, sd=1)
## [1] 9.644854


Em relação a população que apresenta pressão sistólica com média 120 e desvio padrão 10, qual o valor que separa 10% da população com maior pressão sistólica?

qnorm(p=0.90, mean=120, sd=10)
## [1] 132.8155