Sei sulla pagina 1di 23

AULA 4

"Capacitar o aluno na construção de protótipos de Data Marts e


Data Warehouse, utilizando ETL e a evolução para Data Ingestion."

"Tornar o aluno capacitado a compreender e construir modelos


estatísticos/analíticos básicos de classificação e preditivos
utilizados em Data Science/Machine Learning."

Enterprise Analytics e Data Warehousing

Alcides C. Araújo
Lembrando da última aula

● Crie uma hipótese, como você testaria?


● A probabilidade de evento precisa estar
em qual intervalo de valores?
● Uma probabilidade pode ser atribuída
pela intuição ou por?
● Quais os dois grupos gerais de
distribuições probabilísticas?
Distribuições de Probabilidade
Permutação x Combinação

Número de
objetos igual
ao número de
posições?

Não
Sim

Permutações A ordem
calculadas por importa?
n!

Sim – Não –
Permutações com Combinação
ou sem repetição
Distribuições de Probabilidade

Tipos de
variáveis

Quantitativas
Qualitativas

Tipos de
frequência Variáveis

Frequência Contínua
Frequência relativa Discreta
absoluta

Exponencial,
Binomial, Normal, t, Qui-
Poisson Quadrado, F
Distribuição Binomial

● Qual a probabilidade de sucesso dentro de uma


sequencia de tentativas.
Distribuição Binomial

● Aplicações:
● Cobrança: Uma empresa tem 100 clientes devedores, a chance de sucesso na
cobrança é de 30%, qual a probabilidade de que 35 clientes sejam cobrados com
sucesso?

● Indústria: Uma maquina apresenta produtos defeituosos numa taxa de 5%. Em


lote com 10 unidades, qual a probabilidade de que nenhum produto apresente
defeito?

● Educação: Uma faculdade possui uma evasão de 10% dos alunos. Entraram 500
calouros, qual a probabilidade de que 50 alunos desistam até o final do curso?

● Simulação de tabela para Modelo de cobrança


Distribuição Poisson
● A probabilidade de um evento ocorrer dado um período de
tempo.
● Probabilidade de eventos raros.
Distribuição Poisson

● Aplicações:

● Telefonia: Um call center recebe em média 100 ligações por hora. Qual a
probabilidade do call center receber 95 ligações em um hora?

● Comércio: Um caixa de supermercado atende em média 5 clientes em 30 minutos.


Qual a probabilidade de atender 4 clientes em 30 minutos?

● Segurança digital: Um antivírus protege um computador em média 100 ataques


por dia. Qual a probabilidade de receber 250 ataques em um dia?
Distribuição Exponencial

● Probabilidade de um evento ocorrer depois de um


certo período de tempo.
Distribuição Exponencial

● Aplicações:

● Industria: O tempo de vida de um transistor é de 500 horas. Qual a probabilidade


de que ele dure somente até 400 horas?

● Saúde: O tempo médio de um paciente em um leito de um hospital é de 3 dias.


Qual a probabilidade dele ficar entre 3 a 7 dias?

● Transportes: O tempo médio de entrega de produtos de uma determinada loja é


de 20 minutos. Qual a probabilidade que uma determinada entrega tenha mais de
30 minutos?
Distribuição Normal

● Utilizada quando se tem os parâmetros de média


e variância.
Distribuição Normal

● Aplicações:

● Economia: A renda média per capita de uma determinada cidade é de


R$2.500,00? Qual a probabilidade de um indivíduo possuir renda maior que
R$5.000,00? (considerar desvio padrão = R$800,00)

● Psicologia: A pontuação média do teste de QI de crianças numa escola é de 100


pontos. Qual a probabilidade de uma criança fazer menos de que 80 pontos?
(considerar desvio padrão = 10 pontos)

● Demografia: A altura média de uma população é 175cm. Qual a probabilidade de


um indivíduo apresentar menos de que 155cm? (considerar desvio padrão =
15cm)
Distribuição t de Student

● Utilizada em testes de hipóteses


Distribuição t de Student

● Aplicações:

● Comparação de duas médias: Buscou-se comparar a renda média de duas


cidades. O resultado da estatística t foi igual a 0,25. Qual a probabilidade da
média das duas cidades serem iguais? (considerar df* = 29)

● Regressão Linear: Em determinado modelo de regressão deseja-se testar se o


investimento em Marketing possui algum efeito nas vendas. Para isto, verificou-se
a hipótese do Investimento em Marketing ter efeito igual a zero. Os resultados
apresentaram um resultado de estatística t igual a 3. Qual a probabilidade do
Investimento em Marketing ter efeito igual a zero? (considerar df = 80)

*df – degree of freedom


Distribuição Qui-Quadrado

● Utilizada em testes de hipóteses


Distribuição Qui-Quadrado

● Aplicações:

● Associação entre variáveis categóricas: Deseja-se verificar a existência de


associação entre escolaridade e renda(considerar df = 2).

Variáveis Renda Baixa Renda Média Renda Alta


Escolaridade
43 12 10
Baixa
Escolaridade
10 50 8
Média
Escolaridade
8 10 30
Baixa

● O resultado do valor de Qui-Quadrado foi de 10,1. Qual a probabilidade de existir


associação entre Escolaridade e Renda?
Distribuição F

● Utilizada em testes de hipóteses:


Distribuição F

● Aplicações:

● Comparação de médias mais de 2 grupos: Buscou-se comparar a renda média de


3 cidades. O resultado da estatística F foi igual 5,5. Qual a probabilidade de que
pelo menos uma das cidades tenha média diferente em relação as demais?
(considerar df1 = 4, df2 = 5)
Exercícios

● Carregar o dataset “precos_petrobras” (lembrar


de seguir o fluxo do R)
● Gere uma nova coluna contendo as categorias
(positivo e negativa) a partir da coluna taxa.
● Calcule a frequência absoluta e relativa. Qual a
probabilidade da ação ser positiva?
● Obtenha a média e desvio padrão da taxa.
Assumindo uma distribuição normal, qual a
probabilidade da taxa ser maior que 2%?

Potrebbero piacerti anche