Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Introdução:
Coletou-se dois feedback’s, uma em versão 1ª versão do esboço e uma outra
em 2ª versão, supra apontados. Os feedback’s recebidos foram apreciados e
feitos os acertes nos gráficos do presente projeto, em anexo a este relatório
(ProjetoFinal_titanic_28_06_2018_UV), que nos parece inclui evidências de
que a visualização foi melhorada deste a 1ª versão.
Resumo:
Este projeto propõe-se analisar um dos conjuntos de dados mais populares para
quem inicia estudos de ciências de dados e machine learning, Titanic. Este
conjunto de dados tem diversas informações sobre passageiros que embarcaram
no famoso transatlântico, partindo de em sua viagem inaugural de Southampton,
Inglaterra, em direção a Nova Iorque, em 10 de Abril de 1912 e que não
esperavam pelo fim trágico. Durante a viagem fez duas paradas, uma em
Cherbourg e outra em Queenstown para embarque de mais passageiros antes de
partir em direção ao oceano Atlântico. Dentre as perguntas de partidas, se
pretende responder aa seguintes perguntas:
Quais fatores que parecem se relacionar às chances de sobreviventes ao
acidente?
As taxas de tarifa aumentaram de acordo com a faixa etária de
viajantes que sobreviveram ao acidente?
Design:
A concepção deste projeto, antes e após a coleta de feedback, visa criar
visualização que facilita aos leitores a entenderem fatores que parecem se
relacionar às chances de sobreviventes (“variável resposta” é: sobrevive -sim,
variáveis explanatórias são: sexo, faixa etária, local de embarque e tipologia de
classe classe em embarque), e se houve incremento em taxas de tarifa de
acordo com a faixa etária de viajantes que sobreviveram ao acidente
(“variável resposta” é: taxa de embarque, variáveis explanatórias é: idade).
Comentário Final:
Optou-se por utilizar gráficos de colunas compostas para realizar as visualizações
de: i) caracterização dos passageiros ou análise univariada de variáveis
qualitativas; ii) a relação entre duas variáveis qualitativas (consideramos como
modelo simples) ou , análise bivariada entre duas variáveis qualitativas (fatores
que parecem se associar às chances de sobrevivência). Por outro lado, em
análise entre duas variáveis quantitativas (taxa de embarque X idade) utilizou-se
um gráfico de dispersão.
Para este projeto, considerou-se: i) crianças, os passageiros que tinham entre 0 e
20 anos de idade, adultos, os que entre 21 e 59 anos e idosos, aqueles que tinha
entre 60 e 80 anos de idade; ii) modelo simples qualquer relação entre duas
variáveis, seja entre duas variáveis qualitativas ou quantitativas.
Nesta versão do projeto foram implementadas todas as correções indicadas em
feedbacks e revisores.
Arquivos de dados
https://s3.amazonaws.com/video.udacity-
data.com/topher/2017/October/59d54e6d_titanic-data/titanic-data.csv