Sei sulla pagina 1di 2

Big Data e Data Science 2017

Parte 3: Gerenciamento de Bancos de Dados com o SQL


Talitha Faustino Speranza
Fundao Getlio Vargas

Primeira Lista de Exerccios

O objetivo desta lista exportar a tabela Titanic para o MySQL e fazer nela
consultas bsicas, para que o aluno ganhe familiaridade rapidamente com o
software MySQL Workbench e a linguagem SQL. A tabela, originalmente, est
dividida em duas e estes arquvios (test.csv e train.csv) esto disponveis na
pasta do curso. Elas tambm podem ser obtidas diretamente no site do Kaggle
(https://www.kaggle.com/c/titanic/data).

Parte 1: Criao da Tabela

1. Crie uma base de dados vazia chamada titanic. Selecione esta base como default.

2. Crie uma tabela chamada passengers dentro da base titanic, contendo os seguintes campos:

- id, do tipo integer (chave primria),


- survived, do tipo char(1)
- class, do tipo integer,
- name, do tipo varchar(100),
- sex, do tipo char(6),
- age, do tipo float,
- sib_sp, do tipo integer,
- par_ch, do tipo integer,
- ticket_num, do tipo varchar(20),
- fare, do tipo float,
- cabin, do tipo varchar(50),
- embarked, do tipo char(1)

3. Carregue os dados tanto do arquivo train.csv quanto do arquivo test.csv para a tabela
passengers, usando o comando LOAD DATA INFILE.

4. Verifique se a tabela foi corretamente preenchida e se conta com 1309 linhas. Voc pode
fazer usando um simples SELECT * FROM.

5. Exporte a tabela para um arquivo externo. Voc pode escolher qualquer formato que no
seja .csv.
Parte 2 Consultas Tabela

1. Responda a todas as perguntas abaixo usando consultas do tipo SELECT:

Ateno: Para construir suas consultas (querys), voc deve examinar cuidadosamente a
maneira que os dados foram registrados. Este tipo de atividade faz parte do dia a dia de
qualquer bom cientista de dados.

a. O passageiro de id 395 sobreviveu? E o Sr. Thomas OBrien?


b. Qual o nome da Sra. Thomas OBrien? Ela sobreviveu?
c. Qual o nmero do bilhete e o nome do passageiro de id 13?
d. Quantas mulheres havia no barco?
e. Quantas mulheres acima de 30 anos havia no barco?
f. Qual foi a tarifa mais cara do Titanic? Quem pagou?
g. Calcule a mdia das tarifas pagas por cada classe.
h. H mais homens ou mulheres na 1 classe?

2. Suponha que voc queira melhorar a legibilidade dos campos da coluna embarked.
Modifique S para Southampton, Q para Queenstown e C para Cherbourg. Voc deve perceber
que, antes, precisa mudar o tipo da coluna.

Envie seus scripts com as querys, suas respostas e seu arquivo de dados
exportados para talitha.speranza@fgv.br.

Potrebbero piacerti anche