Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Big Data
PÓS-GRADUAÇÃO LATO SENSU
• Globalização
• Modelo “just in time”
• Expansão virtual
1
14/12/2012
Big Data = volume + variedade + velocidade de dados Big Data = volume + variedade + velocidade de dados
• Há Volume porque além dos dados gerados pelos • Variedade porque estamos tratando tanto de dados
sistemas transacionais, temos a imensidão de dados textuais estruturados como não estruturados como fotos,
gerados pelos objetos na Internet das Coisas, como vídeos, e-mails e tuites.
sensores e câmeras, e os gerados nas mídias sociais via
PCs, smartphones e tablets.
A visualização de
dados em forma de
cores criado pela
IBM.
Big Data = volume + variedade + velocidade de dados Big Data = volume + variedade + velocidade de dados
Big Data são dados que testam os limites das tecnologias
• Velocidade, porque muitas vezes precisamos responder
disponíveis para utilizá-los.
aos eventos quase que em tempo real, ou seja, estamos
falando de criação e tratamento de dados em volumes
massivos.
• Permitem encontrar padrões e sentido em uma imensa e • Dados não tratados e analisados em tempo hábil são
variada massa amorfa de dados gerados por sistemas dados inúteis, pois não geram informação.
transacionais, mídias sociais, sensores, etc.
• Dados passam a ser ativos corporativos importantes e
• É crucial saber tratar os dados na velocidade adequada. como tal podem e deverão ser quantificados
economicamente.
2
14/12/2012
MapReduce
Big Data - Infraestrutura
3
14/12/2012
NoSQL
Há alguns exemplos de softwares de código fechado que Big Data Analytics não signfica eliminar os tradicionais
atendem estes requisitos, sendo alguns deles Google sistemas de BI que existem hoje, mas pelo contrário,
BigTable e Amazon DynamoDB. E alguns exemplos de devem coexistir.
sofware open-source como Apache Cassandra
(originalmente desenvolvido para o Facebook), Apache Um bom exemplo de uso de Hadoop para analytics é o
HBase, Linkedins Project Voldemort e dentre outros. BigInsights da IBM.
4
14/12/2012
BigInsights IBM InfoSphere traz o poder do Hadoop para a Netezza IBM - Família de Ferramentas (appliance) de Data
empresa. Permite que empresas de todos os tamanhos Warehouse para análise de negócios, com banco de dados,
custo efetivamente gerenciar e analisar o enorme volume, servidores e storages integrados. De fácil implementação,
variedade e velocidade de dados que os consumidores e as otimizado e pronto para o uso, com manutenção contínua e
empresas a criar todos os dias. Fonte: IBM, 2012. nenhuma necessidade de tuning.
Podemos pensar em inúmeras aplicações, sejam estas em • Uma companhia que tira fotos de satélites e vende aos
finanças, saúde e mesmo manufatura. seus clientes informações em tempo real sobre a
disponibilidade de vagas de estacionamento livres em uma
Vamos ver este último exemplo: um projeto em cidade numa determinada hora.
desenvolvimento com uma empresa de fabricação de
semicondutores pode monitorar em tempo real o processo • Uma varejista americana controla as combinações de
de detecção e classificação de falhas. Com stream produtos que seus clientes põem no carrinho, ou seja,
computing as falhas nos chips sendo fabricados são ganhou eficácia e ainda descobriu várias curiosidades que
detectados em minutos e não horas ou mesmo semanas. Os podem ajudar.
wafers defeituosos podem ser reprocessados e, mais
importante ainda, pode-se fazer ajustes em tempo real nos
próprios processos de fabricação. Fonte: IBM, 2012.
5
14/12/2012
Big Data – Novo profissional Big Data – Leitura complementar sobre nteligência dos Negócios –
Thomas Davenport
A Gartner prevê que, até 2015, a procura por recursos
humanos relacionada coma Big Data levará à criação de
4,4 milhões de empregos globalmente. Mas apenas um
terço dos postos de trabalho será preenchido.
6
14/12/2012
Zaidan