Sei sulla pagina 1di 9

Ciclo de vida del análisis de

Big Data
1. Evaluación del caso empresarial
2. Identificación de datos
3. Adquisición y filtrado (filtering) de datos
4. Extracción de datos
5. Validación y limpieza (Cleansing) de datos
6. Agregación y representación de datos
7. Análisis de datos (Data Analysis)
8. Visualización de datos
9. Uso de los resultados del análisis
Conceptos de análisis de Big Data
Múltiples técnicas se pueden aplicar en la etapa de análisis de datos
(Data Analysis) del ciclo de vida y están agrupadas en las siguientes
cuatro categorías principales:

• Análisis estadístico
• Análisis visual
• Aprendizaje automático (Machine Learning)
• Análisis semántico
Análisis estadístico
Tests A/B

Regresión

Correlación
Aprendizaje automático (Machine Learning)
* Clasificación * Agrupamiento (Clustering)

* Detección de datos atípicos (outliers) * Filtrado (filtering)


Análisis semántico

• Procesamiento de lenguaje natural (NLP)

• Analítica de texto (text analytics)

• Análisis de sentimientos (Sentiment Analysis)


Análisis Visual
• Mapas de calor
Técnica de análisis visual efectiva para expresar patrones, composiciones de datos por medio de la
relación de una parte con el todo, y distribuciones geográficas de datos. También facilitan la
identificación de áreas de interés y el hallazgo de valores extremos (superiores/inferiores) dentro de
un dataset.
Análisis Visual
• Análisis de series temporales
Es el análisis de datos (Data Analysis) que son registrados en intervalos
periódicos de tiempo.

Los picos espaciados uniformemente hacia el


final de cada año muestran patrones
estacionales periódicos, por ejemplo en las
ventas para Navidad. Los círculos punteados
de color rojo representan variaciones
irregulares a corto plazo. La línea de color azul
muestra una tendencia ascendente, lo cual
indica un aumento en las ventas
Análisis Visual
• Análisis de redes
Técnica que se enfoca en analizar las relaciones entre entidades en la
red .
Análisis Visual
• Análisis de datos espaciales
Técnica está orientada a analizar datos basados en la ubicación, con el
fin de encontrar diferentes relaciones y patrones geográficos entre las
entidades .

Potrebbero piacerti anche