Sei sulla pagina 1di 9

Universidad Autnoma del Estado de Mxico

Centro Universitario UAEM Atlacomulco



Temas Selectos del Tratamiento de Informacin

Nombre: Consuelo Martnez Crdenas

Grupo: LIA

BIG DATA

Texto original

Big data
By Vangie Beal
Big data is a buzzword, or catch-phrase, used to describe a massive volume of both structured and
unstructured data that is so large that it's difficult to process using traditional database and software
techniques. In most enterprise scenarios the data is too big or it moves too fast or it exceeds current
processing capacity. Big data has the potential to help companies improve operations and make faster,
more intelligent decisions. Is Big Data a Volume or a Technology? While the term may seem to reference the
volume of data, that isn't always the case. The term big data, especially when used by vendors, may refer
to the technology (which includes tools and processes) that an organization requires to handle the large
amounts of data and storage facilities. The term big data is believed to have originated with Web search
companies who needed to query very large distributed aggregations of loosely-structured data. An Example
of Big Data An example of big data might be petabytes (1,024 terabytes) or exabytes (1,024 petabytes) of
data consisting of billions to trillions of records of millions of people

all from different sources (e.g. Web, sales, customer contact center, social media, mobile data and so on).
The data is typically loosely structured data that is often incomplete and inaccessible. Big Data and Types
of Business Datasets When dealing with larger datasets, organizations face difficulties in being able to create,
manipulate, and manage big data. Big data is particularly a problem in business analytics because standard
tools and procedures are not designed to search and analyze massive datasets. As research from
Webopedia parent company QuinStreet demonstrates, big data initiatives are poised for explosive growth.
QuinStreet surveyed 540 enterprise decision-makers involved in big data and found the datasets of interest
to many businesses today include traditional structured databases of inventories, orders, and customer
information, as well as unstructured data from the Web, social networking sites, and intelligent devices. This
data, when captured, formatted, manipulated, stored, and analyzed can help a company to gain useful
insight to increase revenues, get or retain customers, and improve operations. Big data may also be called
enterprise big data. Big data analytics Big data analytics refers to the process of collecting, organizing and
analyzing large sets of data ("big data") to discover patterns and other useful information. Not only will big
data analytics help you to understand the information contained within the data, but it will also help identify
the data that is most important to the business and future business decisions. Big data analysts basically want
the knowledge that comes from analyzing the data. The Benefits of Big Data Analytics Enterprises are
increasingly looking to find actionable insights into their data. Many big data projects originate from the
need to answer specific business questions. With the right big data analytics platforms in place, an enterprise
can boost sales, increase efficiency, and improve operations, customer service and risk management.
Webopedia parent company, QuinStreet, surveyed 540 enterprise decision-makers involved in big data
purchases to learn which business areas companies plan to use Big Data analytics to improve operations.
About half of all respondents said they were applying big data analytics to improve customer retention, help
with product development and gain a competitive advantage. For most organizations, big data analysis is
a challenge. Consider the sheer volume of data and the many different formats of the data (both structured
and unstructured data) collected across the entire organization and the many different ways different types
of data can be combined, contrasted and analyzed to find patterns and other useful information. The first
challenge is in breaking down data silos to access all data an organization stores in different places and
often in different systems. A second big data challenge is in creating platforms that can pull in unstructured
data as easily as structured data. This massive volume of data is typically so large that it's difficult to process
using traditional database and software methods. Big Data Requires High-Performance Analytics To analyze
such a large volume of data, big data analytics is typically performed using specialized software tools and
applications for predictive analytics, data mining, text mining, forecasting and data optimization.
Collectively these processes are separate but highly integrated functions of high-performance analytics.
Using big data tools and software enables an organization to process extremely large volumes of data that
a business has collected to determine which data is relevant and can be analyzed to drive better business
decisions in the future. Examples of How Big Data Analytics is Used Today As technology to break down data
silos and analyze data improves, business can be transformed in all sorts of ways. According to Datamation,
today's advances in analyzing Big Data allow researchers to decode human DNA in minutes, predict where
terrorists plan to attack, determine which gene is mostly likely to be responsible for certain diseases and, of
course, which ads you are most likely to respond to on Facebook. The business cases for leveraging Big Data
are compelling. For instance, Netflix mined its subscriber data to put the essential ingredients together for its
recent hit House of Cards, and subscriber data also prompted the company to bring Arrested Development
back from the dead. Another example comes from one of the biggest mobile carriers in the world. France's
Orange launched its Data for Development project by releasing subscriber data for customers in the Ivory
Coast. The 2.5 billion records, which were made anonymous, included details on calls and text messages
exchanged between 5 million users. Researchers accessed the data and sent Orange proposals for how the
data could serve as the foundation for development projects to improve public health and safety. Proposed
projects included one that showed how to improve public safety by tracking cell phone data to map where
people went after emergencies; another showed how to use cellular data for disease containment. The
pace of data creation will surely increase, especially as machine-to-machine communications gets cheaper
and more common. Think about how much data all of those sensor networks, burglar alarms and vehicle
telematics systems will create. According to IBM, every single day we create 2.5 quintillion bytes of data. IBM
argues that the exponential growth of data means that 90 percent of the data that exists in the world today
has been created in the last two years. "This data comes from everywhere: sensors used to gather climate
information, posts to social media sites, digital pictures and videos, e-commerce transaction records, and
cell phone GPS coordinates, to name a few." Of course, it's important to remember that in early human
history, anything as ephemeral as a tweet just would not have been recorded, so these comparisons can
only be taken so far. To put the data explosion in context, consider this. Every minute of every day we create
More than 204 million email messages Over 2 million Google search queries 48 hours of new YouTube videos
684,000 bits of content shared on Facebook More than 100,000 tweets $272,000 spent on e-commerce 3,600
new photos shared on Instagram Nearly 350 new WordPress blog posts.
Texto traducido
Big Data
Por Vangie Beal
Big data es una palabra de moda, o frase usada para describir un volumen masivo de datos tanto
estructurados como no estructurados que es tan grande que es difcil de procesar utilizando tcnicas de
bases de datos y de software tradicionales. En la mayora de los escenarios empresariales los datos son
demasiado grandes o se mueven demasiado rpido o se exceden de la capacidad de procesamiento
actual. Big Data (grandes datos) tiene el potencial de ayudar a las empresas a mejorar sus operaciones y
a tomar decisiones ms rpidas e inteligentemente.
Big Data es un volumen o una tecnologa? Mientras que el trmino puede parecer para hacer referencia
al volumen de datos, que no siempre es el caso. El trmino Big Data, especialmente cuando lo utilizan los
proveedores, pueden referirse a la tecnologa (que incluye herramientas y procesos) que una organizacin
necesita para manejar las grandes cantidades de datos e instalaciones de almacenamiento. Se cree que
el Big Data trmino que se origin con las empresas de bsqueda Web que necesitaban consultar muy
grandes agregaciones distribuidas de datos estructurados dbilmente-. Un ejemplo de Big Data.
Un ejemplo del Big Data podra ser petabytes (1024 terabytes) o hexabytes (1.024 petabytes) de datos que
constan de miles de millones a miles de millones de registros de millones de personas, todos de diferentes
fuentes (por ejemplo, Web, de ventas, centros de contacto de clientes, medios de comunicacin social,
datos mviles y as sucesivamente). Los datos son normalmente poco estructurados de datos que a menudo
es incompleta e inaccesible. Datos y tipos de conjuntos de datos de negocios, cuando se ocupan grandes
conjuntos de datos, las organizaciones se enfrentan a dificultades en la capacidad de crear, manipular y
gestionar grandes volmenes de datos. Big Data es un problema particularmente en anlisis de negocios
porque las herramientas y procedimientos estndar no estn diseados para buscar y analizar conjuntos
de datos masivos. Como la investigacin de la compaa matriz Webopedia QuinStreet demuestra,
iniciativas de grandes datos que estn preparados para un crecimiento explosivo. QuinStreet encuest a
540 empresas que toman las decisiones involucradas en grandes volmenes de datos y encontr a los
conjuntos de datos de inters para muchas empresas hoy en da incluyen las bases de datos tradicionales
estructurados de inventarios, pedidos y la informacin del cliente, as como datos no estructurados de la
Web, los sitios de redes sociales y dispositivos inteligentes.
Estos datos, cuando son capturados, formateados, manipulados, almacenados y analizados, pueden
ayudar a una empresa para obtener informacin til para aumentar los ingresos, obtener o retener a los
clientes, y mejorar las operaciones. Big Data tambin puede ser llamado por la empresa como datos
grandes. Anlisis de datos grandes, analtica de Big Data, se refiere al proceso de recoleccin, organizacin
y anlisis de grandes conjuntos de datos ("big data") para descubrir patrones y otra informacin til. No slo
habr anlisis de Big Data que ayudar a entender la informacin contenida en los datos, sino que tambin
ayudar a identificar los datos que son ms importantes para el negocio y las decisiones futuras del
negocio. Los analistas de Big Data bsicamente quieren que el conocimiento que proviene de analizar los
datos.
Los beneficios del anlisis de Big Data
Las empresas estn cada vez ms buscando para encontrar informacin procesable en sus datos. Muchos
proyectos de Big Data se originan en la necesidad de responder a las preguntas especficas del negocio.
Con las grandes plataformas de anlisis de los datos correctos en el lugar, una empresa puede impulsar las
ventas, aumentar la eficiencia, mejorar las operaciones, servir al cliente y gestionar riesgos. Empresa matriz
Webopedia, QuinStreet, encuest a 540 empresas que toman las decisiones que participan en las compras
de Big Data, para saber qu reas de negocio de las empresas planean utilizar el anlisis de Big Data para
mejorar las operaciones. Aproximadamente la mitad de todos los encuestados dijeron que estaban
aplicando el anlisis de Big Data para mejorar la retencin de clientes, ayudar con el desarrollo de
productos y obtener una ventaja competitiva.
El primer desafo es romper los silos de datos para tener acceso a todos los datos de un depsito de las
organizaciones en diferentes lugares y, a menudo en diferentes sistemas. Un segundo desafo de Big Data
es en la creacin de plataformas que pueden tratar los datos no estructurados con tanta facilidad como
los datos estructurados. Este volumen masivo de datos suele ser tan grande que es difcil de procesar
utilizando los mtodos de base de datos y de software tradicionales. El anlisis de Big Data requiere de alto
rendimiento para analizar un gran volumen de datos como el anlisis de Big Data que se realiza
normalmente utilizando herramientas de software y aplicaciones especializadas para el anlisis predictivo,
minera de datos, minera de texto, la prediccin y la optimizacin de datos. En conjunto, estos procesos
son funciones separadas pero altamente integradas de anlisis de alto rendimiento. El uso de herramientas
de Big Data y software permite a una organizacin procesar extremadamente grandes volmenes de datos
que un negocio ha recogido para determinar qu datos son relevantes y pueden ser analizados para tomar
mejores decisiones de negocio en el futuro. Ejemplos de cmo el anlisis de Big Data se utiliza hoy.
Como la tecnologa para romper los silos de datos y anlisis de datos, el negocio puede transformarse en
todo tipo de formas segn Datamation, los avances en el anlisis de Big Data de hoy permiten a los
investigadores descifrar el ADN humano en cuestin de minutos, predicen que los terroristas planean atacar,
determinan qu gen es sobre todo probable que sea responsable de ciertas enfermedades y, por supuesto,
los anuncios que tienen ms probabilidades de responder en Facebook. Los casos de negocio para
aprovechar los Big Data son convincentes. Por ejemplo, Netflix extrae sus datos de suscriptor para poner los
ingredientes esenciales juntos con su reciente xito Castillo de naipes, y los datos de abonado tambin
impulsaron a la empresa a llevar Arrested Development de entre los muertos. Otro ejemplo proviene de una
de las mayores compaas de telefona mvil en el mundo, Orange de Francia puso en marcha su proyecto
de datos para el Desarrollo, para la liberacin de los datos de abonado de los clientes en la Costa de Marfil.
Los 2,5 mil millones de registros, que se hicieron en el anonimato, incluidos detalles sobre las llamadas y
mensajes de texto intercambiados entre 5 millones de usuarios. Los investigadores pueden acceder a los
datos y enviar propuestas a Orange de cmo los datos pueden servir de base para los proyectos de
desarrollo para mejorar la salud y la seguridad pblica. Los proyectos propuestos incluyen uno que
mostraba la forma de mejorar la seguridad pblica mediante el seguimiento de los datos del telfono
celular para mapear donde la gente iba tras una emergencia; otra mostr cmo usar los datos celulares
para la contencin de la enfermedad. El ritmo de creacin de datos seguramente aumentar, sobre todo
porque las comunicaciones de mquina a mquina se volvern ms baratas y ms comunes. Piense en la
cantidad de datos de todas esas redes de sensores, alarmas antirrobo y los sistemas telemticos vehculo
crear.
De a cuerdo con IBM, cada da creamos 2,5 trillones de bytes de datos. IBM sostiene que el crecimiento
exponencial de los datos significa que el 90 por ciento de los datos que existen en el mundo de hoy se ha
creado en los ltimos dos aos. "Estos datos vienen de todas partes: sensores utilizados para recopilar
informacin sobre el clima, los mensajes a sitios de medios sociales, fotos digitales y videos, registros de
transacciones de comercio electrnico, y las coordenadas de GPS del telfono celular, por nombrar
algunos." Por supuesto, es importante recordar que en la historia humana temprana, algo tan efmero como
un Tweet, simplemente no habra sido registrado, por lo que estas comparaciones slo pueden ser tomadas
hasta el momento. Para poner la explosin de datos en contexto, considere esto. Cada minuto de cada
da creamos ms de 204 millones de mensajes de correo electrnico, ms de 2 millones de consultas
Google de bsqueda de 48 horas, los vdeos de YouTube 684.000 bits de contenido compartido en
Facebook, ms de 100.000 tweets de $ 272.000 gastados en el comercio electrnico 3600 nuevas fotos
compartidas en Instagram Casi 350 nuevas entradas del blog WordPress



























Es un Volumen
masivo de datos
No se manejan con
bases de datos ni
con software
tradicional
Para toma de
decisiones
Mejora las
operaciones de
las empresas y
su crecimiento
Tecnologa:
Se refiere a
las tcnicas,
herramientas y
procesos
Volumen:
Un gran tamao
de datos
ayuda
BIGA DATA




Origen de Big
Data
Empresas de
bsqueda Web
Petabytes (1024
Terabytes),
Hexabytes (1024
petabytes)
Crea ventajas
competitivas
Mejora las
operaciones
Incrementa la
productividad
Gestionar
riesgos
Aumentar la
eficiencia
Impulsar las
ventas
Aumentar los
ingresos
Desafos de Big
Data
Acceso a los datos
desde diferentes
lugares y sistemas
La gestin de datos
estructurados y no
estructurados
Descifrar el
ADN
Detectar
enfermedades
por medio del
estudio de los
genes
Para gestionar
los datos

Potrebbero piacerti anche