Sei sulla pagina 1di 30

Un paciente que vive en el norte de Canadá se hizo una resonancia

magnética. Los resultados del procedimiento médico se transmiten


inmediatamente a un especialista en Toronto para que revise los
resultados. ¿Qué características describirían mejor los datos del
paciente que se transmiten? (Elija tres opciones).

 Corrija 
respuesta 
 su 
respuesta 

o   almacenados

o   estructurados

o   aleatorios

o   no estructurados

o   privados

o   en movimiento
La información médica electrónica es información personal privada. Los resultados digitales de pruebas, como
rayos X, IRM y ultrasonidos no tienen un formato de campos fijos, por lo que se consideran no estructurados.
Debido a que la información se transmite desde un lugar a otro para su revisión, estos serían datos en
movimiento. Los datos estarán inactivos una vez que se almacenen en un centro de datos.

Este punto hace referencia al contenido de las siguientes áreas:


Big Data & Analytics

2 ¿Cuáles son las tres palabras clave que se utilizan para describir la diferencia entre datos masivos y datos?
(Elija tres opciones).

2¿Cuáles son las tres palabras clave que se utilizan para describir la
diferencia entre datos masivos y datos? (Elija tres opciones).

 Corrija 
respuesta 
 su 
respuesta 

o   vigencia

o   valor

o   volumen
o   variedad

o   vitalidad

o   velocidad
Hay tres palabras clave que pueden ayudar a distinguir los datos de los datos masivos:

Volumen :describe la cantidad de datos masivos que se envían y almacenan


Velocidad : describe la rapidez con la que se mueven los datos masivos
Variedad : describe el tipo de datos masivos que se encuentra rara vez en un estado que esté perfectamente
listo para procesar y analizar.

Este punto hace referencia al contenido de las siguientes áreas:


Big Data & Analytics

 1.2.1 De dónde provienen los datos masivos

3 ¿Cuáles son los tres tipos de datos estructurados? (Elija tres opciones).

3¿Cuáles son los tres tipos de datos estructurados? (Elija tres


opciones).

 Corrija 
respuesta 
 su 
respuesta 

o   datos de la hoja de cálculo

o   blogs

o   Documentos oficiales

o   artículos periodísticos

o   cuentas de usuario de e-commerce

o   datos en bases de datos relacionales


Los datos estructurados se ingresan y se mantienen en campos fijos dentro de un archivo o de un registro,
como los datos que se encuentran en bases de datos relacionales y hojas de cálculo relacionales. El ingreso
de datos estructurados requiere cierto formato para minimizar errores y facilitar la interpretación de la
computadora.

Este punto hace referencia al contenido de las siguientes áreas:


Big Data & Analytics

 1.2.3 Datos estructurados y no estructurados

4 ¿Cuáles son los dos tipos de archivo de texto sin formato que son compatibles con varias aplicaciones y
utilizan un método estándar para representar registros de datos? (Elija dos opciones).
4¿Cuáles son los dos tipos de archivo de texto sin formato que son
compatibles con varias aplicaciones y utilizan un método estándar
para representar registros de datos? (Elija dos opciones).

 Corrija 
respuesta 
 su 
respuesta 

o   DOC

o   XML

o   PDF

o   JSON

o   XLS
A medida que los datos se recopilan de diferentes fuentes y en formatos diferentes, es recomendable utilizar
tipos de archivos específicos que faciliten la conversión y el soporte universal de la aplicación. CSV, JSON y
XML son los tipos de archivo de texto sin formato que permiten recopilar y analizar datos en un formato que es
fácilmente compatible y aplicable para al análisis.

Este punto hace referencia al contenido de las siguientes áreas:


Big Data & Analytics

 2.3.1 Fuentes de datos

5 ¿Cuáles son las dos tareas que forman parte de proceso de transformación de datos? (Elija dos opciones).

5¿Cuáles son las dos tareas que forman parte de proceso de


transformación de datos? (Elija dos opciones).

 Corrija 
respuesta 
 su 
respuesta 

o   reunir datos de múltiples fuentes

o   mediante reglas, modificar los datos de origen según el tipo de datos necesario
para la base de datos de destino

o   recopilar los datos necesarios para realizar el análisis

o   presentar el conocimiento adquirido a partir de los datos


o   crear representaciones visuales de los datos
La transformación de datos es el proceso de modificar la información en un formato utilizable. Esto incluye
tareas como agregar de datos y clasificarlos. La recolección de datos es el proceso de extraer de datos. La
creación de representaciones visuales de datos y la presentación del conocimiento adquirido a partir de los
datos son ejemplos de los últimos pasos que se siguen en el análisis de datos.

Este punto hace referencia al contenido de las siguientes áreas:


Big Data & Analytics

 2.3.2 Preparación de datos

6 ¿Cuáles son los dos beneficios obtenido cuando una organización adopta la computación y visualización en
la nube? (Elija dos opciones).

6¿Cuáles son los dos beneficios obtenido cuando una organización


adopta la computación y visualización en la nube? (Elija dos
opciones).

 Corrija 
respuesta 
 su 
respuesta 

o   permite respuestas rápidas para aumentar los requisitos de volumen de datos

o   procesamiento distribuido de grandes conjuntos de datos en el tamaño de terabytes

o   elimina las vulnerabilidades a ataques cibernéticos

o   proporciona un modelo de "pago por uso" que permite a las organizaciones


considerar los gastos de computación y almacenamiento como un servicio

o   aumenta la dependencia de recursos de TI en las instalaciones


Las organizaciones pueden usar la virtualización para consolidar la cantidad de servidores requeridos al
ejecutar muchos servidores virtuales en un único servidor físico. La computación en la nube permite que las
organizaciones amplíen sus soluciones según sea necesario y paguen solo los recursos que necesitan.

Este punto hace referencia al contenido de las siguientes áreas:


Big Data & Analytics

 6.1.1 La nube, la niebla y el perímetro

 6.1.2 Virtualización

7 ¿Cuáles son las dos características utilizadas por las bases de datos NoSQL? (Elija dos opciones).

7¿Cuáles son las dos características utilizadas por las bases de


datos NoSQL? (Elija dos opciones).
 Corrija 
respuesta 
 su 
respuesta 

o   implementación del enfoque de almacenamiento de valores clave

o   importación de datos no estructurados

o   organización de datos en columnas, tablas y filas

o   establecimiento de relaciones dentro de datos almacenados

o   depende del enfoque relacional de la base de datos de tablas vinculadas


Las bases de datos NoSQL pueden usar un enfoque de par de valor clave. Una base de datos NoSQL puede
importar datos no estructurados. Organiza datos en columnas, tablas y filas; establecimiento relaciones dentro
de los datos almacenados. NoSQL no depende del enfoque relacional de la base de datos de tablas
vinculadas.

Este punto hace referencia al contenido de las siguientes áreas:


Big Data & Analytics

 6.2.1 Historial de ingeniería de datos

8 ¿Cuáles son las dos ventajas de utilizar CFS y no HDFS? (Elija dos opciones).

8¿Cuáles son las dos ventajas de utilizar CFS y no HDFS? (Elija dos
opciones).

 Corrija 
respuesta 
 su 
respuesta 

o   capacidad de ejecutar una única base de datos en diversos centros de datos

o   hardware especializado

o   falla automática de nodos, clústeres y centros de datos

o   solución de almacenamiento económico

o   arquitectura master-slave
Algunos de los beneficios de usar el CSF en cambio del HDFS son:

 Mayor disponibilidad : el CSF no requiere soluciones de almacenamiento compartido.

 Asistencia básica de hardware : no se necesita ningún servidor ni dispositivo de red especial para
CFS.
 Integración de datos : todos los datos que se escriben en CSF se replican tanto en analítica como
en nodos de búsqueda.

 Falla automática : en relación con la disponibilidad, la falla es automática debido a la replicación.

 Implementación más simple : los clústers son fáciles de configurar y se pueden ejecutar en
cuestión de minutos. El CSF no exige requisitos de almacenamiento complicados o
configuraciones master-slave.

 Admite múltiples centros de datos : el CFS puede ejecutar una única base de datos en múltiples
centros de datos.

Este punto hace referencia al contenido de las siguientes áreas:


Big Data & Analytics

 6.3.2 Almacenamiento de datos

9 Con la cantidad de sensores y otras terminales que crecen exponencialmente, ¿qué tipo de dispositivo se
utiliza cada vez más para mejorar la administración del tráfico de Internet en sistemas que están en
movimiento?

9Con la cantidad de sensores y otras terminales que crecen


exponencialmente, ¿qué tipo de dispositivo se utiliza cada vez más
para mejorar la administración del tráfico de Internet en sistemas
que están en movimiento?

 Corrija 
respuesta 
 su 
respuesta 

o   servidores proxy

o   torres de la red celular

o   puntos de acceso Wi-Fi

o   routers móviles
El rápido aumento de dispositivos en la IoT es una de las razones principales del crecimiento exponencial de
la generación de datos. Con la cantidad de sensores y otras terminales que crecen exponencialmente, ¿qué
routers móviles se utilizan cada vez más para mejorar la administración del tráfico de Internet en sistemas que
están en movimiento?

Este punto hace referencia al contenido de las siguientes áreas:


Big Data & Analytics

 1.1.3 El crecimiento de datos cambia nuestras vidas

10 ¿Qué tipo de información admite el análisis gerencial al determinar si la empresa debe expandir su planta
de fabricación?
10¿Qué tipo de información admite el análisis gerencial al
determinar si la empresa debe expandir su planta de fabricación?

 Corrija 
respuesta 
 su 
respuesta 

o   transaccional

o   capital

o   comparativa

o   analítica
Los dos tipos principales de información empresarial útiles para una compañía son la información
transaccional y la información analítica. La información transaccional se captura y almacena a medida que
suceden los eventos. La información transaccional se puede utilizar para analizar informes diarios de ventas y
cronogramas de producción para determinar la cantidad de inventario que se necesita. La información
analítica sustenta tareas de análisis gerencial como determinar si la organización debería construir una nueva
planta de fabricación o contratar más personal de ventas.

Este punto hace referencia al contenido de las siguientes áreas:


Big Data & Analytics

 1.2.1 De dónde provienen los datos masivos

11 ¿Qué tecnología de red se utiliza cuando una empresa con varias ubicaciones requiere datos y análisis
disponibles cerca del perímetro de su red?

11¿Qué tecnología de red se utiliza cuando una empresa con varias


ubicaciones requiere datos y análisis disponibles cerca del
perímetro de su red?

 Corrija 
respuesta 
 su 
respuesta 

o   virtualización

o   computación en la niebla

o   NoSQL

o   Hadoop
La computación en la niebla proporciona datos, cómputos, almacenamiento y servicios de aplicaciones a los
usuarios finales. Las características de la niebla incluyen proximidad a los usuarios finales, distribución de
densidad geográfica y soporte para movilidad. Los servicios se alojan en el perímetro de la red o incluso en
terminales, como decodificadores o puntos de acceso.

Este punto hace referencia al contenido de las siguientes áreas:


Big Data & Analytics

 1.2.4 Datos almacenados y datos en movimiento

12 ¿En qué se diferencia la infraestructura de datos masivos de la tradicional?

12¿En qué se diferencia la infraestructura de datos masivos de la


tradicional?

 Corrija 
respuesta 
 su 
respuesta 

o   Las plataformas de datos masivos distribuyen datos en varios nodos de cómputo y


almacenamiento.

o   La seguridad está integrada en todos los componentes asociados con los datos
masivos.

o   La infraestructura de datos masivos requiere la implementación de productos


patentados y protocolos.

o   Los datos masivos implican menos personas dentro de la organización con acceso a
los datos.
En la infraestructura de datos masivos, las aplicaciones, los registros, los datos de eventos, los datos de
sensores, los datos de la movilidad, los medios sociales y los datos de streaming podrían todos proporcionar
datos a la infraestructura de datos masivos, que podrían incluir centros de datos, NoSQL, servidores de bases
de datos tradicionales, almacenamiento y la tecnología basada en Hadoop.

Este punto hace referencia al contenido de las siguientes áreas:


Big Data & Analytics

 1.3.1 Evolución a los datos masivos

13 ¿Cuál es un ejemplo de base de datos relacional?

13¿Cuál es un ejemplo de base de datos relacional?

 Corrija 
respuesta 
 su 
respuesta 

o   Hoja de cálculo de Excel

o   Servidor SQL

o   Hadoop

o   Visual Network Index


Dos sistemas populares de administración de base de datos relacional son Oracle y SQL.

Este punto hace referencia al contenido de las siguientes áreas:


Big Data & Analytics

 1.3.2 Tecnologías de administración básica de datos

14 ¿Cuál es el propósito de la estadística descriptiva?

14¿Cuál es el propósito de la estadística descriptiva?

 Corrija 
respuesta 
 su 
respuesta 

o   hacer predicciones sobre otros valores

o   comparar grupos de conjuntos de datos

o   resumir hallazgos dentro de un conjunto de datos

o   hacer generalizaciones sobre una población


Existen dos tipos de estadísticas utilizadas en el análisis de datos: descriptiva e inferencial. Las estadísticas
descriptivas se usan para describir o resumir valores en un conjunto de datos. Las estadísticas inferenciales
se utilizan para hacer predicciones sobre los datos.

Este punto hace referencia al contenido de las siguientes áreas:


Big Data & Analytics

 3.1.2 Análisis estadístico

15 Quinientas personas trabajan en una oficina. Para un estudio, ¿qué término describe un grupo de 50
personas que se han elegido para representar a la oficina completa?

15Quinientas personas trabajan en una oficina. Para un estudio,


¿qué término describe un grupo de 50 personas que se han elegido
para representar a la oficina completa?
 Corrija 
respuesta 
 su 
respuesta 

o   Categoría

o   Muestra

o   Grupo

o   Clúster
Una población comparte un conjunto de características en común. Como, por lo general, no es viable estudiar
una población completa, se elige una muestra representativa de la población, denominada "muestra", para el
análisis.

Este punto hace referencia al contenido de las siguientes áreas:


Big Data & Analytics

 3.1.2 Análisis estadístico

16 ¿Qué funcionalidad ofrece pandas a un entorno de Python?

16¿Qué funcionalidad ofrece pandas a un entorno de Python?

 Corrija 
respuesta 
 su 
respuesta 

o   un conjunto de estructuras de datos y herramientas para el análisis de datos

o   un conjunto de API para permitir que los sensores envíen datos a Raspberry Pi

o   un chip mejorado para procesar información gráfica

o   un algoritmo para generar los números aleatorios


Pandas es una biblioteca de código abierto con estructuras de datos y las herramientas de alto rendimiento
para el análisis de grandes conjuntos de datos.

Este punto hace referencia al contenido de las siguientes áreas:


Big Data & Analytics

 3.1.4 Análisis con estadísticas descriptivas

17 Un analista de datos realiza un análisis de correlación entre dos cantidades. El resultado del análisis es un
valor r de 0,9. ¿Qué significa esto?
17Un analista de datos realiza un análisis de correlación entre dos
cantidades. El resultado del análisis es un valor r de 0,9. ¿Qué
significa esto?

 Corrija 
respuesta 
 su 
respuesta 

o   Una variable mantiene su valor en el 90% de la otra variable.

o   Cuando una variable aumenta su valor, la otra variable lo disminuye.

o   Cuando una variable aumenta su valor, la variable aumenta su valor de manera


muy similar.

o   Las dos variables tienen casi los mismos valores.


El coeficiente de correlación más usado, r de Pearson, (o valor r), es una cantidad que se expresa como un
valor de -1 a 1. Un valor positivo indica una relación positiva entre los cambios en dos cantidades. Un valor
negativo indica una relación inversa. La magnitud de los valores positivos o negativos indica el grado de
correlación. Cuanto más se acerque el valor a 1 o a -1, más fuerte será la relación.

Este punto hace referencia al contenido de las siguientes áreas:


Big Data & Analytics

 3.1.5 Análisis con correlación

18 Un analista de datos está procesando un conjunto de datos con pandas y detecta un NaT. ¿Qué tipo de
datos se espera para los datos faltantes?

18Un analista de datos está procesando un conjunto de datos con


pandas y detecta un NaT. ¿Qué tipo de datos se espera para los
datos faltantes?

 Corrija 
respuesta 
 su 
respuesta 

o   cadena

o   número entero

o   marca de hora

o   flotante
o   objeto
En un conjunto de datos de pandas, NaN se utiliza para indicar una cadena indefinida, un número entero o un
valor flotante. NaT se utiliza para indicar una marca de hora faltante.

Este punto hace referencia al contenido de las siguientes áreas:


Big Data & Analytics

 3.2.1 Análisis básico con Pandas.

19 ¿Qué tipo de algoritmo de aprendizaje puede predecir el valor de una variable de una tasa de interés de
préstamo según el valor de otras variables?

19¿Qué tipo de algoritmo de aprendizaje puede predecir el valor de


una variable de una tasa de interés de préstamo según el valor de
otras variables?

 Corrija 
respuesta 
 su 
respuesta 

o   regresión

o   asociación

o   clasificación

o   clusterizado
Un ejemplo de cómo se puede utilizar un algoritmo de regresión para predecir el costo de una vivienda
considerando variables como el índice de delitos, el nivel promedio de ingresos en el barrio y la distancia de la
vivienda hasta una escuela.

Este punto hace referencia al contenido de las siguientes áreas:


Big Data & Analytics

 4.1.1 El aprendizaje automático.

20 En un análisis de regresión, ¿qué variable se conoce como un predictora o explicativa?

20En un análisis de regresión, ¿qué variable se conoce como un


predictora o explicativa?

 Corrija 
respuesta 
 su 
respuesta 

o   independiente

o   principal

o   dependiente

o   primera
La variable dependiente se conoce como variable objetivo o de respuesta. La variable independiente también
se conoce como la variable de predicción o explicativa.

Este punto hace referencia al contenido de las siguientes áreas:


Big Data & Analytics

 4.1.2 Regresión

21 Cuando realiza un experimento y sigue el método científico, ¿cuál es el primer paso que debe tomar?

21Cuando realiza un experimento y sigue el método científico, ¿cuál


es el primer paso que debe tomar?

 Corrija 
respuesta 
 su 
respuesta 

o   Realizar las investigaciones que correspondan.

o   Analizar los datos recopilados.

o   Elaborar una hipótesis.

o   Hacer preguntas sobre de una observación.


El método científico se utiliza comúnmente en las investigaciones científicas y está conformado por los
siguientes pasos:
Paso 1. Formular una preguntas sobre una observación: qué, cuándo, cómo o por qué.
Paso 2. Realizar las investigaciones que correspondan.
Paso 3. Elaborar una hipótesis a partir de estas investigaciones.
Paso 4. Probar la hipótesis con experimentos.
Paso 5. Analizar los datos que se obtuvieron en los experimentos para arribar a una conclusión.
Paso 6. Informar los resultados del proceso.

Este punto hace referencia al contenido de las siguientes áreas:


Big Data & Analytics

 4.2.1 Validez y fiabilidad

22 ¿Qué tipo de validez se utiliza cuando un investigador compara los hallazgos originales en relación con
otras personas, en otros lugares y en otras oportunidades?
22¿Qué tipo de validez se utiliza cuando un investigador compara
los hallazgos originales en relación con otras personas, en otros
lugares y en otras oportunidades?

 Corrija 
respuesta 
 su 
respuesta 

o   constructiva

o   de conclusión

o   externa

o   interna
Los investigadores, por lo general, realizan pruebas de verificación con cuatro tipos de validez:

 Validez constructiva : ¿el estudio mide en realidad lo que afirma medir?

 Validez interna : ¿se diseñó realmente bien el experimento? ¿Incluyó todos los pasos del método
científico?

 Validez externa : ¿las conclusiones pueden aplicarse a otras situaciones o personas, en otros
lugares y en otros momentos? ¿Hay otra relación de causalidad en el estudio que podría explicar
los resultados?

 Validez de las conclusiones : en función de las relaciones entre los datos, ¿son razonables las
conclusiones del estudio?

Este punto hace referencia al contenido de las siguientes áreas:


Big Data & Analytics

 4.2.1 Validez y fiabilidad

23 Consulte la ilustración. ¿Qué tipo de datos existe fuera del límite de decisión?
23 Consulte la
ilustración. ¿Qué tipo de datos existe fuera del límite de decisión?

 Corrija 
respuesta 
 su 
respuesta 

o   grandes

o   anómalos

o   normales

o   históricos
Un científico debe calcular un límite de decisión para detectar anomalías. Los puntos de datos anómalos son
los que se encuentran más allá de la esfera del límite de decisión.

Este punto hace referencia al contenido de las siguientes áreas:


Big Data & Analytics

 4.3.2 Práctica de laboratorio: detección de anomalías del contador de Internet

24 ¿Qué es un módulo de matplotlib que incluye un conjunto de funciones de estilo?


24¿Qué es un módulo de matplotlib que incluye un conjunto de
funciones de estilo?

 Corrija 
respuesta 
 su 
respuesta 

o   Plotly

o   Jupyter

o   CSS

o   Pyplot
Pyplot es un módulo de matplotlib que incluye un conjunto de funciones de estilo. Se puede utilizar para crear
y personalizar un gráfico.

Este punto hace referencia al contenido de las siguientes áreas:


Big Data & Analytics

 5.2.1 Pyplot

25 ¿Qué herramienta se encuentra disponible en línea y se utiliza para crear visualizaciones de datos que
incluyen bibliotecas de API, conversores de cifras, aplicaciones y una biblioteca de JavaScript de código
abierto?

25¿Qué herramienta se encuentra disponible en línea y se utiliza


para crear visualizaciones de datos que incluyen bibliotecas de API,
conversores de cifras, aplicaciones y una biblioteca de JavaScript
de código abierto?

 Corrija 
respuesta 
 su 
respuesta 

o   CSS

o   Plotly

o   Pyplot

o   Jupyter
Plotly es una herramienta en línea que se puede utilizar para generar visualizaciones de datos rápidamente.
Plotly ofrece diversos recursos para analistas de datos y desarrolladores web, incluidas bibliotecas de API,
conversores de cifras, aplicaciones para Google Chrome y una biblioteca JavaScript de código abierto.
Este punto hace referencia al contenido de las siguientes áreas:
Big Data & Analytics

 5.2.2 Plotly

26 ¿Qué servicios son proporcionados por una nube privada?

26¿Qué servicios son proporcionados por una nube privada?

 Corrija 
respuesta 
 su 
respuesta 

o   almacenamiento de datos cifrados en computación en nube

o   comunicaciones seguras entre los sensores y los accionadores

o   múltiples servicios de TI internos en una empresa

o   servicios en línea a los proveedores confiables


Las grandes empresas, por lo general, tienen su propio centro de datos para administrar necesidades de
almacenamiento de datos y de procesamiento de datos. El centro de datos se puede utilizar para satisfacer
necesidades internas de TI. Es decir, el centro de datos se convierte en una nube privada, una infraestructura
de computación en la nube solo para servicios internos.

Este punto hace referencia al contenido de las siguientes áreas:


Big Data & Analytics

 6.1.1 La nube, la niebla y el perímetro

27 ¿Qué servicio es un ejemplo de una extensión de los servicios de computación en la nube definidos por el
Instituto Nacional de Normas y Tecnología (NIST)?

27¿Qué servicio es un ejemplo de una extensión de los servicios de


computación en la nube definidos por el Instituto Nacional de
Normas y Tecnología (NIST)?

 Corrija 
respuesta 
 su 
respuesta 

o   PaaS
o   ITaaS

o   SaaS

o   IaaS
El Instituto Nacional de Normas y Tecnología (NIST) define tres servicios de computación en la nube
principales: IaaS, PaaS, SaaS, en su publicación especial 800-145. Los proveedores de servicios en la nube
han extendido este modelo y también proporcionan asistencia de TI para cada uno de los servicios de
computación en la nube (ITaaS).

Este punto hace referencia al contenido de las siguientes áreas:


Big Data & Analytics

 6.1.1 La nube, la niebla y el perímetro

28 ¿Cuál es la función principal de un hipervisor?

28¿Cuál es la función principal de un hipervisor?

 Corrija 
respuesta 
 su 
respuesta 

o   Es un dispositivo que sincroniza un grupo de sensores.

o   Se utiliza para crear y administrar varias instancias de máquinas virtuales en una


máquina host.

o   Es un dispositivo que filtra y verifica credenciales de seguridad.

o   Lo utilizan los ISP para monitorear los recursos de informática en la nube.

o   Es un software utilizado para coordinar y preparar datos para analizar.


Un hipervisor es un componente clave de la virtualización. Un hipervisor está, a menudo, respaldado por un
software y se utiliza para crear y administrar varias instancias de máquinas virtuales.

Este punto hace referencia al contenido de las siguientes áreas:


Big Data & Analytics

 6.1.2 Virtualización

29 ¿Qué solución mejora la disponibilidad de aplicaciones de datos masivos al mantener datos solicitados con
frecuencia en la memoria para un acceso rápido?

29¿Qué solución mejora la disponibilidad de aplicaciones de datos


masivos al mantener datos solicitados con frecuencia en la memoria
para un acceso rápido?
 Corrija 
respuesta 
 su 
respuesta 

o   bases de datos distribuidas

o   memcaching

o   equilibrio de carga

o   sharding
Mantener la disponibilidad es la prioridad máxima de las compañías que trabajan con datos masivos. Entre
algunas de las soluciones para mejorar la disponibilidad podemos mencionar las siguientes:

 Equilibrio de carga : implementar varios servidores web y DNS para responder simultáneamente a
las solicitudes

 Bases de datos distribuidas : mejorar la velocidad de acceso y las demandas de las bases de
datos

 Memcaching : descargar la demanda en servidores de bases de datos manteniendo los datos


solicitados con frecuencia disponibles en la memoria para acelerar el acceso

 Sharding : particionar una gran base de datos relacional en varios servidores para mejorar la
velocidad de búsqueda

Este punto hace referencia al contenido de las siguientes áreas:


Big Data & Analytics

 6.2.2 Sistemas de datos masivos

30 ¿Cuál es el principal componente del flujo de datos masivos?

30¿Cuál es el principal componente del flujo de datos masivos?

 Corrija 
respuesta 
 su 
respuesta 

o   transporte de datos

o   procesamiento de datos

o   almacenamiento de datos

o   asimilación de datos
Los tres componentes básicos del flujo de datos masivos son la asimilación, el almacenamiento y el
procesamiento o cómputo de datos.
Este punto hace referencia al contenido de las siguientes áreas:
Big Data & Analytics

 6.3.1 Adquisición de datos

31 ¿Cómo administra Cassandra los cambios en los archivos?

31¿Cómo administra Cassandra los cambios en los archivos?

 Corrija 
respuesta 
 su 
respuesta 

o   Se mantienen ambas versiones.

o   Los cambios se anteponen.

o   Se crea un nuevo archivo y se elimina el antiguo.

o   Los cambios se adjuntan.


Cassandra utiliza lectura secuencial y escribe para mantener velocidades rápidas. En lugar de adjuntar
archivos, cuando ocurre una adición o eliminación de datos en un archivo, se crea un nuevo archivo y se
eliminan el o los archivos antiguos.

Este punto hace referencia al contenido de las siguientes áreas:


Big Data & Analytics

 6.3.2 Almacenamiento de datos

32

Pregunta:
Una la tarea y el propósito con el método analítico de datos masivos adecuado. No se utilizan
todas las opciones.

analizar datos históricos sobre temperatura para preparar el último pronóstico meteorológico
Analizar el historial de pedidos del cliente para encontrar los productos populares de los
últimos 6 meses
Revisar datos de ventas de los 5 principales competidores para determinar la estrategia de
marketing del propio producto para el próximo trimestre
analítica dinámica
analítica descriptiva
analítica predictivos
analítica prescriptiva

La analítica de datos, aplicada a los datos masivos, se puede clasificar en tres tipos principales:

 Descriptiva : proporciona información sobre el estado o desempeño anteriores de una persona u


organización

 Predictiva : intenta predecir el futuro, sobre la base de datos de análisis, o lo que sucederá luego

 Prescriptiva : predice resultados y sugiere cursos de acción que redundarán en el máximo beneficio
para una organización

Este punto hace referencia al contenido de las siguientes áreas:


Big Data & Analytics

 2.2.2 Tipos de análisis de datos

Su respuesta:
 
Una la tarea y el propósito con el método analítico de datos masivos adecuado. No se utilizan
todas las opciones.

analizar datos históricos sobre temperatura para preparar el último pronóstico meteorológico
Analizar el historial de pedidos del cliente para encontrar los productos populares de los
últimos 6 meses
Revisar datos de ventas de los 5 principales competidores para determinar la estrategia de
marketing del propio producto para el próximo trimestre
analítica dinámica
analítica descriptiva
analítica predictivos
analítica prescriptiva

33
Pregunta:
Una la descripción con el tipo de seguridad de datos correcto. (No se usan todas las opciones).

Para verificar que los archivos transferidos no estén alterados, se utiliza una suma.
La información confidencial se deberá cifrar para minimizar la exposición.
Se deben crear copias de respaldo del sistema y se debe mantener el software
actualizado.
Confidencialidad
Contabilidad
Disponibilidad
Integridad

Este punto hace referencia al contenido de las siguientes áreas:


Big Data & Analytics

 2.4.1 ¿Cuáles son las preocupaciones éticas?

Su respuesta:
 
Una la descripción con el tipo de seguridad de datos correcto. (No se usan todas las opciones).

Para verificar que los archivos transferidos no estén alterados, se utiliza una suma.
La información confidencial se deberá cifrar para minimizar la exposición.
Se deben crear copias de respaldo del sistema y se debe mantener el software actualizado.
Confidencialidad
Contabilidad
Disponibilidad
Integridad

34
Pregunta:
Una la variable con la descripción.

ordinal
intervalo
relación
discreto
valores cuantitativos de un rango determinado
valor cuantitativo de un conjunto de valores finito
valores cualitativos en los que el orden es importante
valores cuantitativos que pueden especificar si existe un valor para una
variable

Este punto hace referencia al contenido de las siguientes áreas:


Big Data & Analytics

 3.1.1 Preliminares

Su respuesta:
 
Una la variable con la descripción.

ordinal
intervalo
relación
discreto
valores cuantitativos de un rango determinado
valor cuantitativo de un conjunto de valores finito
valores cualitativos en los que el orden es importante
valores cuantitativos que pueden especificar si existe un valor para una
variable
35

Pregunta:
Una el término estadístico con la descripción.

Media
Rango
Desviación estándar
Mediana
un índice de la dispersión de datos
la diferencia entre los valores más altos y más bajos para la variable
equivale a la suma de todos los valores de datos dividida por la cantidad
de valores
el valor medio en un conjunto de datos después de que los valores se
hayan organizado por orden numérico

Este punto hace referencia al contenido de las siguientes áreas:


Big Data & Analytics

 3.1.3 Características de los ejemplos

Su respuesta:
 
Una el término estadístico con la descripción.

Media
Rango
Desviación estándar
Mediana
un índice de la dispersión de datos
la diferencia entre los valores más altos y más bajos para la variable
equivale a la suma de todos los valores de datos dividida por la cantidad
de valores
el valor medio en un conjunto de datos después de que los valores se
hayan organizado por orden numérico
36

Pregunta:
Una el algoritmo con el tipo de algoritmo de aprendizaje.

asociación
clasificación
clusterizado
regresión

máquina supervisada

Objetivo
Objetivo

máquina no supervisada

Objetivo
Objetivo

Este punto hace referencia al contenido de las siguientes áreas:


Big Data & Analytics

 4.1.1 El aprendizaje automático.

Su respuesta:
 
Una el algoritmo con el tipo de algoritmo de aprendizaje.

asociación
clasificación
clusterizado
regresión

máquina supervisada

Objetivo
Objetivo

máquina no supervisada

Objetivo
Objetivo

37

Pregunta:
Una el tipo de error con el origen de error correspondiente.

A una regla le falta la primera línea en milímetros.


Un científico registra una medición de 3.1 cuando, en realidad, fue de 3.01.
Un hombre sube a una balanza calibrada varias veces y la balanza indica un peso diferente
cada vez que lo hace.
error grave
error aleatorio
error sistemático

Este punto hace referencia al contenido de las siguientes áreas:


Big Data & Analytics

 4.2.2 Error de análisis

Su respuesta:
 
Una el tipo de error con el origen de error correspondiente.

A una regla le falta la primera línea en milímetros.


Un científico registra una medición de 3.1 cuando, en realidad, fue de 3.01.
Un hombre sube a una balanza calibrada varias veces y la balanza indica un peso diferente
cada vez que lo hace.
error grave
error aleatorio
error sistemático

38

Pregunta:
Una cada término con su definición correspondiente. (No se usan todas las opciones).

hacer inferencias sobre una población según los atributos de una muestra
usar hechos, propuestas u otras afirmaciones para llegar a una conclusión.
narrar una historia para persuadir a un público con la presentación de evidencia.
análisis explicativo
razonamiento deductivo
razonamiento inductivo
análisis exploratorio

Este punto hace referencia al contenido de las siguientes áreas:


Big Data & Analytics

 5.1.1 Conozca su propósito

 5.1.2 Propuesta y evidencia

Su respuesta:
 
Una cada término con su definición correspondiente. (No se usan todas las opciones).

hacer inferencias sobre una población según los atributos de una muestra
usar hechos, propuestas u otras afirmaciones para llegar a una conclusión.
narrar una historia para persuadir a un público con la presentación de evidencia.
análisis explicativo
razonamiento deductivo
razonamiento inductivo
análisis exploratorio

39

Pregunta:
Una los términos con su definición. (No se usan todas las opciones).

un ejemplo de razonamiento deductivo


una conclusión no justificada por la premisa de un argumento
se presenta para sustentar una conclusión en el análisis
explicativo
propuesta
silogismo
falacia
evidencia

Este punto hace referencia al contenido de las siguientes áreas:


Big Data & Analytics

 5.1.1 Conozca su propósito

 5.1.2 Propuesta y evidencia

Su respuesta:
 
Una los términos con su definición. (No se usan todas las opciones).

un ejemplo de razonamiento deductivo


una conclusión no justificada por la premisa de un argumento
se presenta para sustentar una conclusión en el análisis explicativo
propuesta
silogismo
falacia
evidencia

40

Pregunta:
Una el tipo de gráfico con el mejor uso.

línea
columna
dispersión
circular
comparar datos a través de categorías similares
visualizar la tendencia de datos continuos en el tiempo
visualizar correlaciones
mostrar la composición de una cifra estática en los segmentos que
suman un 100 %

Este punto hace referencia al contenido de las siguientes áreas:


Big Data & Analytics

 5.2.3 Elección de la visualización correcta para el trabajo

Su respuesta:
 
Una el tipo de gráfico con el mejor uso.

línea
columna
dispersión
circular
comparar datos a través de categorías similares
visualizar la tendencia de datos continuos en el tiempo
visualizar correlaciones
mostrar la composición de una cifra estática en los segmentos que
suman un 100 %

Potrebbero piacerti anche