Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Corrija
respuesta
su
respuesta
o almacenados
o estructurados
o aleatorios
o no estructurados
o privados
o en movimiento
La información médica electrónica es información personal privada. Los resultados digitales de pruebas, como
rayos X, IRM y ultrasonidos no tienen un formato de campos fijos, por lo que se consideran no estructurados.
Debido a que la información se transmite desde un lugar a otro para su revisión, estos serían datos en
movimiento. Los datos estarán inactivos una vez que se almacenen en un centro de datos.
2 ¿Cuáles son las tres palabras clave que se utilizan para describir la diferencia entre datos masivos y datos?
(Elija tres opciones).
2¿Cuáles son las tres palabras clave que se utilizan para describir la
diferencia entre datos masivos y datos? (Elija tres opciones).
Corrija
respuesta
su
respuesta
o vigencia
o valor
o volumen
o variedad
o vitalidad
o velocidad
Hay tres palabras clave que pueden ayudar a distinguir los datos de los datos masivos:
3 ¿Cuáles son los tres tipos de datos estructurados? (Elija tres opciones).
Corrija
respuesta
su
respuesta
o blogs
o Documentos oficiales
o artículos periodísticos
4 ¿Cuáles son los dos tipos de archivo de texto sin formato que son compatibles con varias aplicaciones y
utilizan un método estándar para representar registros de datos? (Elija dos opciones).
4¿Cuáles son los dos tipos de archivo de texto sin formato que son
compatibles con varias aplicaciones y utilizan un método estándar
para representar registros de datos? (Elija dos opciones).
Corrija
respuesta
su
respuesta
o DOC
o XML
o PDF
o JSON
o XLS
A medida que los datos se recopilan de diferentes fuentes y en formatos diferentes, es recomendable utilizar
tipos de archivos específicos que faciliten la conversión y el soporte universal de la aplicación. CSV, JSON y
XML son los tipos de archivo de texto sin formato que permiten recopilar y analizar datos en un formato que es
fácilmente compatible y aplicable para al análisis.
5 ¿Cuáles son las dos tareas que forman parte de proceso de transformación de datos? (Elija dos opciones).
Corrija
respuesta
su
respuesta
o mediante reglas, modificar los datos de origen según el tipo de datos necesario
para la base de datos de destino
6 ¿Cuáles son los dos beneficios obtenido cuando una organización adopta la computación y visualización en
la nube? (Elija dos opciones).
Corrija
respuesta
su
respuesta
6.1.2 Virtualización
7 ¿Cuáles son las dos características utilizadas por las bases de datos NoSQL? (Elija dos opciones).
8 ¿Cuáles son las dos ventajas de utilizar CFS y no HDFS? (Elija dos opciones).
8¿Cuáles son las dos ventajas de utilizar CFS y no HDFS? (Elija dos
opciones).
Corrija
respuesta
su
respuesta
o hardware especializado
o arquitectura master-slave
Algunos de los beneficios de usar el CSF en cambio del HDFS son:
Asistencia básica de hardware : no se necesita ningún servidor ni dispositivo de red especial para
CFS.
Integración de datos : todos los datos que se escriben en CSF se replican tanto en analítica como
en nodos de búsqueda.
Implementación más simple : los clústers son fáciles de configurar y se pueden ejecutar en
cuestión de minutos. El CSF no exige requisitos de almacenamiento complicados o
configuraciones master-slave.
Admite múltiples centros de datos : el CFS puede ejecutar una única base de datos en múltiples
centros de datos.
9 Con la cantidad de sensores y otras terminales que crecen exponencialmente, ¿qué tipo de dispositivo se
utiliza cada vez más para mejorar la administración del tráfico de Internet en sistemas que están en
movimiento?
Corrija
respuesta
su
respuesta
o servidores proxy
o routers móviles
El rápido aumento de dispositivos en la IoT es una de las razones principales del crecimiento exponencial de
la generación de datos. Con la cantidad de sensores y otras terminales que crecen exponencialmente, ¿qué
routers móviles se utilizan cada vez más para mejorar la administración del tráfico de Internet en sistemas que
están en movimiento?
10 ¿Qué tipo de información admite el análisis gerencial al determinar si la empresa debe expandir su planta
de fabricación?
10¿Qué tipo de información admite el análisis gerencial al
determinar si la empresa debe expandir su planta de fabricación?
Corrija
respuesta
su
respuesta
o transaccional
o capital
o comparativa
o analítica
Los dos tipos principales de información empresarial útiles para una compañía son la información
transaccional y la información analítica. La información transaccional se captura y almacena a medida que
suceden los eventos. La información transaccional se puede utilizar para analizar informes diarios de ventas y
cronogramas de producción para determinar la cantidad de inventario que se necesita. La información
analítica sustenta tareas de análisis gerencial como determinar si la organización debería construir una nueva
planta de fabricación o contratar más personal de ventas.
11 ¿Qué tecnología de red se utiliza cuando una empresa con varias ubicaciones requiere datos y análisis
disponibles cerca del perímetro de su red?
Corrija
respuesta
su
respuesta
o virtualización
o computación en la niebla
o NoSQL
o Hadoop
La computación en la niebla proporciona datos, cómputos, almacenamiento y servicios de aplicaciones a los
usuarios finales. Las características de la niebla incluyen proximidad a los usuarios finales, distribución de
densidad geográfica y soporte para movilidad. Los servicios se alojan en el perímetro de la red o incluso en
terminales, como decodificadores o puntos de acceso.
Corrija
respuesta
su
respuesta
o La seguridad está integrada en todos los componentes asociados con los datos
masivos.
o Los datos masivos implican menos personas dentro de la organización con acceso a
los datos.
En la infraestructura de datos masivos, las aplicaciones, los registros, los datos de eventos, los datos de
sensores, los datos de la movilidad, los medios sociales y los datos de streaming podrían todos proporcionar
datos a la infraestructura de datos masivos, que podrían incluir centros de datos, NoSQL, servidores de bases
de datos tradicionales, almacenamiento y la tecnología basada en Hadoop.
Corrija
respuesta
su
respuesta
o Servidor SQL
o Hadoop
Corrija
respuesta
su
respuesta
15 Quinientas personas trabajan en una oficina. Para un estudio, ¿qué término describe un grupo de 50
personas que se han elegido para representar a la oficina completa?
o Categoría
o Muestra
o Grupo
o Clúster
Una población comparte un conjunto de características en común. Como, por lo general, no es viable estudiar
una población completa, se elige una muestra representativa de la población, denominada "muestra", para el
análisis.
Corrija
respuesta
su
respuesta
o un conjunto de API para permitir que los sensores envíen datos a Raspberry Pi
17 Un analista de datos realiza un análisis de correlación entre dos cantidades. El resultado del análisis es un
valor r de 0,9. ¿Qué significa esto?
17Un analista de datos realiza un análisis de correlación entre dos
cantidades. El resultado del análisis es un valor r de 0,9. ¿Qué
significa esto?
Corrija
respuesta
su
respuesta
18 Un analista de datos está procesando un conjunto de datos con pandas y detecta un NaT. ¿Qué tipo de
datos se espera para los datos faltantes?
Corrija
respuesta
su
respuesta
o cadena
o número entero
o marca de hora
o flotante
o objeto
En un conjunto de datos de pandas, NaN se utiliza para indicar una cadena indefinida, un número entero o un
valor flotante. NaT se utiliza para indicar una marca de hora faltante.
19 ¿Qué tipo de algoritmo de aprendizaje puede predecir el valor de una variable de una tasa de interés de
préstamo según el valor de otras variables?
Corrija
respuesta
su
respuesta
o regresión
o asociación
o clasificación
o clusterizado
Un ejemplo de cómo se puede utilizar un algoritmo de regresión para predecir el costo de una vivienda
considerando variables como el índice de delitos, el nivel promedio de ingresos en el barrio y la distancia de la
vivienda hasta una escuela.
Corrija
respuesta
su
respuesta
o independiente
o principal
o dependiente
o primera
La variable dependiente se conoce como variable objetivo o de respuesta. La variable independiente también
se conoce como la variable de predicción o explicativa.
4.1.2 Regresión
21 Cuando realiza un experimento y sigue el método científico, ¿cuál es el primer paso que debe tomar?
Corrija
respuesta
su
respuesta
22 ¿Qué tipo de validez se utiliza cuando un investigador compara los hallazgos originales en relación con
otras personas, en otros lugares y en otras oportunidades?
22¿Qué tipo de validez se utiliza cuando un investigador compara
los hallazgos originales en relación con otras personas, en otros
lugares y en otras oportunidades?
Corrija
respuesta
su
respuesta
o constructiva
o de conclusión
o externa
o interna
Los investigadores, por lo general, realizan pruebas de verificación con cuatro tipos de validez:
Validez interna : ¿se diseñó realmente bien el experimento? ¿Incluyó todos los pasos del método
científico?
Validez externa : ¿las conclusiones pueden aplicarse a otras situaciones o personas, en otros
lugares y en otros momentos? ¿Hay otra relación de causalidad en el estudio que podría explicar
los resultados?
Validez de las conclusiones : en función de las relaciones entre los datos, ¿son razonables las
conclusiones del estudio?
23 Consulte la ilustración. ¿Qué tipo de datos existe fuera del límite de decisión?
23 Consulte la
ilustración. ¿Qué tipo de datos existe fuera del límite de decisión?
Corrija
respuesta
su
respuesta
o grandes
o anómalos
o normales
o históricos
Un científico debe calcular un límite de decisión para detectar anomalías. Los puntos de datos anómalos son
los que se encuentran más allá de la esfera del límite de decisión.
Corrija
respuesta
su
respuesta
o Plotly
o Jupyter
o CSS
o Pyplot
Pyplot es un módulo de matplotlib que incluye un conjunto de funciones de estilo. Se puede utilizar para crear
y personalizar un gráfico.
5.2.1 Pyplot
25 ¿Qué herramienta se encuentra disponible en línea y se utiliza para crear visualizaciones de datos que
incluyen bibliotecas de API, conversores de cifras, aplicaciones y una biblioteca de JavaScript de código
abierto?
Corrija
respuesta
su
respuesta
o CSS
o Plotly
o Pyplot
o Jupyter
Plotly es una herramienta en línea que se puede utilizar para generar visualizaciones de datos rápidamente.
Plotly ofrece diversos recursos para analistas de datos y desarrolladores web, incluidas bibliotecas de API,
conversores de cifras, aplicaciones para Google Chrome y una biblioteca JavaScript de código abierto.
Este punto hace referencia al contenido de las siguientes áreas:
Big Data & Analytics
5.2.2 Plotly
Corrija
respuesta
su
respuesta
27 ¿Qué servicio es un ejemplo de una extensión de los servicios de computación en la nube definidos por el
Instituto Nacional de Normas y Tecnología (NIST)?
Corrija
respuesta
su
respuesta
o PaaS
o ITaaS
o SaaS
o IaaS
El Instituto Nacional de Normas y Tecnología (NIST) define tres servicios de computación en la nube
principales: IaaS, PaaS, SaaS, en su publicación especial 800-145. Los proveedores de servicios en la nube
han extendido este modelo y también proporcionan asistencia de TI para cada uno de los servicios de
computación en la nube (ITaaS).
Corrija
respuesta
su
respuesta
6.1.2 Virtualización
29 ¿Qué solución mejora la disponibilidad de aplicaciones de datos masivos al mantener datos solicitados con
frecuencia en la memoria para un acceso rápido?
o memcaching
o equilibrio de carga
o sharding
Mantener la disponibilidad es la prioridad máxima de las compañías que trabajan con datos masivos. Entre
algunas de las soluciones para mejorar la disponibilidad podemos mencionar las siguientes:
Equilibrio de carga : implementar varios servidores web y DNS para responder simultáneamente a
las solicitudes
Bases de datos distribuidas : mejorar la velocidad de acceso y las demandas de las bases de
datos
Sharding : particionar una gran base de datos relacional en varios servidores para mejorar la
velocidad de búsqueda
Corrija
respuesta
su
respuesta
o transporte de datos
o procesamiento de datos
o almacenamiento de datos
o asimilación de datos
Los tres componentes básicos del flujo de datos masivos son la asimilación, el almacenamiento y el
procesamiento o cómputo de datos.
Este punto hace referencia al contenido de las siguientes áreas:
Big Data & Analytics
Corrija
respuesta
su
respuesta
32
Pregunta:
Una la tarea y el propósito con el método analítico de datos masivos adecuado. No se utilizan
todas las opciones.
analizar datos históricos sobre temperatura para preparar el último pronóstico meteorológico
Analizar el historial de pedidos del cliente para encontrar los productos populares de los
últimos 6 meses
Revisar datos de ventas de los 5 principales competidores para determinar la estrategia de
marketing del propio producto para el próximo trimestre
analítica dinámica
analítica descriptiva
analítica predictivos
analítica prescriptiva
La analítica de datos, aplicada a los datos masivos, se puede clasificar en tres tipos principales:
Predictiva : intenta predecir el futuro, sobre la base de datos de análisis, o lo que sucederá luego
Prescriptiva : predice resultados y sugiere cursos de acción que redundarán en el máximo beneficio
para una organización
Su respuesta:
Una la tarea y el propósito con el método analítico de datos masivos adecuado. No se utilizan
todas las opciones.
analizar datos históricos sobre temperatura para preparar el último pronóstico meteorológico
Analizar el historial de pedidos del cliente para encontrar los productos populares de los
últimos 6 meses
Revisar datos de ventas de los 5 principales competidores para determinar la estrategia de
marketing del propio producto para el próximo trimestre
analítica dinámica
analítica descriptiva
analítica predictivos
analítica prescriptiva
33
Pregunta:
Una la descripción con el tipo de seguridad de datos correcto. (No se usan todas las opciones).
Para verificar que los archivos transferidos no estén alterados, se utiliza una suma.
La información confidencial se deberá cifrar para minimizar la exposición.
Se deben crear copias de respaldo del sistema y se debe mantener el software
actualizado.
Confidencialidad
Contabilidad
Disponibilidad
Integridad
Su respuesta:
Una la descripción con el tipo de seguridad de datos correcto. (No se usan todas las opciones).
Para verificar que los archivos transferidos no estén alterados, se utiliza una suma.
La información confidencial se deberá cifrar para minimizar la exposición.
Se deben crear copias de respaldo del sistema y se debe mantener el software actualizado.
Confidencialidad
Contabilidad
Disponibilidad
Integridad
34
Pregunta:
Una la variable con la descripción.
ordinal
intervalo
relación
discreto
valores cuantitativos de un rango determinado
valor cuantitativo de un conjunto de valores finito
valores cualitativos en los que el orden es importante
valores cuantitativos que pueden especificar si existe un valor para una
variable
3.1.1 Preliminares
Su respuesta:
Una la variable con la descripción.
ordinal
intervalo
relación
discreto
valores cuantitativos de un rango determinado
valor cuantitativo de un conjunto de valores finito
valores cualitativos en los que el orden es importante
valores cuantitativos que pueden especificar si existe un valor para una
variable
35
Pregunta:
Una el término estadístico con la descripción.
Media
Rango
Desviación estándar
Mediana
un índice de la dispersión de datos
la diferencia entre los valores más altos y más bajos para la variable
equivale a la suma de todos los valores de datos dividida por la cantidad
de valores
el valor medio en un conjunto de datos después de que los valores se
hayan organizado por orden numérico
Su respuesta:
Una el término estadístico con la descripción.
Media
Rango
Desviación estándar
Mediana
un índice de la dispersión de datos
la diferencia entre los valores más altos y más bajos para la variable
equivale a la suma de todos los valores de datos dividida por la cantidad
de valores
el valor medio en un conjunto de datos después de que los valores se
hayan organizado por orden numérico
36
Pregunta:
Una el algoritmo con el tipo de algoritmo de aprendizaje.
asociación
clasificación
clusterizado
regresión
máquina supervisada
Objetivo
Objetivo
máquina no supervisada
Objetivo
Objetivo
Su respuesta:
Una el algoritmo con el tipo de algoritmo de aprendizaje.
asociación
clasificación
clusterizado
regresión
máquina supervisada
Objetivo
Objetivo
máquina no supervisada
Objetivo
Objetivo
37
Pregunta:
Una el tipo de error con el origen de error correspondiente.
Su respuesta:
Una el tipo de error con el origen de error correspondiente.
38
Pregunta:
Una cada término con su definición correspondiente. (No se usan todas las opciones).
hacer inferencias sobre una población según los atributos de una muestra
usar hechos, propuestas u otras afirmaciones para llegar a una conclusión.
narrar una historia para persuadir a un público con la presentación de evidencia.
análisis explicativo
razonamiento deductivo
razonamiento inductivo
análisis exploratorio
Su respuesta:
Una cada término con su definición correspondiente. (No se usan todas las opciones).
hacer inferencias sobre una población según los atributos de una muestra
usar hechos, propuestas u otras afirmaciones para llegar a una conclusión.
narrar una historia para persuadir a un público con la presentación de evidencia.
análisis explicativo
razonamiento deductivo
razonamiento inductivo
análisis exploratorio
39
Pregunta:
Una los términos con su definición. (No se usan todas las opciones).
Su respuesta:
Una los términos con su definición. (No se usan todas las opciones).
40
Pregunta:
Una el tipo de gráfico con el mejor uso.
línea
columna
dispersión
circular
comparar datos a través de categorías similares
visualizar la tendencia de datos continuos en el tiempo
visualizar correlaciones
mostrar la composición de una cifra estática en los segmentos que
suman un 100 %
Su respuesta:
Una el tipo de gráfico con el mejor uso.
línea
columna
dispersión
circular
comparar datos a través de categorías similares
visualizar la tendencia de datos continuos en el tiempo
visualizar correlaciones
mostrar la composición de una cifra estática en los segmentos que
suman un 100 %