Sei sulla pagina 1di 11

ADMINISTRACION DE

FALLAS
Objetivo: la deteccin y resolucin oportuna de
situaciones anormales en la red.

Una falla debe ser detectada y reportada de
manera inmediata.

Una vez notificada se determina el origen.

Las pruebas de diagnstico son la manera de
localizar el origen

Medidas correctivas para reestablecer la
situacin o minimizar el impacto.

Proceso

Monitoreo de alarmas. Existencia de una falla y el
lugar donde se ha generado.

Localizacin de fallas. Determinar el origen de
una falla.

Pruebas de diagnstico. Pruebas que apoyen la
localizacin de una falla.

Correccin de fallas. Tomar las medidas
necesarias para corregir el problema.

Administracin de reportes. Registrar y dar
seguimiento a todos los reportes generados.

Monitoreo de alarmas

Cuando una alarma ha sido generada, debe
ser detectada para atender el problema,
antes de que el usuario pueda percibirla.

Las alarmas pueden clasificarse por su tipo
y su severidad



Tipos de alarmas
Alarmas de procesos. Asociadas con fallas en
el software o los procesos.

Alarmas de equipos. Fallas en los equipos.

Alarmas ambientales. Asociadas con
condiciones ambientales en las que un equipo
opera.

Alarmas en el servicio. Degradacin del
servicio en cuanto a lmites predeterminados.


Severidad de las alarmas.
Crtica. Evento severo que requiere atencin
inmediata.

Mayor. Servicio afectado y que requiere su
inmediato restablecimiento.

Menor. Condicin que no afecta el servicio pero si
no es atendida puede surgir una situacin mayor.

Indefinida. Nivel de severidad no determinado
Pruebas de
Diagnostico
Pruebas de conectividad fsica: Los
medios de transmisin deben de estar en
servicio.

Pruebas de conectividad lgica: Pruebas
entre entidades finales, y entre la entidad
origen y cada elemento en la comunicacin.

Pruebas de medicin: Prueban los tiempos
de respuesta en ambos sentidos de la
comunicacin.
Correccin de fallas.
Reemplazo de recursos daados. Cambiar mdulos en lugar
de toda la red.

Aislamiento del problema. Aislar el recurso daado y el resto
de elementos sigue funcionando.

Redundancia. Cambiar el servicio hacia un recurso
redundante.

Recarga del sistema. Reiniciar el sistema.

Instalacin de software. Nueva versin de sistema operativo,
actualizacin, o parche.

Cambios en la configuracin. Cambiar parmetros en la
configuracin del elemento.

Administracin de reportes
A un problema se le asigna un nmero de reporte para su
seguimiento.
Creacin de reportes
Un reporte es creado al recibir una notificacin de problema.

Seguimiento a reportes
Debe mantenerse un registro.

Manejo de reportes
Se realizan acciones como escalar el reporte, o cancelarlo.

Finalizacin de reportes
Solucionado el problema se debe cerrar el reporte.


ADMINISTRACI
N DE
DESEMPEO
Objetivo: recolectar y analizar el trfico que
circula por la red para determinar su
comportamiento en un momento en particular o
en un intervalo de tiempo.

La administracin del rendimiento se divide en 2
etapas: monitoreo y anlisis.
Monitoreo
a) Utilizacin de enlaces
Cantidades de ancho de banda utilizada por cada
enlace.

b) Caracterizacin de trfico.
Detectar tipos de trfico en la red

c) Porcentaje de transmisin y recepcin de
informacin.
Elementos que mas solicitudes hacen y atienden.

d) Utilizacin de procesamiento
Cantidad de procesador que un servidor esta
consumiendo.

Observar y recolectar informacin
en aspectos como los siguientes:

Anlisis.
a) Utilizacin elevada.
Se incrementa su ancho de banda o agrega otro enlace.

b) Trfico inusual.
El patrn de aplicaciones que circulan ayuda a detectar trfico
inusual.

c) Elementos principales de la red.
Elementos que ms reciben y se transmiten.

d) Calidad de servicio.
Mecanismos a aplicaciones que requieren de un trato especial.

e) Control de trfico.
El trfico puede ser reenviado o ruteado, cuando se detecte
saturacin.






Se interpreta la informacin para
determinar el comportamiento.

Potrebbero piacerti anche