Sei sulla pagina 1di 21

Maniesto sobre Miner de a Procesos

(versin nal) o

Wil van der Aalst, Arya Adriansyah, Ana Karla Alves de Medeiros, Franco Arcieri, Thomas Baier, Tobias Blickle, Jagadeesh Chandra Bose, Peter van den Brand, Ronald Brandtjen, Joos Buijs, Andrea Burattin, Josep Carmona, Malu Castellanos, Jan Claes, Jonathan Cook, Nicola Costantini, Francisco Curbera, Ernesto Damiani, Massimiliano de Leoni, Pavlos Delias, Boudewijn van Dongen, Marlon Dumas, Schahram Dustdar, Dirk Fahland, Diogo R. Ferreira, Walid Gaaloul, Frank van Geen, Sukriti Goel, Christian Gnther, Antonella Guzzo, Paul u Harmon, Arthur ter Hofstede, John Hoogland, Jon Espen Ingvaldsen, Koki Kato, Rudolf Kuhn, Akhil Kumar, Marcello La Rosa, Fabrizio Maggi, Donato Malerba, Ronny Mans, Alberto Manuel, Martin McCreesh, Paola Mello, Jan Mendling, Marco Montali, Hamid Motahari Nezhad, Michael zur Muehlen, Jorge Munoz-Gama, Luigi Pontieri, Joel Ribeiro, Anne Rozinat, Hugo Seguel Prez, Ricardo Seguel Prez, Marcos Seplveda, Jim Sinur, Pnina Soer, Minseok e e u Song, Alessandro Sperduti, Giovanni Stilo, Casper Stoel, Keith Swenson, Maurizio Talamo, Wei Tan, Chris Turner, Jan Vanthienen, George Varvaressos, Eric Verbeek, Marc Verdonk, Roberto Vigo, Jianmin Wang, Barbara Weber, Matthias Weidlich, Ton Weijters, Lijie Wen, Michael Westergaard, and Moe Wynn
IEEE Task Force on Process Mining* http://www.win.tue.nl/ieeetfpm

Resumen Las tcnicas de miner de procesos son capaces de extraer conocimiento de los e a registros de eventos comnmente disponibles en los sistemas de informacin actuales. Estas u o tcnicas proveen nuevos medios para descubrir, monitorear y mejorar los procesos en una e variedad de dominios de aplicacin. Hay dos razones principales para el creciente inters en o e miner de procesos. Por un lado, se registran ms y ms eventos, proporcionando infora a a macin detallada acerca de la historia de los procesos. Por otro lado, hay una necesidad de o mejorar y apoyar los procesos de negocio en ambientes competitivos y que cambian rpia damente. Este maniesto es creado por la IEEE Task Force on Process Mining (Fuerza de Trabajo de la IEEE sobre Miner de Procesos) y est dirigido a promover el tpico de a a o miner de procesos. Adems, al denir un conjunto de principios rectores y listar importana a tes desaf este maniesto espera servir como una gu para desarrolladores de software, os, a cient cos, consultores, gerentes de negocio, y usuarios nales. El objetivo es incrementar la madurez de la miner de procesos como una nueva herramienta para mejorar el (re)diseo, a n control, y apoyo a los procesos de negocio operacionales.

1.

IEEE Task Force on Process Mining

Un maniesto es una declaracin pblica de principios e intenciones por un grupo de persoo u nas. Este maniesto es escrito por los miembros y personas que respaldan la IEEE Task Force on Process Mining (Fuerza de Trabajo de la IEEE sobre Miner de Procesos). El objetivo de esta a fuerza de trabajo es promover la investigacin, desarrollo, educacin, implementacin, evolucin, o o o o y entendimiento acerca de la miner de procesos. a La miner de procesos es una disciplina de investigacin relativamente jven que se ubica entre a o o la inteligencia computacional y la miner de datos, por una parte, y la modelacin y anlisis de a o a
*

La versin original apareci en los BPM 2011 Workshops proceedings, Lecture Notes in Business Inforo o mation Processing, Springer-Verlag, 2011.

Maniesto sobre Miner de Procesos a procesos, por otra. La idea de la miner de procesos es descubrir, monitorear y mejorar los procesos a reales (i.e., no los procesos supuestos) a travs de la extraccin de conocimiento de los registros de e o eventos ampliamente disponibles en los actuales sistemas (de informacin) (ver Fig. 1). La miner o a de procesos incluye el descubrimiento (automtico) de procesos (i.e., extraer modelos de procesos a a partir de un registro de eventos), la vericacin de conformidad (i.e., monitorear desviaciones o al comparar el modelo y el registro de eventos), la miner de redes sociales/organizacionales, a la construccin automtica de modelos de simulacin, la extensin de modelos, la reparacin de o a o o o modelos, la prediccin de casos, y las recomendaciones basadas en historia. o La miner de procesos proveee un puente importante entre la miner de datos y la modelaa a cin y anlisis de procesos de negocio. Bajo el paragua de la Inteligencia de Negocios (Business o a Intelligence, BI), se han introducido muchas palabras de moda para referirse a herramientas ms a bien simples para hacer reporter y paneles de control. El Monitoreo de Actividades de Negocio a (Business Activity Monitoring, BAM) se reere a las tecnolog que facilitan el monitoreo en as tiempo real de los procesos de negocio. El Procesamiento de Eventos Complejos (Complex Event Processing, CEP) se reere a las tecnolog que permiten procesar grandes cantidades de evenas tos, utilizndolos para monitorear, dirigir y optimizar el negocio en tiempo real. La Gestin del a o Desempeo Corporativo (Corporate Performance Management, CPM) es otra palabra de moda n para medir el desempeo de un proceso u organizacin. Tambin se relaciona con enfoques de gesn o e tin, tales como el Mejoramiento Continuo de Procesos (Continuous Process Improvement, CPI), o el Mejoramiento de Procesos de Negocio (Business Process Improvement, BPI), la Gestin de Cao lidad Total (Total Quality Management, TQM), y Six Sigma. Estos enfoques tienen en comn que u los procesos son puestos bajo el microscopio para ver si son posibles mejoras adicionales. La miner de procesos es una tecnolog que facilita CPM, BPI, TQM, Six Sigma, y similares. a a Mientras BI y los enfoques de gestin tales como Six Sigma y TQM buscan mejorar el desemo peo operacional, e.g., reducir el tiempo de ujo y los defectos, las organizaciones tambin estn n e a poniendo ms nfasis en el gobierno corporativo, los riesgos, y el cumplimiento de normativas. a e Legislaciones como la ley Sarbanes-Oxley (SOX) y el Acuerdo de Basilea II ilustran el foco en tpicos de cumplimiento de normativas. Las tcnicas de miner de procesos ofrecen un medio o e a para chequear de manera ms rigurosa el cumplimiento de normativas y establecer la validez y a conabilidad de la informacin acerca de los procesos cr o ticos de una organizacin. o Durante la ultima dcada, los datos sobre los eventos han comenzando a estar disponibles y e las tcnicas de miner de procesos han madurado. Adems, como ya se mencion, las tendene a a o cias de gestin relacionadas al mejoramiento de procesos (e.g., Six Sigma, TQM, CPI, y CPM) o y cumplimiento de normativas (SOX, BAM, etc.) se pueden beneciar de la miner de procesos. a Afortunadamente, los algoritmos de miner de procesos han sido implementados en diversos sisa temas acadmicos y comerciales. Hoy en d hay un grupo activo de investigadores trabajando en e a, miner de procesos y ha llegado a ser uno de los tpicos de moda en la investigacin en Gestin a o o o de Procesos de Negocio (Business Process Management, BPM). Adems, hay un enorme inters a e de la industria por la miner de procesos. Ms y ms proveedores de software estn agregando a a a a funcionalidades de miner de procesos en sus herramientas. Ejemplos de productos de softwaa re con capacidades de miner de procesos son: ARIS Process Performance Manager (Software a AG), Comprehend (Open Connect), Discovery Analyst (StereoLOGIC), Flow (Fourspark), Futura Reect (Futura Process Intelligence), Interstage Automated Process Discovery (Fujitsu), OKT Process Mining suite (Exeura), Process Discovery Focus (Iontas/Verint), ProcessAnalyzer (QPR), ProM (TU/e), Rbminer/Dbminer (UPC), y Reect|one (Pallas Athena). El creciente inters en el e anlisis de procesos basado en registros de eventos motiv la fundacin de una Fuerza de Trabajo a o o en Miner de Procesos. a La fuerza de trabajo se estableci en 2009 en el contexto del Comit Tcnico de Miner de o e e a Datos (Data Mining Technical Committee, DMTC) de la Sociedad de Inteligencia Computacional (Computational Intelligence Society, CIS) del Instituto de Ingenieros Elctricos y Electrnie o cos (Institute of Electrical and Electronic Engineers, IEEE). La fuerza de trabajo actual tiene miembros que representan a proveedores de software (e.g., Pallas Athena, Software AG, Futura Process Intelligence, HP, IBM, Infosys, Fluxicon, Businesscape, Iontas/Verint, Fujitsu, Fujitsu Laboratories, Business Process Mining, Stereologic), empresas consultoras/usuarios nales (e.g., 2 c IEEE TFoPM

Maniesto sobre Miner de Procesos a


El punto de partida es un registro de eventos. Cada evento se refiere a una instancia de proceso (caso) y una actividad. Los eventos estn ordenados y podran contener propiedades adicionales (e.g., marcas de tiempo o datos sobre recursos).

El registro de eventos puede ser utilizado para descubrir roles en la organizacin (e.g., grupos de personas con patrones de trabajo similar). Estos roles pueden ser utilizados para relacionar individuos con actividades.

Rol A: Asistente Pete Mike Ellen

Rol E: Experto Sue Sean

Rol G: Gerente Sara

examinar en detalle
A A

examinar informalmente
A

pagar compensacin decidir


A

registrar requerimiento inicio chequear ticket


G

rechazar requerimiento

fin

reiniciar requerimiento Se pueden utilizar tcnicas de descubrimiento para encontrar un modelo de control de flujo (en este caso en trminos de un modelo BPMN) que describe el mejor comportamiento observado. Se puede extraer informacin de desempeo (e.g., el tiempo promedio entre dos actividades consecutivas) a partir del registro de eventos, y visualizarla encima del modelo.

Se puede aprender reglas de decisin (e.g., un rbol de decisin basado en los datos conocidos al momento de tomar una cierta decisin) a partir del registro de eventos, y utilizarlas para documentar decisiones.

Figura 1. Las tcnicas de miner de procesos extraen conocimiento de los registros de eventos con el n e a de descubrir, monitorear, y mejorar los procesos

ProcessGold, Business Process Trends, Gartner, Deloitte, Process Sphere, Siav SpA, BPM Chile, BWI Systeme GmbH, Excellentia BPM, Rabobank), e institutos de investigacin (e.g., TU/e, o University of Padua, Universitat Polit`cnica de Catalunya, New Mexico State University, IST e Technical University of Lisbon, University of Calabria, Penn State University, University of Bari, Humboldt-Universitt zu Berlin, Queensland University of Technology, Vienna University of Ecoa nomics and Business, Stevens Institute of Technology, University of Haifa, University of Bologna, Ulsan National Institute of Science and Technology, Craneld University, K.U. Leuven, Tsinghua University, University of Innsbruck, University of Tartu, Ponticia Universidad Catlica de Chile). o Los objetivos concretos de la fuerza de trabajo son: generar conciencia en los usuarios nales, desarrolladores, consultores, gerentes de negocio, e investigadores acerca del estado del arte en miner de procesos, a promover el uso de tcnicas y herramientas de miner de procesos y estimular nuevas aplicae a ciones, tener un rol en los esfuerzos de estandarizacin para el registro de datos de eventos, o organizar tutoriales, sesiones especiales, talleres (workshops), paneles, y publicar art culos, libros, videos, y ediciones especiales de revistas cient cas. 3 c IEEE TFoPM

Maniesto sobre Miner de Procesos a Desde su fundacin en 2009, ha habido varias actividades relacionadas a los objetivos anterioo res. Por ejemplo, varios workshops y sesiones especiales fueron (co-)organizados por la fuerza de trabajo, e.g., los workshops sobre Inteligencia de Procesos de Negocio (BPI09, BPI10, y BPI11) y las sesiones especiales en las principales conferencias de la IEEE (e.g. CIDM11). El conocimiento fue diseminado v tutoriales (e.g. WCCI10 y PMPM09), escuelas de verano (ESSCaSS09, a ACPN10, CICH10, etc.), videos (cf. www.processmining.org), y varias publicaciones, incluyendo el primer libro sobre miner de procesos recientemente publicado por Springer.1 La fuerza de a trabajo tambin (co-)organiz el primer Desaf de Inteligencia de Procesos de Negocio (Business e o o Process Intelligence Challenge, BPIC11): una competencia donde los participantes tuvieron que extraer conocimiento relevante de un registro de eventos grande y complejo. En 2010, la fuerza de trabajo tambin estandariz XES (www.xes-standard.org), un formato de registro estndar que es e o a extensible y est respaldado por la OpenXES library (www.openxes.org) y por herramientas tales a como ProM, XESame, Nitro, etc. Se invita al lector a visitar http://www.win.tue.nl/ieeetfpm para ms informacin acerca de a o las actividades de la fuerza de trabajo.

2.

Miner de Procesos: Estado del Arte a

Las capacidades en expansin de los sistemas de informacin y otros sistemas que dependen de o o la computacin, estn bien caracterizadas por la ley de Moore. Gordon Moore, el co-fundador de o a Intel, vaticin en 1965 que el nmero de componentes en los circuitos integrados se duplicar todos o u a los aos. Durante los ultimos 50 aos el crecimiento ha sido de hecho exponencial, si bien es cierto n n que a un paso ligeramente ms lento. Estos avances resultaron en un crecimiento espectacular a del universo digital (i.e., todos los datos almacenados y/o intercambiados electrnicamente). o Adems, el universo digital y el real continan acercndose a estar ms y ms alineados. a u a a a El crecimiento de un universo digital que est bien alineado con los procesos en las organa zaciones hace posible registrar y analizar eventos. Los eventos podr variar desde el retiro de an dinero en efectivo desde un ATM, un doctor ajustando una mquina de rayos-X, un ciudadano a solicitando una licencia de conducir, el env de una declaracin de impuestos, y la recepcin de o o o un nmero de boleto electrnico por un viajero. El desaf es aprovechar los datos de eventos u o o en una forma signicativa, por ejemplo, para proveer un mejor entendimiento, identicar cuellos de botella, anticipar problemas, registrar violaciones de pol ticas, recomendar contramedidas, y simplicar procesos. La miner de procesos apunta a hacer exactamente eso. a El punto de partida de la miner de procesos es un registro de eventos. Todas las tcnicas de a e miner de procesos asumen que es posible registrar eventos secuencialmente tal que cada evento a se reera a una actividad (i.e., un paso bien denido en algn proceso) y se relacione a un caso u particular (i.e., una instancia de proceso). Los registros de eventos podr almacenar informacin an o adicional acerca de los eventos. De hecho, siempre que sea posible, las tcnicas de miner de e a procesos usan informacin extra, tales como el recurso (i.e., persona o dispositivo) que ejecuta o o inicia la actividad, la marca de tiempo del evento, o elementos de datos registrados con el evento (e.g., el tamao de un pedido). n Como se muestra en la Fig. 2, los registros de eventos pueden ser utilizados para realizar tres tipos de miner de procesos. El primer tipo de miner de procesos es el descubrimiento. Una a a tcnica de descubrimiento toma un registro de eventos y produce un modelo sin usar ninguna e informacin a-priori. El descubrimiento de procesos es la tcnica de miner de procesos ms deso e a a tacada. Para muchas organizaciones es sorprendente ver que las tcnicas existentes son realmente e capaces de descubrir los procesos reales meramente basado en las muestras de ejecucin en los o registros de eventos. El segundo tipo de miner de procesos es la conformidad. Aqu se compara a , un modelo de proceso existente con un registro de eventos del mismo proceso. La vericacin de o conformidad puede ser usada para chequear si la realidad, tal como est almacenada en el registro a de eventos, es equivalente al modelo y viceversa. Note que distintos tipos de modelos pueden ser
1

W.M.P. van der Aalst. Process Mining: Discovery, Conformance and Enhancement of Business Processes. Springer-Verlag, Berlin, 2011. http://www.processmining.org/book

c IEEE TFoPM

Maniesto sobre Miner de Procesos a

mundo procesos de
negocio personas mquinas componentes organizaciones

apoya/ controla

Sistemas de Software
registra eventos, e.g., mensajes, transacciones, etc.

modela analiza

especifica configura implementa analiza

descubrimiento

modelos (de procesos)

conformidad mejoramiento

registro de eventos

Figura 2. Posicionamiento de los tres tipos principales de miner de procesos: (a) descubrimiento, (b) a vericacin de conformidad, y (c) mejoramiento. o

considerados: la vericacin de conformidad puede ser aplicada a modelos procedurales, modelos o organizacionales, modelos de procesos declarativos, pol ticas/reglas de negocio, regulaciones, etc. El tercer tipo de miner de procesos es el mejoramiento. Aqu la idea es extender o mejorar un a , modelo de proceso existente usando la informacin acerca del proceso real almacenada en algn o u registro de eventos. Mientras la vericacin de conformidad mide el alineamiento entre el modelo o y la realidad, este tercer tipo de miner de procesos busca cambiar o extender el modelo a-priori. a Por ejemplo, al usuar marcas de tiempo en el registro de eventos, uno puede extender el modelo para mostrar cuellos de botella, niveles de servicio, tiempos de procesamiento, y frecuencias. La Fig. 3 describe los tres tipos de miner de procesos en trminos de entradas y salidas. a e Las tcnicas para descubrimiento toman un registro de eventos y producen un modelo. El modelo e descubierto es t picamente un modelo de proceso (e.g., una red de Petri, un BPMN, un EPC, o un diagrama de actividad UML), sin embargo, el modelo podr tambin describir otras perspectivas a e (e.g., una red social). Las tcnicas de vericacin de conformidad necesitan un registro de eventos y e o un modelo como entrada. La salida consiste en informacin de diagnstico mostrando las diferencias o o y elementos en comn entre el modelo y el registro de eventos. Las tcnicas para mejoramiento de u e modelos (reparar o extender) tambin necesitan un registro de eventos y un modelo como entrada. e La salida es un modelo mejorado o extendido.

(a)

registro de eventos

descubrimiento

modelo

(b)

registro de eventos modelo

verificacin de conformidad

diagnsticos

(c)

registro de eventos mejoramiento modelo

nuevo modelo

Figura 3. Los tres tipos bsicos de miner de procesos explicados en trminos de entradas y salidas: (a) a a e descubrimiento, (b) vericacin de conformidad, y (c) mejoramiento. o

La miner de procesos podr cubrir diferentes perspectivas. La perspectiva de control de ujo a a se enfoca en el control de ujo, i.e., el orden de ejecucin de las actividades. El objetivo de o 5 c IEEE TFoPM

Maniesto sobre Miner de Procesos a explorar esta perspectiva es encontrar una buena caracterizacin de todos los caminos posibles. o El resultado se expresa t picamente en trminos de una red de Petri o alguna otra notacin de e o procesos (e.g., EPCs, BPMN, o diagramas de actividad UML). actores (e.g., personas, sistemas, o departamentos) estn involucrados y cmo se relacionan. El objetivo es ya sea estructurar la a o organizacin clasicando a las personas en trminos de roles y unidades organizacionales, o mostrar o e la red social. La perspectiva de casos se enfoca en las propiedades de los casos. Obviamente, un caso puede ser caracterizado por su ruta en el proceso o por los actores que trabajan en l. Sin embargo, e los casos tambin pueden ser caracterizados por los valores de los correspondientes elementos de e datos. Por ejemplo, si un caso representa un pedido de reposicin, podr ser interesante conocer o a el proveedor o la cantidad de productos solicitados. La perspectiva de tiempo se relaciona con la ocurrencia y frecuencia de los eventos. Cuando los eventos tienen asociados marcas de tiempo, es posible descubrir cuellos de botella, medir niveles de servicio, monitorear la utilizacin de recursos, o y predecir el tiempo de procesamiento restante de casos en ejecucin. o Hay algunas ideas erradas en relacin a miner de procesos. Algunos proveedores, analistas, o a e investigadores limitan el alcance de la miner de procesos a una tcnica especial de miner de a e a datos para el descubrimiento de procesos que puede solo ser usada para anlisis oine. Esto no a es as por lo tanto, enfatizamos las siguientes tres caracter , sticas. La miner de procesos no est limitada al descubrimiento del control de ujo. El descubria a miento de modelos de procesos desde los registros de eventos llena la imaginacin tanto de o profesionales como de acadmicos. Por lo tanto, el descubrimiento del control de ujo es a mee nudo visto como la parte ms emocionante de la miner de procesos. Sin embargo, la miner a a a de procesos no se limita al descubrimiento del control de ujo. Por una parte, el descubrimiento es slo una de las tres formas bsicas de miner de procesos (descubrimiento, conformidad, y o a a mejoramiento). Por otra parte, el alcance no est limitado al control de ujo; las perspectivas a organizacional, de casos y de tiempo tambin cumplen un rol importante. e La miner de procesos no es slo un tipo espec a o co de miner de datos. La miner de procesos a a se puede ver como el eslabn perdido entre la miner de datos y el BPM tradicional basado o a en modelos. La mayor de las tcnicas de miner de datos no estn en absoluto centradas en a e a a procesos. Los modelos de proceso que potencialmente exhiben concurrencia son incomparables a las estructuras de miner de datos simples, tales como los rboles de decisin y las reglas a a o de asociacin. Por lo tanto, se necesitan nuevos tipos de representacin y de algoritmos. o o La miner de procesos no est limitada al anlisis oine. Las tcnicas de miner de procesos a a a e a extraen conocimiento de los datos de eventos histricos. Aunque se utilizan datos post moro tem, los resultados pueden ser aplicados a casos en ejecucin. Por ejemplo, se puede predecir o el tiempo de nalizacin de un pedido del cliente parcialmente realizado, usando un modelo o de proceso descubierto. Para posicionar la miner de procesos, usamos el ciclo de vida de BPM mostrado en la Fig. 4. a El ciclo de vida de BPM muestra las siete fases de un proceso de negocio y sus correspondientes sistemas de informacin. En la fase de (re)diseo se crea un nuevo modelo de proceso o se adapta o n un modelo de proceso existente. En la fase de anlisis se analiza un modelo candidato y sus a alternativas. Despus de la fase de (re)diseo, se implementa el modelo (fase de implementacin) e n o o se (re)congura un sistema existente (fase de (re)conguracin). En la fase de ejecucin se o o ejecuta el modelo diseado. Durante la fase de ejecucin el proceso es monitoreado. Adems, se n o a podr realizar pequeos ajustes sin redisear el proceso (fase de ajuste). En la fase de diagnstico an n n o se analiza el proceso ejecutado y la salida de esta fase podr gatillar una nueva fase de rediseo del a n proceso. La miner de procesos es una herramienta valiosa para la mayor de las fases mostradas a a en la Fig. 4. Obviamente, la fase de diagnstico puede beneciarse de la miner de procesos. Sin o a embargo, la miner de procesos no est limitada a la fase de diagnstico. Por ejemplo, en la fase a a o de ejecucin, las tcnicas de miner de procesos se pueden usar para el soporte operacional. Se o e a pueden utilizar predicciones y recomendaciones basadas en modelos aprendidos usando informacin o histrica para inuenciar los casos en ejecucin. Se pueden utilizar formas similiares de apoyo a la o o toma de decisiones para ajustar los procesos y guiar la (re)conguracin de procesos. o 6 c IEEE TFoPM

Maniesto sobre Miner de Procesos a


diagnstico

ajuste

anlisis

ejecucin

(re)diseo

(re)configuracin

implementacin

Figura 4. El ciclo de vida de BPM identicando las diferentes fases de un proceso de negocio y sus correspondientes sistemas de informacin; la miner de procesos cumple (potencialmente) un rol en todas o a las fases (excepto la fase de implementacin). o

Mientras la Fig. 4 muestra el ciclo de vida BPM como un todo, la Fig. 5 se enfoca en las actividades y artefactos concretos de miner de procesos. La Fig. 5 describe las etapas posibles a en un proyecto de miner de procesos. Cualquier proyecto de miner de procesos comienza con a a una planicacin y una justicacin para esta planicacin (Etapa 0). Despus de iniciado el o o o e proyecto, se necesita extraer los datos de eventos, modelos, objetivos, y preguntas a partir de los sistemas, expertos del dominio, y la gestin (Etapa 1). Esto requiere un entendimiento de o los datos disponibles (Qu puede ser usado para el anlisis?) y un entendimiento del dominio e a (Cules son las preguntas importantes?) y tiene como resultado los artefactos mostrados en la a Fig. 5 (i.e., datos histricos, modelos hechos a mano, objetivos, y preguntas). En la Etapa 2, se o construye el modelo de control de ujo y se le relaciona con el registro de eventos. Aqu se pueden , utilizar tcnicas automticas de descubrimiento de procesos. El modelo de procesos descubierto e a ya podr proveer respuestas a algunas de las preguntas y gatillar acciones de rediseo o ajuste. a n Adems, se podr ltrar o adaptar el registro de eventos usando el modelo (e.g., eliminando a a actividades poco frecuentes o casos at picos, e insertando eventos faltantes). Algunas veces se necesitan signicativos esfuerzos para correlacionar eventos que pertenecen a la misma instancia de un proceso. Los eventos restantes estn relacionados con entidades del modelo de proceso. a Cuando el proceso es relativamente estructurado, el modelo de control de ujo podr ser extendido a con otras perspectivas (e.g., datos, tiempo, y recursos) durante la Etapa 3. La relacin entre el o registro de eventos y el modelo establecido en la Etapa 2 se utiliza para extender el modelo (e.g., se utilizan las marcas de tiempo de los eventos asociados para estimar los tiempos de espera para las actividades). Esto podr utilizarse para responder preguntas adicionales y podr gatillar acciones a a adicionales. En ultima instancia, los modelos construidos en la Etapa 3 podr ser utilizado para an apoyar las operaciones (Etapa 4). El conocimiento extra de los datos de eventos histricos se do o combina con la informacin acerca de los casos en ejecucin. Esto podr utilizarse para intervenir, o o a predecir, y recomendar. Las Etapas 3 y 4 slo se pueden alcanzar si el proceso es sucientemente o estable y estructurado. Actualmente, hay tcnicas y herramientas que pueden apoyar todas las etapas mostradas en e la Fig. 5. Sin embargo, la miner de procesos es un paradigma relativamente nuevo y la mayor a a de las herramientas actuales son todav algo inmaduras. Adems, los usuarios potenciales a a a menudo no son conscientes del potencial y las limitaciones de la miner de procesos. Por lo a tanto, este maniesto cataloga algunos principios rectores (cf. Seccin 3) y desaf (cf. Seccin 4) o os o para los usuarios de las tcnicas de miner de procesos, as como tambin para los investigadores e a e y desarrolladores que estn interesados en el avance del estado del arte. a 7 c IEEE TFoPM

Maniesto sobre Miner de Procesos a


Etapa 0: planificar y justificar
entender los datos disponibles

entender el dominio

Etapa 1: extraer

datos histricos

modelos manuales

objetivos (KPIs)

preguntas

Etapa 2: crear modelo de control de flujo y conectar a registro de eventos

registro de eventos

modelo control de flujo

redisear

Etapa 3: crear modelo de proceso integrado

interpretar

ajustar

datos actuales

registro de eventos

modelo de proceso

intervenir

Etapa 4: soporte operacional

apoyar

Figura 5. El modelo de ciclo de vida L describe un proyecto de miner de procesos consistente de cinco a etapas: planicar y justicar (Etapa 0), extraer (Etapa 1), crear un modelo de control de ujo y conectarlo con el registro de eventos (Etapa 2), crear un modelo de proceso integrado (Etapa 3), y proveer soporte operacional (Etapa 4).

3.

Principios Rectores

Como con cualquier nueva tecnolog hay errores obvios que pueden cometerse cuando se aplica a, miner de procesos en entornos de la vida real. Por lo tanto, listamos seis principios rectores para a evitar que los usuarios/analistas comentan dichos errores. 3.1. PR1: Los Datos de Eventos Deber an Ser Tratados como Ciudadanos de Primera Clase

El punto de partida para cualquier actividad de miner de procesos son los eventos registrados. a Nos referimos a colecciones de eventos como registros de eventos, sin embargo, esto no implica que los eventos deban estar almacenados en archivos de registro dedicados. Los eventos podr estar an almacenados en tablas de bases de datos, registros de mensajes, archivos de correo, registros de transacciones, y otras fuentes de datos. Ms importante que el formato de almacenamiento, es a la calidad de tales registros de eventos. La calidad de un resultado de miner de procesos en a gran medida depende de la entrada. Por lo tanto, los registros de eventos deber ser tratados an como ciudadanos de primera clase en los sistemas de informacin que apoyan los procesos a o ser analizados. Desafortunadamente, los registros de eventos son a menudo meramente un subproducto utilizado para depurar o medir el rendimiento del software. Por ejemplo, los dispositivos 8 c IEEE TFoPM

Maniesto sobre Miner de Procesos a mdicos de Philips Healthcare registran eventos simplemente porque los desarrolladores de software e han insertado instrucciones de impresin en el cdigo. Aunque hay algunas directrices informales o o para agregar dichas instrucciones al cdigo, se necesita un enfoque ms sistemtico para mejorar o a a la calidad de los registros de eventos. Los datos de eventos deber ser vistos como ciudadanos an de primera clase (ms que ciudadanos de segunda clase). a Hay varios criterios para juzgar la calidad de los datos de eventos. Los eventos deben ser conables, i.e., deber ser seguro asumir que los eventos registrados realmente ocurrieron y que a los atributos de los eventos son correctos. Los registros de eventos deber ser completos, i.e., an dado un determinado contexto, no puede faltar ningn evento. Cualquier evento registrado debe u tener una semntica bien denida. Adems, los datos de eventos deben ser seguros en el sentido a a que se tengan en cuentas consideraciones de privacidad y seguridad al registrar los eventos. Por ejemplo, los actores deben ser conscientes del tipo de eventos que se registra y la forma en que se utilizan. La Tabla 1 dene cinco niveles de madurez de un registro de eventos que van desde excelente calidad ( ) a mala calidad ( ). Por ejemplo, los registros de eventos de Philips Healthcare residen en el nivel , i.e., los eventos se registran automticamente y el comportamiento rea gistrado calza con la realidad, pero no existe un enfoque sistemtico para asignar semntica a los a a eventos y para garantizar cobertura en un nivel particular. Las tcnicas de miner de procesos e a pueden ser aplicadas a registros de eventos en niveles , y . En principio, tambin es e posible aplicar miner de procesos utilizando registros de eventos en niveles a o . Sin embargo, el anlisis de dichos registros de eventos es generalmente problemtico y los resultados no son a a conables. De hecho, no tiene mucho sentido aplicar miner procesos a registros de eventos en el a nivel . Para obtener benecio de la miner de procesos, las organizaciones deben apuntar a registros a de eventos en el nivel de calidad ms alto posible. a 3.2. PR2: La Extraccin de Registros de Eventos Deber Ser Impulsada por o a Preguntas

Como se muestra en la Fig. 5, las actividades de miner de procesos necesitan ser impulsaa das por preguntas. Sin preguntas concretas es muy dif extraer datos de eventos signicativos. cil Considere, por ejemplo, los miles de tablas en la base de datos de un sistema ERP como SAP. Sin preguntas concretas es imposible seleccionar las tablas relevantes para la extraccin de datos. o Un modelo de proceso como el mostrado en la Fig. 1 describe el ciclo de vida de los casos (i.e., instancias de proceso) de un tipo particular. Por lo tanto, antes de aplicar cualquier tcnica de e miner de procesos hay que elegir el tipo de casos a ser analizado. Esta eleccin debe ser impulsada a o por las preguntas que se necesita contestar, y esto puede no ser trivial. Considere, por ejemplo, el manejo de pedidos de los clientes. Cada pedido de un cliente podr consistir de mltiples l a u neas de pedido, dado que el cliente podr solicitar varios productos en un solo pedido. Un pedido a del cliente podr resultar en varias entregas. Una entrega puede referirse a l a neas de pedido de mltiples pedidos. Por lo tanto, existe una relacin de muchos a muchos entre los pedidos y las u o entregas, y una relacin de uno a muchos entre los pedidos y las l o neas de pedido. Dada una base de datos con datos de eventos relacionados con los pedidos, las l neas de pedido, y las entregas, hay diferentes modelos de proceso que pueden ser descubierto. Se puede extraer datos con el objetivo de describir el ciclo de vida de cada pedido. Sin embargo, tambin es posible extraer datos con el e objetivo de descubrir el ciclo de vida de cada l nea de pedido o el ciclo de vida de cada entrega. 3.3. PR3: Se Deber Dar Soporte a Concurrencia, Eleccin y Otros Conceptos a o Bsicos de Control de Flujo a

Existe una gran cantidad de lenguajes de modelacin de procesos (e.g., BPMN, EPC, redes o de Petri, BPEL, y los diagramas de actividad UML). Algunos de estos lenguajes proporcionan muchos elementos de modelacin (e.g., BPMN ofrece ms de 50 elementos grcos distintos), o a a mientras que otros son muy bsicos (e.g., las redes de Petri se componen de slo tres elementos a o 9 c IEEE TFoPM

Maniesto sobre Miner de Procesos a


Cuadro 1. Niveles de madurez para los registros de eventos. Nivel Caracterizacin o Nivel ms alto: el registro de eventos es de excelente calidad (i.e., cona able y completo) y los eventos estn bien denidos. Los eventos se a registran de manera automtica, sistemtica, conable, y segura. Se toa a man en cuenta adecuadamente consideraciones acerca de la privacidad y la seguridad. Adems, los eventos registrados (y todos sus atributos) a tienen una semntica clara. Esto implica la existencia de una o ms a a ontolog Los eventos y sus atributos se reeren a esta ontolog as. a. Ejemplo: registros de eventos anotados semticamente de los sistemas a BPM. Los eventos se registran automticamente y de manera sistemtica y a a conable, i.e., los registros de eventos son conables y completos. A diferencia de los sistemas operando a nivel , se da soporte de manera expl cita a nociones tales como instancia de proceso (caso) y actividad. Ejemplo: los registros de eventos de los sistemas tradicionales de BPM/workow. Los eventos se registran automticamente, pero no se sigue un enfoque a sistemtico para registrar los eventos. Sin embargo, a diferencia de los a registros de eventos en el nivel , hay algn nivel de garant que los u a eventos registrados calzan con la realidad (i.e., el registro de eventos es conable pero no necesariamente completo). Considere, por ejemplo, los eventos registrados por un sistema ERP. Aunque se necesita extraer los eventos de una variedad de tablas, se puede asumir que la informacin o es correcta (e.g., es razonable asumir que un pago registrado por el ERP efectivamente existe, y viceversa). Ejemplo: las tablas en un sistema ERP, los registros de eventos de sistemas CRM, registros de transacciones de sistemas de mensajer a, registros de eventos de sistemas de alta tecnolog etc. a, Los eventos se registran automticamente, i.e., como un subproducto a de algn sistema de informacin. La cobertura var i.e., no se sigue un u o a, enfoque sistemtico para decidir qu eventos se registran. Adems, es a e a posible pasar por alto el sistema de informacin. Por lo tanto, podr o an faltar eventos o stos podr no registrarse correctamente. e an Ejemplo: los registros de eventos de sistemas de gestin de documentos o y productos, registros de errores de sistemas embebidos, planillas de ingenieros de servicios, etc. Nivel ms bajo: los registros de eventos son de mala calidad. Los evena tos registrados podr no corresponder a la realidad y podr faltar an an eventos. Los registros de eventos en los cuales los eventos se registran manualmente suelen tener dichas caracter sticas. Ejemplo: trazas dejadas en documentos en papel que se trasladan a travs de la organizacin (notas tipo Post-it), expedientes mdicos e o e en papel, etc.

diferentes: sitios, transiciones y arcos). La descripcin del control de ujo es la columna vertebral o de cualquier modelo de proceso. Los conceptos basicos de control de ujo (tambin conocidos e como patrones) a los cuales todos los lenguajes principales dan soporte son secuencia, paralelismo (AND-splits/joins), eleccin (XOR-splits/joins), y ciclos. Obviamente, las tcnicas de miner de o e a procesos deber dar soporte a estos patrones. Sin embargo, algunas tcnicas no son capaces de an e manejar la concurrencia y slo permiten cadenas de Markov/sistemas de transiccin. o o La Fig. 6 muestra el efecto de usar tcnicas de miner de procesos que no son capaces de descue a brir la concurrencia (sin AND-split/joins). Consider un registro de eventos L = { A, B, C, D, E , A, B, D, C, E , A, C, B, D, E , A, C, D, B, E , A, D, B, C, E , A, D, C, B, E }. L contiene casos que parten con A y nalizan con E. Las actividades B, C, y D ocurren en cualquier orden entre 10 c IEEE TFoPM

Maniesto sobre Miner de Procesos a


B A C D
(a) B, C, y D pueden ser ejecutadas en cualquier orden

B A C D
(b) B, C, y D pueden ser ejecutadas en cualquier orden, pero tambin varias veces

C B D B A C D B D C
(c) B, C, y D pueden ser ejecutadas en cualquier orden, pero se necesita duplicar las actividades para modelar todas las secuencias observadas

Figura 6. Ejemplo que ilustra los problemas que ocurren cuando no se puede expresar directamente la concurrencia (i.e., AND-splits/joins). En el ejemplo slo tres actividades (B, C, y D) son concurrentes. o Imagine los modelos de proceso resultantes cuando hay 10 actividades concurrentes (210 = 1,024 estados y 10! = 3,628,800 posibles secuencias de ejecucin). o

A y E. El modelo BPMN en la Fig. 6(a) muestra una representacin compacta del proceso subo yacente usando dos compuertas AND. Suponga que la tcnica de miner de procesos no soporta e a compuertas AND. En este caso, los otros dos modelos BPMN en la Fig. 6 son candidatos obvios. El modelo BPMN en la Fig. 6(b) es compacto, pero permite demasiados comportamientos (e.g., casos tales como A, B, B, B, E son posibles de acuerdo al modelo, pero no son probables de acuerdo al registro de eventos). El modelo BPMN en la Fig. 6(c) permite los casos en L, pero considera todas las secuencias expl citamente, por lo que no es una representacin compacta del registro o de eventos. El ejemplo muestra que para modelos de la vida real con docenas de actividades potencialmente concurrentes, los modelos resultantes son sub-ajustados (i.e., permiten demasiados comportamientos) y/o son extremadamente complejos si no se soporta concurrencia. Como se ilustra en la Fig. 6, es importante dar soporte al menos a los patrones bsicos de a workow. Adems de los patrones bsicos mencionados, es tambin desesable dar soporte a ORa a e splits/joins, ya que estos proporcionan una representacin compacta de decisiones inclusivas y o sincronizaciones parciales. 3.4. PR4: Los Eventos Deber Estar Relacionados a Elementos del Modelo an

Como se indic en la Seccin 2, es un error pensar que la miner de procesos se limita al o o a descubrimiento de control de ujo. Como se muestra en la Fig. 1, el modelo de proceso descubierto podr cubrir diversas perspectivas (perspectiva organizacional, perspectiva temporal, perspectiva a de datos, etc.). Adems, el descubrimiento es slo uno de los tres tipos de miner de procesos a o a mostrados en la Fig. 3. Los otros dos tipos de miner de procesos (vericacin de conformidad a o y mejoramiento) dependen fuertemente de la relacin entre los elementos en el modelo y los o 11 c IEEE TFoPM

Maniesto sobre Miner de Procesos a eventos en el registro de eventos. Esta relacin podr ser usada para repetir la ejecucin del o a o registro de eventos sobre el modelo. La repeticin de la ejecucin podr ser utilizada para revelar o o a discrepancias entre un registro de eventos y un modelo, e.g., algunos eventos en el registro de eventos no son posibles de acuerdo al modelo. Las tcnicas para la vericacin de conformidad, e o cuantican y diagnostican dichas discrepancias. Las marcas de tiempo en el registro de eventos se pueden utilizar para analizar el comportamiento temporal durante la repeticin de la ejecucin. o o Las diferencias de tiempo entre las actividades relacionadas causalmente se pueden utilizar para agregar tiempos de espera estimados en el modelo. Estos ejemplos muestran que la relacin entre o los eventos en el registro de eventos y los elementos en el modelo sirve como punto de partida para diferentes tipos de anlisis. a En algunos casos puede no ser trivial establecer dicha relacin. Por ejemplo, un evento podr o a referirse a dos actividades diferentes o no estar claro a qu actividad se reere. Tales ambigedades e u deben ser eliminadas a n de interpretar correctamente los resultados de la miner de procesos. a Adems del problema de relacionar los eventos con actividades, existe el problema de relacionar a los eventos con instancias de proceso. Esto comnmente se conoce como correlacin de eventos. u o 3.5. PR5: Se Deber Tatar a los Modelos como Abstracciones Utiles de la Realidad a

Los modelos derivados de datos de eventos proporcionan puntos de vista sobre la realidad. Dichos puntos de vista deber proporcionar una abstraccin util del comportamiento capturado an o en el registro de eventos. Dado un registro de eventos, podr haber mltiples puntos de vista a u que son utiles. Adems, las diversas partes interesadas pueden requerir diferentes puntos de vista. a De hecho, los modelos descubiertos a partir de los registros de eventos deber ser visto como an mapas (como los mapas geogrcos). Este principio rector proporciona importantes intuiciones, a dos de los cuales se describen a continuacin. o En primer lugar, es importante tener en cuenta que no hay tal cosa como el mapa de un a rea geogrca particular. Dependiendo del uso previsto existen diferentes mapas: mapas de caa rreteras, mapas de senderismo, mapas de ciclismo, etc. Todos estos mapas muestran un punto de vista sobre una misma realidad, y ser absurdo suponer que habr tal cosa como el mapa a a perfecto. Lo mismo vale para los modelos de proceso: el modelo deber enfatizar las cosas rea levantes para un determinado tipo de usuario. Los modelos descubiertos podr focalizarse en an diferentes perspectivas (control de ujo, ujo de datos, tiempo, recursos, costos, etc.) y mostrarlas en diferentes niveles de granularidad y precisin, e.g., un gerente podr querer ver un modelo de o a proceso informal grueso que se focaliza en los costos, mientras que un analista de procesos podr a querer ver un modelo de proceso detallado que se focaliza en las desviaciones del ujo normal. Tambin tenga en cuenta que las diferentes partes interesadas podr desear ver un proceso en e an diferentes niveles: nivel estratgico (las decisiones en este nivel tienen efectos a largo plazo y se e basan en datos de eventos agregados a travs de un per e odo ms largo), nivel tctico (las decisiones a a en este nivel tienen efectos a mediano plazo y se basan principalmente en datos recientes), nivel operacional (las decisiones en este nivel tienen efectos inmediatos y se basan en datos de eventos relacionados con casos en ejecucin). o En segundo lugar, es util adoptar ideas de la cartograf a la hora de producir mapas com a prensibles. Por ejemplo, los mapas de carreteras pasan por alto las carreteras y ciudades menos importantes. Las cosas menos importantes son dejadas de lado o dinmicamente agrupadas en fora mas agregadas (e.g., calles y suburbios se agrupan en ciudades). Los cartgrafos no slo eliminan o o los detalles irrelevantes, sino que tambin utilizan colores para destacar caracter e sticas importantes. Adems, los elementos grcos tienen un tamao especial para indicar su relevancia (e.g., el a a n tamao de las l n neas y puntos puede variar). Los mapas geogrcos tambin tienen una interpretaa e cin clara de los eje-x y eje-y, i.e., el diseo de un mapa no es arbitrario, dado que las coordenadas o n de los elementos tienen un signicado. Todo esto est en marcado contraste con los principales a modelos de procesos que no utilizan t picamente los atributos de color, tamao, y ubicacin para n o hacer los modelos ms comprensible. Sin embargo, las ideas de la cartograf se pueden incorporar a a fcilmente en la construccin de los mapas de proceso descubiertos. Por ejemplo, el tamao de a o n una actividad puede ser utilizado para reejar su frecuencia o alguna otra propiedad que indica 12 c IEEE TFoPM

Maniesto sobre Miner de Procesos a su relevancia (por ejemplo, costos o uso de recursos). El ancho de un arco puede reejar la importancia de la dependencia causal correspondiente, y el color de los arcos se puede utilizar para destacar los cuellos de botella. Las observaciones anteriores muestran que es importante seleccionar la representacin correcta o y sintonizarla para la audiencia objetivo. Esto es importante para la visualizacin de los resultados o para los usuarios nales y para guiar a los algoritmos de descubrimiento hacia modelos adecuados (vase tambin el Desaf D5). e e o 3.6. PR6: La Miner de Procesos Deber Ser un Proceso Continuo a a

La miner de procesos puede ayudar a proveer mapas signifactivos que estn conectados a a directamente a los datos de eventos. Tanto los datos de eventos histricos como los datos actuao les se pueden proyectar en estos modelos. Adems, los procesos cambian mientras estn siendo a a analizados. Dada la naturaleza dinmica de los procesos, no es recomendable ver a la miner de a a procesos como una actividad puntual. El objetivo no deber ser la creacin de un modelo jo, a o sino que dar vida a los modelos de procesos, de manera que se incentive a los usuarios y analistas a mirarlos diariamente. Compare esto con el uso de mashups utilizando geo-tagging. Hay miles de mashups que utilizan Google Maps (e.g., las aplicaciones que proyectan en un mapa seleccionado informacin sobre las o condiciones del trco, bienes ra a ces, restaurantes de comida rpida, o las carteleras de cine). La a gente puede sin problemas ampliar y reducir dichos mapas e interactuar con ellos (e.g., los atascos de trco se proyectan en el mapa y el usuario puede seleccionar un problema particular para a ver los detalles). Tambin deber ser posible realizar miner de procesos basada en datos de e a a eventos en tiempo real. Utilizando la metfora del mapa, podemos pensar que los eventos tienen a coordenadas GPS que pueden ser proyectadas en los mapas en tiempo real. En forma anloga a los a sistemas de navegacin para automviles, las herramientas de miner de procesos pueden ayudar o o a a los usuarios nales a (a) navegar a travs de los procesos, (b) proyectar informacin dinmica e o a sobre los mapas de procesos (e.g., mostrando atascos de trco en los procesos de negocio), a y (c) proporcionar predicciones respecto a los casos en ejecucin (e.g., estimando el tiempo de o arribo de un caso que se retras). Estos ejemplos demuestran que es una pena que no se utilicen o modelos de procesos ms activamente. Por lo tanto, la miner de procesos deber ser vista como a a a un proceso continuo, proporcionando informacin util en diversas escalas de tiempo (minutos, o horas, d semanas y meses). as,

4.

Desaf os

La miner de procesos es una herramienta importante para las organizaciones modernas que a necesitan gestionar procesos operacionales no triviales. Por un lado, hay un incre ble crecimiento en la cantidad de datos de eventos. Por otro lado, los procesos y la informacin necesitan estar o perfectamente alineados para cumplir requerimientos relacionados con el cumplimiento de normas, eciencia y servicio al cliente. A pesar de la aplicabilidad de la miner de procesos an hay desaf a u os importantes que necesitan ser abordados; estos ilustran que la miner de procesos es una disciplina a emergente. A continuacin, entregamos una lista de algunos de estos desaf No se pretende que o os. esta lista sea completa y, en el tiempo, podr aparecer nuevos desaf o podr desaparecer an os an desaf existentes debido a los avances en miner de procesos. os a 4.1. D1: Encontrar, Fusionar y Limpiar Datos de Eventos

Todav toma esfuerzos considerables extraer datos de eventos apropiados para la miner de a a procesos. T picamente, se necesita superar varios obstculos: a Los datos pueden estar distribu dos en varias fuentes. Esta informacin necesita ser fusionada. o Esto tiende a ser problemtico cuando se utilizan distintos identicadores en las diferentes a fuentes de datos. Por ejemplo, un sistema usa el nombre y la fecha de nacimiento para identicar una persona mientras que otro sistema utiliza el nmero de seguridad social de la persona. u 13 c IEEE TFoPM

Maniesto sobre Miner de Procesos a Los datos de eventos estn a menudo centrados en objetos ms que centrados en procesos. a a Por ejemplo, productos individuales, pallets, y contenedores pueden tener etiquetas RFID y eventos registrados referidos a esas etiquetas. Sin embargo, para monitorear una orden de un cliente en particular, tales eventos centrados en objetos necesitan ser fusionados y preprocesados. Los datos de eventos pueden estar incompletos. Un problema comn es que los eventos no u apuntan expl citamente a intancias del proceso. A menudo es posible derivar esta informacin, o pero esto puede tomar esfuerzos considerables. Tambin la informacin de tiempo puede estar e o perdida para algunos eventos. Uno puede necesitar interpolar las marcas de tiempo para an u utilizar la informacin de tiempo disponible. o Un registro de eventos puede contener datos at picos (outliers), i.e., comportamiento excepcional tambin referido como ruido. Cmo denir outliers? Cmo detectar tales outliers? Se e o o necesita responder estas preguntas para limpiar los datos de eventos. Los registros de eventos pueden contener eventos en diferentes niveles de granularidad. En el registro de eventos de un sistema de informacin de un hospital los eventos se pueden referir o a examenes de sangre simples o a procedimientos quirrgicos complejos. Tambin las marcas u e de tiempos pueden tener diferentes niveles de granularidad que van desde una precisin de o milisegundos (28-9-2011:h11m28s32ms342) a informacin de tiempo gruesa (28-9-2011). o Los eventos ocurren en un contexto particular (clima, carga de trabajo, d de la semana, a etc.). Este contexto puede explicar ciertos fenmenos, por ejemplo, el tiempo de respuesta es o ms largo que el usual debido a trabajos-en-desarrollo o por vacaciones. Para el anlisis, es a a deseable incorporar este contexto. Esto implica la fusin de datos de eventos con datos de o contexto. Aqu la la maldicin de la dimensionalidad aparece cuando el anlisis se convierte o a en intratable al agregar demasiadas variables. Se necesitan mejores herramientas y metodolog para abordar los problemas anteriores. as Adems, como indicamos antes, las organizaciones necesitan tratar los registros de eventos como a ciudadanos de primera clase ms que un sub-producto. El objetivo es obtener registros de eventos a (ver Tabla 1). Aqu las lecciones aprendidas en el contexto de almacenamiento de datos , (datawarehousing) son muy utiles para asegurar una alta calidad en los registros de eventos. Por ejemplo, revisiones simples durante el ingreso de datos pueden ayudar a reducir signicativamente la proporcin de datos de eventos incorrectos. o 4.2. D2: Lidiar con Registros de Eventos Complejos con Diversas Caracter sticas

Los registros de eventos pueden tener diferentes caracter sticas. Algunos registros de eventos pueden ser extremadamente grandes lo cual hace dif manipularlos mientras otros registros de cil eventos son tan pequeos que no tienen sucientes datos para obtener conclusiones conables. n En algunos dominios, se registran cantidades alucinantes de eventos. Por lo tanto, se necesitan esfuerzos adicionales para mejorar el desempeo y la escalabilidad. Por ejemplo, ASML est conn a tinuamente monitoreando todos sus escner de obleas (wafer scanners). Estos escner de obleas a a son utilizados por varias organizaciones (e.g., Samsung y Texas Instruments) para producir chips (aprox. 70 % de los chips son producidos utilizando los escner de obleas de ASML). Las hea rramientas existentes tienen dicultades para lidiar con los petabytes de datos recolectados en tales dominios. Adems del nmero de eventos registrados hay otras caracter a u sticas tales como el nmero promedio de eventos por caso, similaridades entre casos, el nmero de eventos unicos, y el u u nmero de caminos unicos. Considere un registro de eventos L1 con las siguientes caracter u sticas: 1000 casos, un promedio de 10 eventos por caso, y poca variacin (e.g., varios casos siguen el o mismo camino o caminos muy similares). El registro de eventos L2 contiene slo 100 casos, pero o en promedio hay 100 eventos por caso y todos los casos siguen un camino propio. Claramente, L2 es mucho ms dif de analizar que L1 an cuando los dos registros de eventos tienen tamaos a cil u n similares (aproximadamente 10.000 eventos). Dado que los registros de eventos contienen slo muestras de comportamiento, no se puede o asumir que ellos estn completos. Las tcnicas de miner de procesos necesitan lidiar con la a e a 14 c IEEE TFoPM

Maniesto sobre Miner de Procesos a incompletitud de datos utilizando un supuesto de mundo abierto: el hecho que algo no sucedi no o signica que no pueda suceder. Esto hace dif lidiar con registros de eventos pequeos con mucha cil n variabilidad. Como mencionamos antes, algunos registros contienen eventos en niveles de abstraccin muy o detallados. Estos registros tienden a ser extremadamente grandes y los eventos individuales de bajo nivel son de poco inters para las partes interesadas. Por lo tanto, uno desear agregar los e a eventos de bajo nivel en eventos de alto nivel. Por ejemplo, cuando se analiza los procesos de diagnstico y tratamiento de un grupo particular de pacientes, uno puede no estar interesado en o los examenes individuales registrados en el sistema de informacin del laboratorio del hospital. o Actualmente, las organizaciones necesitan utilizar un enfoque de prueba y error para ver si un registro de eventos es apropiado para miner de procesos. Por lo tanto, las herramientas deber a an permitir realizar un examen rpido de factibilidad dado un conjunto de datos particular. Dicho a examen deber indicar potenciales problemas de desempeo y advertir sobre registros que estn a n a lejos de ser completos o que son muy detallados. 4.3. D3: Crear Puntos de Referencia Representativos

La miner de procesos es una tecnolog emergente. Esto explica por qu an faltan buenos a a e u puntos de referencia (benchmarks). Por ejemplo, docenas de tcnicas de descubrimiento de procesos e estn disponibles y diferentes proveedores ofrecen distintos productos, pero no hay consenso sobre a la calidad de esas tcnicas. Aunque hay diferencias gigantescas en funcionalidad y desempeo, e n es dif comparar las diferentes tcnicas y herramientas. Por lo tanto, se necesita desarrollar cil e buenos puntos de referencias que consistan de conjuntos de datos de ejemplo y criterios de calidad representativos. Para las tcnicas clsicas de miner de datos, hay muchos y buenos puntos de referencias dise a a ponibles. Estos puntos de referencias han estimulado a los proveedores e investigadores a mejorar el desempeo de sus tcnicas. En el caso de la miner de procesos esto es ms desaante. Por n e a a ejemplo, el modelo relacional introducido por Codd en 1969 es simple y ampliamente soportado. Como resultado, toma poco esfuerzo convertir datos desde una base de datos a otra, y no hay problemas de interpretacin. Para los procesos hace falta un modelo as de simple. Los estndares o a propuestos para la modelacin de procesos son mucho ms complicados, y pocos proveedores soo a portan exactamente el mismo conjunto de conceptos. Los procesos son simplemente ms complejos a que los datos tabulares. No obstante, es importante crear puntos de referencia para miner de procesos. Ya estn a a disponibles algunos trabajos iniciales. Por ejemplo, hay varias mtricas para medir la calidad de e los resultados de la miner de procesos (ajuste, simplicidad, precisin y generalizacin). Adems, a o o a varios registros de eventos estn disponibles pblicamente (cf. www.processmining.org). Vea por a u ejemplo el registro de eventos utilizado para el primer Desaf de Inteligencia de Procesos de o Negocio (Business Process Intelligence Challenge, BPIC11) organizado por la Fuerza de Trabajo (cf. doi:10.4121/uuid:d9769f3d-0ab0-4fb8-803b-0d1120cf54). Por un lado, deber haber puntos de referencia basados en bases de datos de la vida real. an Por otro lado, est la necesidad de crear conjuntos de datos sintticos capturando caracter a e sticas particulares. Tales conjuntos de datos sintticos ayudan a desarrollar tcnicas de miner de proe e a cesos que son hechas a la medida para registros de eventos incompletos, registros de eventos con ruido, o para poblaciones espec cas de procesos. Adems de la creacin de puntos de referencia representativos, hay tambin necesidad de mayor a o e consenso sobre los criterios utilizados para juzgar la calidad de los resultados de la miner de a procesos (ver tambin Desaf D6). Adems, se puede adaptar las tcnicas de validacin cruzada e o a e o de la miner de datos para juzgar el resultado. Considere por ejemplo la validacin cruzada a o de k-iteraciones. Uno puede dividir el registro de eventos en k partes. k 1 partes pueden ser utilizadas para aprender un modelo de proceso, y las tcnicas de chequeo de conformidad pueden e ser utilizadas para juzgar el resultado con respecto a la parte restante. Esto puede ser repetido k veces, para as proveer alguna idea sobre la calidad del modelo. 15 c IEEE TFoPM

Maniesto sobre Miner de Procesos a 4.4. D4: Lidiar con el Cambio de Tendencia

El trmino cambio de tendencia (concept drift) se reere a la situacin en la cual el proceso e o est cambiando mientras est siendo analizado. Por ejemplo, en el comienzo del registro de eventos a a dos actividades pueden ser concurrentes mientras que ms tarde en el registro esas actividades se a convierten en secuenciales. Los procesos pueden cambiar debido a cambios peridicos/estacionales o (e.g., en Diciembre hay ms demanda o en la tarde del Viernes hay menos empleados disponia bles) o debido a condiciones cambiantes (e.g., el mercado se est volviendo ms competitivo). a a Tales cambios impactan los procesos y es vital detectarlos y analizarlos. El cambio de tendencia en un proceso puede ser descubierto al dividir el registro de eventos en registros ms pequeos a n y analizar las huellas de los registros ms pequeos. Tal anlisis de segundo orden require a n a muchos ms datos de eventos. No obstante, pocos procesos estn en un estado estable, y entender a a el cambio de tendencia es de suma importancia para la gestin de los procesos. Por lo tanto, se o necesita ms investigacin y soporte en las herramientas para analizar adecuadamente el cambio a o de tendencia. 4.5. D5: Mejorar el Sesgo Representacional Utilizado para el Descubrimiento de Procesos

Una tcnica de descubrimiento de procesos produce un modelo utilizando un lenguaje pare ticular (e.g., BPMN o Redes de Petri). Sin embargo, es importante separar la visualizacin del o resultado de la representacin utilizada durante el proceso de descubrimiento propiamente tal. o La seleccin de un lenguaje objetivo a menudo abarca varios supuestos impl o citos. Esto limita el espacio de bsqueda; los procesos que no pueden ser representados por el lenguaje elegido no u pueden ser descubierto. Este as llamado sesgo representacional utilizado durante el proceso de descubrimiento deber ser una eleccin consciente y no deber (slo) estar impulsada por la a o a o representacin grca preferida. o a Considere por ejemplo la Fig. 6: si el lenguaje objetivo permite o no concurrencia puede tener un efecto en la visualizacin del modelo descubierto y la clase de modelos considerada por el o algoritmo. Si el sesgo representacional no permite concurrencia (Fig. 6(a) no es posible) y no permite que mltiples actividades tengan la misma etiqueta (Fig. 6(c) no es posible), entonces u slo modelos problemticos tales como los de la Fig. 6(b) son posibles. Este ejemplo muestra que o a se necesita una seleccin ms cuidadosa y renada del sesgo representacional. o a 4.6. D6: Balancear Criterios de Calidad tales como Ajuste, Simplicidad, Precisin o y Generalizacin o

Los registros de eventos estn a menudo lejos de ser completos, es decir, slo se cuenta con un a o comportamiento de ejemplo. Los modelos de procesos t picamente permiten un nmero exponenu cial o an innito de trazas diferentes (en caso de iteraciones). Adems, algunas trazas pueden u a tener una probabilidad mucho ms baja que otras. Por lo tanto, no es realista asumir que toda traa za posible est presente en el registro de eventos. Para ilustrar que es poco prctico asumir que los a a registros de eventos estn completos, considere un proceso consitente de 10 actividades que pueden a ser ejecutadas en paralelo y un registro de eventos correspondiente que contiene informacin acerca o de 10.000 casos. El nmero total de posibles caminos entrelazados (interleavings) en el modelo u con 10 actividades concurrentes es 10! = 3.628.800. As es imposible que cada camino entrelaza, do est presente en el registro de eventos si hay menos casos (10.000) que las trazas potenciales e (3.628.800). An si hay millones de casos en el registro, es extremadamente improbable que todas u las posibles varaciones estn presente. Una complicacin adicional es que algunas alternativas son e o menos frecuentes que otras. Estas pueden ser consideradas como ruido. Es imposible construir un modelo razonable para tales comportamientos ruidosos. El modelo descubierto necesita abstraerse de esto; es mejor investigar comportamientos de baja frecuencia utilizando vericacin de o conformidad. 16 c IEEE TFoPM

Maniesto sobre Miner de Procesos a El ruido y la incompletitud hacen que el descubrimiento del proceso sea un problema desaante. De hecho, hay cuatro dimensiones de calidad que compiten: (a) ajuste, (b) simplicidad, (c) precisin o y (d) generalizacin. Un modelo con buen ajuste permite la mayor parte del comportamiento visto o en el registro de eventos. Un modelo tiene un ajuste perfecto si todas las trazas del registro de eventos pueden ser repetidas por el modelo de comienzo a n. El modelo ms simple que puede a explicar el comportamiento visto en el registro es el mejor modelo. Este principio es conocido como la Navaja de Occam. El ajuste y la simplicidad por s solos no son suciente para juzgar la calidad de un modelo de proceso descubierto. Por ejemplo, es muy fcil construir una red de a Petri extremadamente simple (modelo de or) que es capaz de repetir todas las trazas en el registro de eventos (pero tambin cualquier otro registro de eventos referente al mismo conjunto e de actividades). Similarmente, no es deseable tener un modelo que slo permita el comportamiento o exacto del registro de eventos. Recuerde que el registro contiene slo comportamiento de ejemplo o y que muchas trazas que son posibles pueden no haber sido vistas an. Un modelo es preciso u si no permite muchos comportamientos. Claramente, el modelo de or carece de precisin. o Un modelo que no es preciso est subajustado. El subajuste es el problema en que el modelo a sobre generaliza el comportamiento de ejemplo en el registro de eventos (i.e., el modelo permite comportamientos muy diferentes de aquellos vistos en el registro). Un modelo deber generalizar a y no restringir comportamientos slo a los ejemplos vistos en el registro. Un modelo que no o generaliza est sobreajustado. El sobreajuste es el problema que un modelo muy espec a co es generado mientras que es obvio que el registro slo provee comportamientos de ejemplo (i.e., el o modelo explica la muestra particular del registro, pero una siguiente muestra del registro del mismo proceso puede producir un modelo de proceso completamente diferente). Balancear ajuste, simplicidad, precisin y generalizacin es desaante. Esta es la razn por o o o la que la mayor de las tcnicas de descubrimiento de procesos ms potentes proveen varios a e a parmetros. Se necesita desarrollar algoritmos mejorados para un mejor balance entre las cuatro a dimensiones de calidad que compiten. Adems, cualquier parmetro utilizado deber ser entendia a a ble por los usuarios nales. 4.7. D7: Miner Inter-Organizacional a

Tradicionalmente, la miner de procesos se aplica dentro de una sola organizacin. Sin embara o go, como la tecnolog de servicios, la integracin de cadenas de abatecimiento y la computacin a o o en la nube se extienden cada vez ms, hay escenarios donde los registros de eventos de mltiples a u organizaciones estn disponibles para anlisis. En principio, hay dos escenarios para la miner de a a a procesos inter-organizacional. Primero, podemos considerar el escenario colaborativo donde diferentes organizaciones trabajan en conjunto para manejar instancias de procesos. Uno puede imaginar dicho proceso interorganizacional como un rompecabezas, i.e., el proceso completo se descompone en partes y se distribuye en varias organizaciones que necesitan cooperar para completar los casos exitosamente. Analizar el registro de eventos dentro de una de estas organizaciones involucradas es insuciente. Para descubrir los procesos de punta-a-punta, se necesita fusionar los registros de eventos de diferentes organizaciones. Esto no es una tarea trivial, ya que los eventos necesitan ser correlacionados a travs de las fronteras organizacionales. e Segundo, tambin podemos considerar el escenario donde diferentes organizaciones estn ejee a cutando esencialmente el mismo proceso mientras comparten experiencias, conocimiento, o una infraestructura comn. Considere por ejemplo Salesforce.com. Los procesos de ventas de varias u organizaciones son gestionados y soportados por Salesforce. Por un lado, estas organizaciones comparten un infraestructura (procesos, bases de datos, etc.). Por otro lado, ellos no estn obligaa dos a seguir un modelo de proceso estricto ya que el sistema puede ser congurado para soportar variantes del mismo proceso. Como otro ejemplo, considere los procesos bsicos ejecutados en a cualquier municipalidad (e.g., entregar permisos de construccin). Aunque todas las municipalio dades en un pa necesitan proveer el mismo conjunto bsico de procesos, puede tambin haber s a e diferencias. Obviamente, es interesante analizar tales variaciones entre las diferentes organizaciones. Estas organizaciones pueden aprender la una de la otra, y los proveedores de servicios pueden 17 c IEEE TFoPM

Maniesto sobre Miner de Procesos a mejorar sus servicios y ofrecer servicios de valor agregado basados en los resultados de la miner a de procesos inter-organizacional. Se necesita desarrollar nuevas tcnicas de anlisis para ambos tipos de miner de procesos intere a a organizacional. Estas tcnicas tambin deber considerar problemas de privacidad y seguridad. e e an Las organizaciones podr no querer compartir informacin por razones de competencia o debido an o a falta de conanza. Por lo tanto, es importante desarrollar tcnicas de miner de procesos que e a preserven la privacidad.

4.8.

D8: Proporcionar Soporte Operacional

Inicialmente, el foco de la miner de procesos estuvo en el anlisis de datos histricos. Hoy, sin a a o embargo, muchas fuentes de datos se actualizan (casi) en tiempo real, y hay suciente capacidad computacional para analizar los eventos cuando ellos ocurren. Por lo tanto, la miner de procesos a no deber estar restringida al anlisis fuera de l a a nea (o-line) y puede tambin ser utilizada e para el soporte operacional en l nea (on-line). Se pueden identicar tres actividades de soporte operacional: detectar, predecir y recomendar. En el momento en que un caso se desv del proceso a predenido, esto puede ser detectado y el sistema puede generar una alerta. A menudo, uno quisiera generar tales noticaciones inmediatamente (para an ser capaces de inuir en las cosas), u y no en una modalidad fuera de l nea. Los datos histricos pueden ser utilizados para construir o modelos predictivos. Estos pueden ser utilizados para guiar las instancias de proceso en ejecucin. o Por ejemplo, es posible predecir el tiempo de procesamiento restante de un caso. Basado en tales predicciones, uno puede tambin construir sistemas de recomendacin que propongan acciones e o particulares para reducir costos o acortar el tiempo de ujo. Aplicar las tcnicas de miner de e a procesos en tales escenarios en l nea crea desaf adicionales, en trminos de capacidad de cmputo os e o y calidad de datos.

4.9.

D9: Combinar Miner de Procesos con Otros Tipos de Anlisis a a

La gestin de operaciones, y en particular la investigacin de operaciones, es una rama de la o o ciencia de gestin que depende fuertemente del modelamiento. Se utiliza una variedad de modelos o matemticos que van desde programacin lineal y planicacin de proyectos hasta modelos de a o o colas, cadenas de Markov, y simulacin. La miner de datos puede ser denida como el anlisis o a a de conjuntos de datos (a menudo grandes) para encontrar relaciones insospechadas y para resumir los datos en formas novedosas que sean al mismo tiempo entendibles y utiles para el dueo de los n datos. Se ha desarrollado una amplia variedad de tcnicas: clasicacin (e.g., rboles de decisin), e o a o regresin, segmentacin (e.g., k-means) y descubrimiento de patrones (e.g., aprendizaje de reglas o o de asociacin). o Ambos campos (gestin de operaciones y miner de datos) proveen tcnicas de anlisis valiosas. o a e a El desaf es combinar las tcnicas en estos campos con la miner de procesos. Considere por o e a ejemplo la simulacin. Las tcnicas de miner de procesos se pueden utilizar para aprender un o e a modelo de simulacin basado en datos histricos. Posteriormente, se puede utilizar el modelo de o o simulacin para proveer soporte operacional. Debido a la cercana conexin entre el registro de o o eventos y el modelo, se puede utilizar el modelo para repetir la historia, y uno podr comenzar a simulaciones desde el estado actual proporcionando un botn de avance rpido hacia el futuro o a basado en datos en tiempo real. Similarmente, es deseable combinar la miner de procesos con la anal a tica visual. La anl tica visual combina el anlisis automtico con visualizaciones interactivas para un mejor entendimiento a a de conjuntos de datos grandes y complejos. La anal tica visual explota las sorprendentes capacidades de los humanos para ver patrones en datos no estructurados. Al combinar las tcnicas e automticas de miner de procesos con la anal a a tica visual interactiva, es posible extraer ms ideas a a partir de los datos de eventos. 18 c IEEE TFoPM

Maniesto sobre Miner de Procesos a 4.10. D10: Mejorar la Usabilidad para los No Expertos

Uno de los objetivos de la miner de procesos es crear modelos de procesos reales, i.e., a modelos de procesos que se utilizan a diario, ms que modelos estticos que terminan en algn a a u archivo. Se puede usar los nuevos datos de eventos para descubrir comportamientos emergentes. La relacin entre los datos de eventos y los modelos de procesos permiten la proyeccin del estado o o actual y las actividades recientes en modelos actualizados (al d Por lo tanto, los usuarios nales a). pueden interactuar con los resultados de la miner de procesos de forma diaria. Tales interacciones a son muy valiosas, pero tambin requieren interfaces de usuario intuitivas. El desaf es esconder e o los sosticados algoritmos de miner de procesos detrs de interfaces de usuario amigables que a a automticamente denan parmetros y sugieran tipos de anlisis apropiados. a a a 4.11. D11: Mejorar el Entendimiento para los No Expertos

An cuando es fcil generar los resultados de la miner de procesos, esto no signica que los u a a resultados sean realmente utiles. El usuario puede tener problemas para entender la salida, o es tentado a inferir conclusiones incorrectas. Para evitar tales problemas, los resultados deber ser an presentados utilizando una representacin apropiada (ver tambin PR5). Adems, la abilidad o e a de los resultados deber estar siempre claramente indicada. Podr haber muy pocos datos para a a justicar conclusiones particulares. De hecho, las tcnicas existentes de descubrimiento de procesos e t picamente no alertan acerca de un bajo ajuste o un sobreajuste. Siempre muestran un modelo, an cuando es claro que hay muy pocos datos para justicar cualquier conclusin. u o

5.

Ep logo

La Fuerza de Trabajo de la IEEE sobre Miner de Procesos (IEEE Task Force on Process a Mining) tiene como objetivos (a) promover la aplicacin de miner de procesos, (b) guiar a o a desarrolladores de software, consultores, gerentes y usuarios nales en el uso de tcnicas en el e estado del arte, y (c) estimular la investigacin en miner de procesos. Este maniesto declara o a los principales principios e intenciones de la fuerza de trabajo. Despus de introducir el tpico de e o miner de procesos, el maniesto hace un catlogo de algunos principios rectores (Seccin 3) y a a o desaf (Seccin 4). Los principios rectores pueden ser utilizado para evitar errores obvios. La lista os o de desaf tiene como objetivo dirigir los esfuerzos en investigacin y desarrollo. Ambos apuntan os o a aumentar el nivel de madurez de la miner de procesos. a Para concluir, unas pocas palabras sobre terminolog Los siguientes trminos se utilizan en a. e el espacio de la miner de procesos: miner de ujo de tareas (workow mining), miner de a a a procesos (de negocio), descubrimiento automtico de procesos (de negocio), e inteligencia de proa cesos (de negocio). Diferentes organizaciones parecen utilizar diferentes trminos para conceptos e que se traslapan. Por ejemplo, Gartner est promoviendo el trmino Descubrimiento Automtia e a co de Procesos de Negocio (Automated Business Process Discovery, ABPD), y Software AG est usando Inteligencia de Procesos(Process Intelligence) para referirse a su plataforma de a control. El trmino miner de ujo de tareas (workow mining) parece menos apropiado ya e a que la creacin de modelos de ujos de tareas es slo una de las muchas aplicaciones posibles de o o miner de procesos. Similarmente, la agregacin del trmino de negocio reduce el alcance a ciera o e tas aplicaciones de miner de procesos. Hay numerosas aplicaciones de miner de procesos (e.g., a a analizar el uso de sistemas de alta tecnolog o analizar sitios web) donde esta agregacin parece a o ser inapropiada. Aunque el descubrimiento de procesos es una parte importante del espectro de la miner de procesos, ste es slo uno de los muchos casos de uso. La vericacin de conformidad, a e o o la prediccin, la miner organizacional, el anlisis de redes sociales, etc., son otros casos de uso o a a que se extienden ms all del descubrimiento de procesos. a a La Figura 7 relaciona algunos de los trminos recin mencionados. Todas las tecnolog y e e as mtodos que apuntan a proveer informacin util que puede ser utilizada para apoyar la toma e o de decisiones pueden ser posicionadas bajo el paraguas de la Inteligencia de Negocios (Business 19 c IEEE TFoPM

Maniesto sobre Miner de Procesos a


Inteligencia de negocios Inteligencia de procesos Minera de procesos
descubrimiento (automtico) de procesos (de negocio)

verificacin de conformidad

mejoramiento de modelos

Figura 7. Relacionando los diferentes trminos. e

Intelligence, BI). La inteligencia de procesos (de negocio) puede ser vista como la combinacin o de BI y BPM, i.e., se utiliza las tcnicas de inteligencia de negocios para analizar y mejorar e los procesos y su gestin. La miner de procesos puede ser vista como una concretizacin de la o a o inteligencia de procesos que toma los registros de eventos como punto de inicio. El descubrimiento (automtico) de procesos (de negocio) es slo uno de los tres tipos bsicos de miner de procesos. a o a a La Figura 7 puede ser un poco engaosa en el sentido que la mayor de las herramientas de BI n a no proveen funcionalidades de miner de procesos, tal como se describe en este documento. El a trmino BI es a menudo convenientemente sesgado hacia una herramienta o mtodo en particular e e que cubre slo una pequea parte del amplio espectro de BI. o n Puede haber razones comerciales para usar trminos alternativos. Algunos proveedores pueden e tambin querer enfatizar un aspecto en particular (e.g., descubrimiento o inteligencia). Sin eme bargo, para evitar confusin, es mejor utilizar el tmino miner de procesos para la disciplina o e a cubierta por este maniesto.

Glosario
Actividad: es un paso bien denido en el proceso. Los eventos pueden referirse al inicio, conclusin, cancelacin, etc., de una actividad para una instancia espec o o ca del proceso. Ajuste (Fitness): es una medida para determinar cun bien un modelo dado se ajusta al a comportamiento observado en el registro de eventos. Un modelo tiene un ajuste perfecto si todas las trazas en el registro de eventos pueden ser reproducidas por el modelo de principio a n. Caso: vase Instancia de un Proceso. e Cambio de Tendencia (Concept Drift): es el fenmeno en que los procesos suelen cambiar o con el tiempo. El proceso observado podr cambiar gradualmente (o de imprevisto) debido a a cambios estacionales o al aumento de la competencia, complicando as el anlisis. a Miner de Datos: anlisis de conjuntos de datos (a menudo grandes) para encontrar relacioa a nes inesperadas y para resumir los datos de manera que proporcionen nuevos entendimientos. Descubrimiento Automtico de Procesos de Negocios: vase Descubrimiento de a e Procesos. Descubrimiento de Procesos: es uno de los tres tipos bsicos de miner de procesos. a a Basado en un registro de eventos, se crea un modelo de proceso. Por ejemplo, el algoritmo es capaz de descubrir una red de Petri mediante la identicacin de patrones de procesos en o colecciones de eventos. 20 c IEEE TFoPM

Maniesto sobre Miner de Procesos a Evento: es una accin almacenada en el registro, por ejemplo, el inicio, conclusin o cancelao o cin de una actividad para una instancia particular de un proceso. o Generalizacin: es una medida para determinar cun bien el modelo es capaz de describir o a comportamiento desconocido. Un modelo con sobreajuste no es capaz de generalizar lo suciente. Gestin de Procesos de Negocio (Business Process Management, BPM): es la diso ciplina que combina conocimiento sobre tecnolog de informacin y conocimiento sobre las a o ciencias de gestin y lo aplica en conjunto a los procesos de negocio operacionales. o Inteligencia de Negocios (Business Intelligence, BI): es una amplia coleccin de herrao mientas y mtodos que utilizan datos para apoyar la toma de decisiones. e Instancia de un Proceso: es la entidad siendo ejecutada por el proceso que es analizado. Los eventos se reeren a instancias del proceso. Ejemplos de instancias de un proceso son: pedidos de los clientes, reclamos de seguros, solicitudes de prstamos, etc. e Inteligencia de Procesos: es una rama de la Inteligencia de Negocios centrada en la Gestin o de Procesos de Negocio. Inteligencia de Procesos de Negocio: vase Inteligencia de Procesos. e Miner de Procesos: son tcnicas, herramientas y mtodos para descubrir, monitorear y a e e mejorar los procesos reales (es decir, no los procesos supuestos) a travs de la extraccin de e o conocimiento de los registros de eventos, ampliamente disponibles en los actuales sistemas de informacin. o Mejoramiento de Modelos: es uno de los tres tipos bsicos de miner de procesos. Un a a modelo de proceso se extiende o mejora con la informacin extra de un registro de eventos. o da Por ejemplo, se pueden identicar cuellos de botella reproduciendo un registro de eventos en un modelo de proceso, mientras se examinan las marcas de tiempo. MXML: es un formato basado en XML para el intercambio de registros de eventos. XES reemplaza a MXML como el nuevo formato para miner de procesos no dependiente de la a herramienta. Miner de Procesos Inter-Organizacional: la aplicacin de las tcnicas de miner de a o e a procesos sobre registros de eventos procedentes de diferentes organizaciones. Precisin: es una medida para determinar si el modelo proh un comportamiento muy o be diferente al comportamiento observado en el registro de eventos. Un modelo con baja precisin o es subajustado. Registro de Eventos: es la coleccin de eventos utilizados como entrada para la miner de o a procesos. Los eventos no necesitan ser almacenados en un archivo de registro por separado (por ejemplo, los eventos pueden estar dispersos en diferentes tablas de bases de datos). Sesgo Representacional: es el lenguaje seleccionado para la presentacin y construccin de o o los resultados de la miner de procesos. a Simplicidad: es una medida que pone en prctica el concepto de la Navaja de Occam, i.e ., el a modelo ms simple que pueda explicar el comportamiento observado en el registro de eventos, a es el mejor modelo. La simplicidad se puede cuanticar de distintas maneras, por ejemplo, la cantidad de nodos y arcos en el modelo. Soporte Operacional: es un anlisis en l a nea de los datos de eventos con el objetivo de supervisar e inuir en las instancias del proceso en ejecucin. Se pueden identicar tres activio dades de soporte operacional: detectar (generar una alerta si el comportamiento observado se desv del comportamiento modelado), predecir (predecir el comportamiento futuro basado en a el comportamiento pasado, e.g., predecir el tiempo de procesamiento restante), y recomendar (sugerir las medidas adecuadas para alcanzar un objetivo concreto, e.g., minimizar costos). Vericacin de Conformidad: analiza si la realidad, segn consta en un registro de eventos, o u se ajusta al modelo y viceversa. El objetivo es detectar las discrepancias y medir su gravedad. La vericacin de conformidad es uno de los tres tipos bsicos de miner de procesos. o a a XES: es un estndar XML para los registros de eventos. El estndar ha sido adoptado por la a a IEEE Task Force on Process Mining como el formato de intercambio de registros de eventos por defecto. (cf. www.xes-standard.org).

21

c IEEE TFoPM

Potrebbero piacerti anche