Sei sulla pagina 1di 10

Captulo 2

La base de datos integrada


2.1 Definiciones. Este captulo trata de la construccin y gestin de una base de datos integrada para los propsitos de estudio de un yacimiento. Antes de comenzar, es til definir algunos conceptos bsicos que se utilizarn a lo largo de este texto. Una base de datos integrada. Es un sistema repositorio de datos que de forma interactiva sirve para almacenar, recuperar y compartir datos de E & P, dentro de un ambiente controlado y seguro. Un almacn de datos o almacenamiento de datos puede definirse como una coleccin de datos integrado, estable, variable para satisfacer las necesidades de gestin. Desde este punto de vista, que implica un menor grado de interaccin con el usuario final (el gelogo, en este caso). Gestin de datos es el proceso de almacenar, organizar, recuperar y entregar informacin de una base de datos o un almacn de datos.

Tambin cabe mencionar que los trminos datos e informacin en gran parte usar indistintamente en este texto, a pesar de que existe una relacin inherente entre los dos (datos generan informacin). 2.2 El problema de una base de datos integrada. La base de datos integrada es uno de los temas claves en el estudio de un yacimiento. La disponibilidad de datos de alta calidad tanto esttica como dinmica y la rapidez de acceso a estos datos, siempre son una condicin necesaria en el flujo de trabajo de un estudio. Lamentablemente, en la mayora de los casos, la condicin de la base de datos en el momento de iniciar el estudio dista de ser ptima. El experimentado gelogo o Ingeniero conoce el problema muy bien: los datos se transmiten con frecuencia en diferentes lugares y se accede por diferente software. A veces se duplican los datos y no sabemos cul es la versin correcta a utilizar. Tambin, es comn encontrar que algunos o la mayora de la informacin no ha sido transferida en formato digital (o ha sido incorrectamente transferida), que significa un trabajo largo y tedioso de digitalizacin debe hacerse antes de comenzar el estudio. En muchos casos, incluso la informacin almacenada en la base de datos existente resulta ser de mala calidad, de difcil acceso o daados parcial o totalmente. En el peor de los casos, se han perdido datos. Desde un punto de vista general, la importancia de este problema vara de un estudio a otro, porque depende de la cantidad de informacin que se maneja, su edad y la efectividad poltica de los datos de almacenaje de la empresa. Adems, el problema es a menudo difcil de detectar y evaluar a priori, es decir, antes de comenzar realmente el estudio. Sin embargo, la poca informacin publicada es sorprendente: segn informes disponibles, Ingenieros de yacimiento y

Captulo 2 gelogos pasan de 50 a 80% de su tiempo buscando datos y slo 15 a 30% para su interpretacin, es decir, supuestamente el verdadero trabajo.

Figura 2.1 muestra estos resultados en forma grfica [1]. Si traducimos esto en dinero, nos daremos cuenta de que nos estamos gastando la mayor parte de nuestro presupuesto en algo que nosotros probablemente no habamos considerado al principio; gestin de datos.

Figura 2.1 tiempo de trabajo de un ingeniero E & P [1]. Esto explica por qu la base de datos suele ser un problema para un proyecto. Un estudio integrado siempre comienza con la recopilacin de toda la informacin disponible de las bases de datos existentes basadas en la disciplina y de otras fuentes, pero esta fase puede llegar a ser un proceso difcil y muy largo, cuyo impacto en la planificacin general del estudio puede ser muy grande. No obstante, los retrasos en la ejecucin del proyecto se relacionan con imprevistas cantidades de trabajo en la construccin de una base de datos completa y confiable. En los siguientes prrafos, veremos cmo los datos generalmente se organizaron en una compaa petrolera y se har nfasis en algunas de las caractersticas del objeto principal nos preocupa: la base de datos de proyecto. 2.3 Los tres niveles de una base de datos de E & P. Histricamente, la gestin de datos no ha sido considerada un problema crtico dentro de las compaas petroleras. De hecho, fue una tarea mucho ms sencilla que en la actualidad. Los datos generalmente se almacenan en un archivo central como una pieza nica (el original) de la informacin, es decir, un registro. Los gelogos simplemente conservan ese original y lo utilizan hasta que terminan su trabajo; el resultado de su interpretacin, por ejemplo un mapa estructural, luego es archivado y referenciado para uso futuro. Hoy, la situacin es mucho ms compleja. Por un lado, la enorme cantidad de datos del yacimiento que se hayan adquirido en los ltimos aos, especialmente los estudios ssmicos 3D, requieren capacidades de almacenamiento y software de la recuperacin eficiente. Por otro lado los relativamente nuevos conceptos de equipos multidisciplinarios y administracin de activos requieren un nuevo enfoque para la gestin de datos; mientras que antes cada grupo de

Captulo 2 profesionales tuvo su software de almacenamiento de informacin particular, ahora la informacin debe ser compartida con otros grupos de profesionales, trabajando en el mismo activo. Muchas compaas, no obstante, experimentan la dificultad de reorganizar el sistema de gestin de datos y en la mayora de los casos se han previsto soluciones hbridas para almacenar los datos. Estas soluciones, a menudo oscuras para el usuario, generan una proliferacin de los datos. Es la percepcin de la mayora de los profesionales que los datos fueron escasos en un nmero de diversas localizaciones, que abarca desde PC individuales hasta sistemas de archivo central alejado e inaccesible de alguna manera. Los usuarios no saban de la calidad de estos datos, a menudo no podan distinguir el original de las copias y en consecuencia detalles para generar su propia base de datos, en lo nico en que podan confiar era en ellos. Este fenmeno comenz a finales de los ochenta, con la proliferacin de ordenadores personales y hojas de clculo, pero todava es bastante comn hoy en da. A principios de esta dcada, las empresas petroleras por fin se dieron cuenta de que la gestin de los datos era una cuestin crtica y comenzaron a organizar los almacenes de datos nuevos y ms eficientes, mientras que los vendedores pusieron a disposicin un nuevo software integrado para la interpretacin de datos y almacenamiento. Hoy en da, la tendencia est surgiendo entre las compaas petroleras para organizar sus datos en tres niveles diferentes de bases de datos (Fig. 2.2, [2]): Base de datos corporativa. Almacena los datos oficiales de la empresa. La calidad de los datos es alta y la tasa de cambio (inestabilidad) es baja. Ningn dato nuevo se crea dentro de la base de datos corporativa, y no se alimenta de cualquier aplicacin, excepto su propio conjunto de utilidades para la navegacin, seleccin y exportacin. Los datos se entregan en un formato compatible con la base de datos del proyecto. Aunque la base de datos puede accederse por cualquier persona, los cambios en el contenido son controlados por un administrador. Normalmente reside en un ordenador central y se caracteriza por el nmero de controles que se coloca alrededor de l. Base de datos del proyecto. Contiene datos relativos de un determinado proyecto o activo. Se compone de informacin retirada de la base de datos corporativa y se accede utilizando el software de diferentes proveedores. Su tamao es muy variable, desde pocos a miles de pozos, y puede contener mltiples versiones de los mismos datos. Todos los profesionales que trabajan en el equipo pueden acceder y modificar la base de datos, por lo que la volatilidad es alta. Los nuevos datos se generan a travs de las etapas de interpretacin. Cuando el proyecto se ha completado, los datos interpretados se devuelven a la base de datos corporativa y se convierte en la nueva informacin de referencia. Base de datos de aplicacin. Contiene informacin relevante para una sola aplicacin. Normalmente se accede slo por el gelogo trabajando en esa aplicacin en particular y la informacin por lo tanto es muy voltil. Tambin, la informacin puede no ser fcilmente

Captulo 2 compartida con otras bases de datos de aplicacin, cuando los vendedores son diferentes, a menos que se disponga de una interfaz dedicada a un software. Cuando se haya completado la interpretacin, los datos se almacenan en la base de datos de proyecto.

Figura 2.2 La arquitectura de 3 niveles de E & P bases de datos. Como los conceptos de gestin de datos en Exploracin y Produccin estn cambiando rpidamente, alternativas simplificadas en la arquitectura de 3 niveles descritos anteriormente se podra prever en el futuro. La base de datos de aplicaciones, por ejemplo, pronto podra desaparecer, ya que los vendedores son cada vez ms progresivamente a los patrones de la industria que debe mejorar la interoperabilidad del software (vase el prrafo 2.5). Otro nivel de almacenamiento de datos que pueda tener un futuro brillante es la banca de datos. En los ltimos aos han comenzado varias iniciativas multiempresa, con el objetivo de construir un sistema de almacenaje compartido, que permite datos a granel a manejarse en forma de archivo. El almacenamiento es administrado por un tercero, la informacin es tratada como dinero o acciones, y su acceso puede ser comprado o vendido. La principal ventaja de este sistema es que permite rpida recuperacin en lnea de cualquier tipo de informacin de alta calidad. En el futuro, la externalizacin de las actividades de gestin de datos debera ayudar a las compaas petroleras para reducir costos y concentrarse en las actividades centrales, mientras que el sistema bancario podra representar una de las opciones ms interesantes y viables. 2.4 Base de datos de proyecto. La base de datos del proyecto es la interfaz real para el gelogo. Es aqu donde gran parte de la accin tiene lugar y donde reside la interpretacin final. Se genera al principio del proyecto descargando los datos relevantes de la base de datos corporativa y normalmente reside en un servidor UNIX multiusuario. La generacin de una base de datos de proyecto tiene muchas ventajas en comparacin con acceso directo a la base de datos corporativa: permite mayor velocidad de acceso, trabaja con formatos compatibles con aplicaciones E & P comunes y permite la creacin de mltiples versiones de datos. Las caractersticas claves de la base de datos del proyecto es que es (o debera ser)

Captulo 2 integrado, es decir, contiene toda la informacin pertinente al estudio y se tiene acceso a todas las aplicaciones correspondientes a diferentes disciplinas E & P. Las modificaciones generadas por una aplicacin se registran en la base de datos y disposicin de las otras aplicaciones. Desde un punto de vista estructural, una tpica base de datos de proyecto debe contener 4 tipos principales de datos. Estos son datos definitivos, informacin de referencia, datos del proyecto y datos personales. Cada tipo puede caracterizarse en trminos de atributos tales como confianza, acceso pblico y duracin (vea la tabla 2 1 [3]). Tabla 2.1 tipos de datos en una base de datos de proyecto.
Confianza Datos definitivos Informacin de referencia Datos del proyecto Archivos personales Alta Moderada Baja Audiencia Grande Moderada Baja Individual Duracion Para siempre Moderada Corto Indeterminada Ejemplo Registro de Pozo Mapas oficiales Mapa de trabajo Archivos de preferencia

En la prctica, una base de datos integrada normalmente debe contener la siguiente informacin: Datos de arrendamiento y Cultural Datos del Pozo (nombre, datos de la desviacin de la localizacin, RT,...) Registros de pozo en agujero descubierto y entubado. Datos ssmicos (2D y 3D encuestas, datos de navegacin, perforacin ssmica...) Datos de terminacin (perforaciones, reacondicionamiento...) Datos de inyeccin y produccin La lista probablemente no es exhaustiva, ya que los diferentes tipos de datos que pueden recogerse en un proyecto de estudio del yacimiento es sorprendentemente alta, pero muestra la informacin que est normalmente disponible en todos los casos y que siempre debe estar presente en la base de datos de proyecto. Claro Adems de la informacin, la base de datos del proyecto contendr los resultados de las etapas interpretativas (interpretacin de registros cuantitativos, mapas y superficies...). Figura 2.3 muestra la estructura simplificada de una base de datos del proyecto y su relacin con la base de datos corporativa. Es importante destacar que la base de datos de proyecto debe contener informacin no slo geofsica y geolgica, como es muy frecuente el caso, tambin datos de produccin y terminacin. La importancia de este concepto no se puede sobreestimar. En realidad, mientras se realiza un estudio integrado cclicamente se actualiza el modelo geolgico y esto a su vez genera cambios en el modelo dinmico. Por ejemplo, si se cambia un cabezal, esto puede tambin tener un impacto en la base de datos de produccin, ya que la nueva interpretacin puede causar el intervalo perforado que parcial o totalmente en una unidad geolgica diferente. Esto a su vez requiere una reasignacin de los volmenes de produccin segn el marco geolgico modificado (vase el

Captulo 2 apartado 6.5.1). En un entorno integrado, Estas modificaciones son transparentes para el usuario, no obstante si datos dinmicos no estn conectados firmemente a la base de datos del proyecto, el ingeniero debe funcionar algn software de interfaz para actualizar la historia de la produccin sobre la base de una unidad por unidad. Lamentablemente, como se indica en el apartado 2.6, una estrecha integracin de datos estticos y dinmicos an no existe. Mientras que los vendedores estn empezando a proponer soluciones completamente integradas, en el mundo real E & P esas soluciones no sern probablemente eficaces para unos aos. Mientras tanto, geocientficos dependen de enlaces provisionales entre las distintas aplicaciones.

Figura 2.3 estructura Ideal de una base de datos de proyecto. Otro tema clave de la base de datos del proyecto es que incluya, tanto como sea posible, toda la informacin relevante del activo bajo estudio. Esto es muy difcil en la prctica, porque parte de los datos siempre existe, tal vez simplemente porque no sabemos de su existencia, especialmente cuando se trata con campos grandes y viejos. Sin embargo, la integridad de la base de datos es un requisito imprescindible de cualquier estudio, que debe prestarse la mxima atencin. Otro aspecto de la integridad de la base de datos es relevante a determinados tipos de datos, cuya naturaleza hace difcil almacenarlos en formato digital y que no tienen evidente interaccin con los datos contenidos en la base de datos de proyecto: estudios e informes, datos como ncleo especial y anlisis PVT y as sucesivamente. Esto significa que la base de datos de computadora debe integrarse con una base de datos fsica, incluyendo toda la informacin que no puede ser transferida en formato digital. Se puede apreciar la importancia de la integridad de la base de datos teniendo en cuenta el ejemplo simple de pozos duplicados (re-entrada, re-perfora, regreso...-). Estos pozos han sido perforados en algn momento en la vida de un campo debido a problemas mecnicos de la perforacin original u otras razones. Muy a menudo, el gelogo tiende a ignorar esta informacin, especialmente si no est fcilmente disponible y es difcil de encontrar, simplemente porque no aade nada al modelo geolgico o petrofsica del yacimiento. Sin embargo, estos pozos duplicados pueden contener informacin valiosa sobre los cambios de saturacin del yacimiento, que puede ser utilizado en la distribucin de saturacin de fluidos y el estudio de monitoreo (apartado 6.5).

Captulo 2

2.5 Administracin de la base de datos del proyecto La base de datos del proyecto no es slo algo que se construye al inicio del estudio y se transfiere a la base de datos corporativa cuando el trabajo se ha completado. Es una parte de vida del proyecto, lo que cambia y evoluciona con el propio estudio y, como tal, necesita una gestin continua. La gestin de la base de datos de proyectos es una tarea importante en el estudio integrado. La experiencia demuestra que muchos de los puntos pegajosos en un estudio de yacimientos estn relacionadas con la calidad y / o la integridad de la base de datos. Desde este punto de vista, la presencia de un administrador de base de datos del proyecto es esencial para asegurar un mnimo de inconvenientes durante el curso del estudio. El administrador de base de datos es responsable de cargar toda la informacin pertinente en el sistema, por lo que fcilmente la informacin est a disposicin de los otros miembros del equipo, as tambin dela actualizacin de la base de datos con la nueva informacin disponible y actualizar el hardware y configuraciones de software (sin embargo, no ser responsable de la calidad de la informacin, que debe ser garantizado por los gelogos). Adems de eso, es responsable de la seguridad de la base de datos y debe limitar el acceso a los profesionales, tambin debe asegurarse que se asigna un rea comn de trabajo para el proyecto, evitando la proliferacin de directorios que aumentara y multiplicaran la fecha de difusin. No hay duda que los grandes estudios requieren un gestor de base de datos asignado al equipo de trabajo. l o ella pueden tener un respaldo, pero en todos los casos tiene que ser consciente de las diferentes etapas de un estudio de yacimiento, para entender la importancia de las diferentes piezas de la informacin y sus interrelaciones. Otro punto importante en la gestin de la base de datos es controlar su ciclo de vida. Hay una tendencia clara en proyectos reales para mantener toda la informacin resguardada en la base de datos del proyecto hasta que el estudio se ha completado. Sin embargo, muchos proyectos tienen una vida til de varios aos y en algunos casos, Cuando el activo es crtico, puede ser casi permanente, que obviamente esto genera un problema, porque se gana valor durante el estudio y este valor permanece bloqueado en la base de datos de proyecto, accesible slo para los miembros del equipo que realiz el estudio. Al mismo tiempo, la base de datos corporativa que ha sido copiada de la informacin original, llega a ser anticuada. En otras palabras, cuanto mayor sea la vida de un proyecto, la informacin debe ser lo ms actualizada. Desde este punto de vista, el administrador de base de datos tiene que transferir regularmente a la base de datos corporativa la informacin que puede ser considerada como el producto final de un paso importante del proyecto. Por ejemplo, el conjunto corregido de los registros de pozos y su interpretacin cuantitativa cuando el estudio petrofsico est completo, o los mapas geolgicos finales cuando el estudio de simulacin dinmica ha sido exitosamente relacionado.

Captulo 2 La transferencia final de los resultados del estudio a la base de datos de las empresas puede ser considerada como el desmantelamiento de la base de datos. Este aspecto a menudo, en un estudio integrado requiere la participacin de todo el equipo, especialmente en relacin con la fase de reduccin de datos. Se puede estimar que, al final de un proyecto tanto como 95% de la informacin contenida en la base de datos puede ser desechada. Haciendo referencia a los tipos de datos ilustrados en la Tabla 2.1. Cada archivo personal debe ser eliminado, mientras que los datos del proyecto deben ser promovidos para ser utilizados como la informacin de referencia nueva. Todas las interpretaciones intermedias deben suprimirse, ya que no existen datos de referencia duplicados que pueden ser admitidos. Los gelogos que participaron en el estudio deben indicar exactamente al responsable del fichero que traslado la informacin final y nica, a la base de datos corporativa.

2.6. Software de integracin El equipo integrado necesita una plataforma de trabajo, si un estudio integrado deber llevarse a cabo. La creacin de un tipo de plataforma ha sido la principal preocupacin de los proveedores de software de E & P en los ltimos aos y, sin duda, se han hecho grandes pasos, cuando comparamos la forma en que normalmente trabajan hoy con lo que sola ser nuestra forma de trabajar hace slo una dcada. Software libre y aplicaciones integradas son ya una realidad en nuestro escritorio. Sin embargo, no todos los problemas han sido resueltos. Estas plataformas se han desarrollado inicialmente para aplicaciones de Geociencia y son capaces de integrar bastante bien todas las diferentes disciplinas pertinentes a la parte esttica de un estudio integrado. Como ya se ha mencionado, cuando se considera la integracin de los datos dinmicos, la situacin es mucho menos emocionante. Adems de eso, mientras que estas plataformas ofrecen soluciones verdaderamente integradas en s mismo, normalmente demuestran poca integracin entre s. Desde el punto de vista del usuario, resulta muy difcil transferir datos desde una plataforma a otra, sin tener que volver a formatear los archivos relevantes de alguna manera. La situacin actual es lo que podramos referirnos como integracin suelta o descuidada [4]. La transferencia de datos de una aplicacin a otra deben ser realizada a travs de soluciones ad hoc, que normalmente implican un interfaz de software. La Integracin suelta, existe hoy no slo entre aplicaciones de diferentes proveedores, sino tambin entre una plataforma integrada y otras aplicaciones (software de la empresa propietaria u otros proveedores) que realizan tareas que no estn disponibles en esa plataforma. Para dar un ejemplo de integracin suelta, cuando un paquete de geoestadstica debe ser utilizado, que es externo a la plataforma de trabajo, los datos debern ser extrado de la base de datos de proyecto y formatear a travs de algn tipo de software, con el fin de ser cargados en el software de geoestadstica.

Captulo 2

La operacin inversa debe realizarse al volver a cargar los datos interpretados a la base de datos. Los gelogos que han actuado en estas transferencias saben lo tedioso y lento que puede ser la operacin. La integracin suelta o descuidada bsicamente significa que los datos residen en diferentes bases de datos, accesibles por diferente software. Las extracciones y las operaciones de recargada son pasos necesarios, si las actividades deben ser integradas. La gran mayora del equipo activo de yacimientos petroleros y consultora est trabajando hoy en un entorno integrado libremente, donde existen islas slo de una integracin correcta. En contraste con eso, podra definirse la estrecha integracin. Estrecha integracin implica que muchas aplicaciones conviven uno con el otro y datos son compartidos entre ellos sin tener que transferir o cambiar el formato de los datos, independientemente de la tarea o el vendedor. La situacin representada en la figura 2.3 realmente ilustra un entorno integrado firmemente. Idealmente, la estrecha integracin requerira una nica base de datos, accesible a todas las aplicaciones diferentes. En reconocimiento a tal problema, multiempresas han iniciado algunas iniciativas a principios de la dcada pasada. La Corporacin petrotcnicos de Software abierto (POSC) y el modelo de datos pblicos de petrleo (PPDM) son ejemplos de organizaciones que sin fines de lucro patrocinadas por las compaas petroleras de todo el mundo y proveedores, que tuvieron como objetivo establecer un modelo de datos comn para la industria petrolera. Estas iniciativas, sin embargo, no generaron los resultados esperados, debido a los conflictos comerciales entre los participantes, y a partir de hoy la idea de la plataforma nica sigue siendo un sueo. Por el momento la idea de tener que lidiar con los diferentes sistemas y la comunicacin ha sido parcialmente aceptada como una especie de mal necesario en la mayora de las compaas petroleras y de servicios, con respecto a esto, dos tendencias han ido surgiendo en los ltimos aos: La eleccin de utilizar la plataforma de un solo proveedor, que ofrece la cadena completa de aplicaciones de yacimientos (Modelo Compartido de la Tierra, o SEM). Estos sistemas ofrecen una estrecha integracin en s mismos, pero las aplicaciones individuales no son necesariamente las mejores en el mercado, mientras que la comunicacin con otros sistemas externos, se hace difcil.

Captulo 2

La eleccin de trabajar con las mejores aplicaciones en el mercado, independientemente de la plataforma. El problema en este caso es el de establecer un sistema de comunicacin viable entre las diferentes bases de datos, a travs de interfaces estndar. Recientes proyectos multiempresa como OpenSpirit hacen frente a estos problemas.

El problema de la interoperabilidad de los sistemas sigue siendo el foco de la atencin tanto de empresas petroleras y de servicios. Nuevas perspectivas se estn explorando, una de las ms interesantes es la posibilidad de comunicarse a travs de diferentes sistemas terrestres compartidos y diferentes lugares a travs de la World Wide Web (Fig. 2.4). Tales oportunidades pueden tener un impacto significativo en la forma de estudios integrados que se lleven a cabo en el futuro.

Figura 2.4. La interoperabilidad entre los diferentes modelos de la Tierra compartidos a travs de la WEB. Sin embargo, la solucin definitiva al problema de interoperabilidad est por venir. Mientras tanto, es responsabilidad del gerente del proyecto para prestar atencin a este problema y asegurar que no hay tiempo y los recursos se pierden a causa de problemas de interoperabilidad.
References
1 Lesslar PC, Van der Berg FG, Managing data assets to improve business performance. SPE paper 39728. 2 Managing oilfield data management. Oilfield Review, June 1994. 3 Wild J (1995) Integrating People: Realising the value of Systems and Data. EXPRO Transactions. 4 Sidney S (1997) Defining the relationship between integration and data management, Hart's Oil and Gas World, May.