Sei sulla pagina 1di 4

Edicin de Metadatos en nuestros Archivos

Ma. Cristina Dvila B. macristinadb@gmail.com

Resumen En este artculo conoceremos la importancia de los metadatos de todo archivo, los estndares que existen y la manera en cmo stos pueden ser editados y/o eliminados. Para ello se describen algunas herramientas existentes tanto para Sistemas Operativos Windows como Linux que nos permitirn editar el metadato de archivos pdf, archivos Microsoft Office, Imgenes, archivos de audio y video. Palabras Clave Metadatos, PDF, Archivo, Estndares, Heramientas.
I. Introduccin

bsqueda, pero por otro lado son un riesgo de seguridad por la cantidad de informacin que se transmiten sin que tengamos control sobre el mismo. Los metadatos pueden tener varias aplicaciones como: * En informtica forense: Para demostrar en un juicio que unos archivos de imgenes pertenecen a una determinada cmara de fotos. * En ataques a sistemas o servidores web: A travs de los metadatos podemos obtener los nombres de posibles usuarios, sistema operativo, nombres de red para despus realizar un ataque de fuerza bruta. Los metadatos pueden dividirse en dos categoras: Metadatos de aplicacin Son aquellos que son creados automticamente por una aplicacin y estn incrustados en todos los archivos que son creados o modificados con ese software. Sistemas de Metadatos Los sistemas operativos que controlan mquinas individuales, servidores y otros dispositivos, crean sistemas de metadatos, los cuales fijan una tabla de asignacin de campos de archivo (nombre de archivo, creacin, extensin, y el uso) a todos los archivos almacenados en el sistema de forma tal que el sistema operativo puede identificar y localizar cualquier archivo. Los sistemas de metadatos residen en el sistema de registro del sistema o el servidor utilizado para acceder y almacenar ese archivo. Estndares 1. Dubln Core Metadata Iniciativa Foro abierto dedicado al desarrollo de estndares en la lnea de los metadatos http://dublincore.org/

Da a da, pequeas, medianas y grandes empresas almacenan e intercambian informacin de manera electrnica tales como registros contables, informe de ventas, etc., exponiendo de esta manera informacin sensible o que no es pblica a un grupo de personas que pueden en muchos casos aprovechar de los metadatos para obtener datos confidenciales.
II. Qu son los Metadatos?

Videos, imgenes, documentos y otros archivos contienen informacin oculta acerca de su origen, fecha de creacin, autor, coordenadas, entre otros. A este conjunto de informacin sensible se les denomina Metadatos, stos incluyen informacin sobre el documento y su contenido, son considerados como armas de doble filo, ya que por un lado nos permiten clasificar y organizar los contenidos de la propia librera de documentos y por ende puede ser empleada por las utilidades de

2. ISO 19115 Geographic Information Metadata Norma Europea - CEN/TC287 Norma Espaola - AEN/CTN148 3. Ncleo Espaol de Metadatos NEM Informacin geogrfica Foro abierto dedicado al desarrollo de estndares en la lnea de los metadatos. 4. Extensible Metadata Platform XMP Adobe XMP (XMP) es una tecnologa de etiquetado que le permite integrar los datos acerca de un archivo. A1- Archivos Microsoft Office Microsoft indica que los siguientes metadatos pueden ser almacenados en documentos creados en todas las versiones de Word, Excel y PowerPoint: Nombre y las inciales (de la persona que cre el archivo) Nombre de la organizacin Nombre del equipo Nombre de la unidad de disco duro local o servidor de red dnde ha guardado el documento El nombre y el tipo de impresora que imprimi el documento Otras propiedades de los archivos y resumen de la informacin Partes de objetos OLE no visibles Los nombres de los autores anteriores del documento Revisiones del documento, incluido el texto eliminado que ya no es visible en la pantalla Versiones del documento Informacin sobre cualquier modelo o plantilla utilizado al crear el archivo Texto oculto y observaciones [2]. Algunas aplicaciones incluyen herramientas especficas para eliminar metadatos. Por ejemplo, Microsoft Office 2007 y 2010 incorporan una herramienta llamada Inspector de Documentos, la cual identificar los metadatos en un archivo de Office, y proporcionar las opciones para eliminar, selectivamente, algunos o todos los metadatos.

A continuacin mostramos una manera de ver los metadatos con el programa que gener el archivo, en este caso Word: 1. Abrir Archivo, Propiedades

Ilustracin 1. Propiedades Archivos Office

2. Una vez abierta la ventana de propiedades se puede navegar por ella viendo, datos generales, resumen, estadsticas, contenido, y un campo para personalizar, y as informacin de creacin de archivos, modificaciones entre otras.

Ilustracin 2. Propiedades Archivos Office

Las propiedades del archivo representan solo una parte de los metadatos almacenada en los documentos. Otro tipo de metadatos que se aaden

al documento son mediante las opciones de Campo, Control de Cambios y Versiones. 3. Las opciones de campo permiten ver la cantidad de tiempo empleada para editar el documento por parte de los usuarios. Entre otras opciones como autor del documento y fechas de creacin.

Para la extraccin de metadatos del documento en PDF se puede apoyar en la herramienta Foca (http://www.informatica64.com/foca), esto nos permite analizar los metadatos, luego proceder a la edicin/eliminacin de los metadatos con la ayuda de la herramienta: Becy PDFMetaEdit : Esta herramienta permite cambiar los metadatos de un archivo (autor, ttulo del documento, fecha de creacin, etc). Tambin permite aadir contraseas en archivos PDF para evitar su divulgacin a personas no conocidas. BeCyPDFMetaEdit es gratuito, compatible con Windows 7/Vista/XP/2000, etc. y se distribuye en dos versiones: portable e instalable. En ambiente Linux podemos recurrir a PDFTK PDF Tool Kit que permite hacerlo desde consola de una manera muy sencilla. Para instalarlo en Ubuntu seria tan facil como un:

Ilustracin 3. Opcin Campo en MSOffice [7].

# apt-get install pdftk

Otras herramientas para detectar y evitar metadatos en archivos office, estn: - Metadata Analyzer Este programa se encarga de comprobar los documentos de MS Office: Microsoft Word, Microsoft Excel y Microsoft PowerPoint en busca de este tipo de informacin. El programa analizar los documentos y informar de toda la informacin privada que encuentre. A2- Archivos PDF Los documentos PDF creados en Acrobat 5.0 o posterior contienen metadatos de documento en formato XML. XMP (Extensible Metadata Platform) proporciona a las aplicaciones de Adobe un marco de trabajo XML comn que estandariza la creacin, el proceso y el intercambio de los metadatos de documento entre los flujos de trabajo de autoedicin. Puede guardar e importar el cdigo fuente XML de los metadatos en formato XMP, lo que hace que compartir datos entre diferentes documentos sea fcil. Tambin puede guardar metadatos del documento en una plantilla de metadatos que puede reutilizar en Acrobat. (1)

Para modificar los metadatos primerio tendriamos que crear un archivo con los datos en cuestin siguiendo el siguiente patrn:
InfoKey: Key InfoValue: Valor InfoKey: Title InfoValue: Modificar Metadatos

y luego en una consola:


pdftk archivo.pdf update_info metadatos.txt output archivo_salida.pdf

A4-Archivos de Imgenes Las imgenes digitales son almacenadas en una variedad de formatos de archivo comunes como TIFF, JPEG y PSD as como formatos propietarios como RAW. Cada formato de archivo tiene reglas nicas en cuanto a cmo los formatos de metadatos deben ser almacenados dentro del archivo. Dentro de cada formato de archivo de imagen, los metadatos pueden ser almacenados dentro de una variedad de formatos comunes de contenedor de metadatos como Exif/TIFF IFDs, el Adobe XMP, Recursos de Imagen de Fototienda (PSIR) y IPTC-

IIM. Entre las herramientas ms conocidas tenemos para editar el metadata de una imagen tenemos: MetaData Stripper es una herramienta gratuita portable y ligera para remover y limpiar los metadatos innecesarios de los formatos comunes de archivos de imagen. Cuando eliminas los metadatos la calidad de la imagen no se altera. Puedes arrastrar y soltar los archivos en la ventana o abrir mltiples archivos utilizando Open Files. ExifTool, la mejor herramienta para extraer metadatos de imgenes ya que puede trabajar con EXIF e IPTC (estndares utilizados por cmara de fotos para intercambiar ficheros de imgenes con compresin JPEG). Adems reconoce metadatos insertados por cmaras: Canon, Casio, FujiFilm, HP, JVC/Victor, Kodak, Leaf, Minolta/KonicaMinolta, Nikon, Olympus/Epson, Panasonic/Leica, Pentax/Asahi, Ricoh, Sanyo, Sigma/Foveon y Sony. Disponible para Windows, Mac OSX y en modulo Perl lo que permite utilizarla en Linux. (http://www.sno.phy.queensu.ca/~phil/exiftool/) Metagoofil, diseada para extraer archivos: pdf, doc, xls y ppt de un sitio web a travs de google, y analizar los metadatos de los archivos. Para obtener informacin y realizar un ataque o un test de intrusin. Esta escrita en python. Ms informacin y descarga: (http://www.edge-security.com/metagoofil.php) (5) A4-Archivos de Audio y Video Formatos de audio posteriores a MP3 como Vorbis y FLAC tienen su propia forma de incluir metadatos, conocida como Vorbis comment. La mejor manera de poder comprobar si una aplicacin es vulnerable a referencias inseguras a objetos es verificar que todas las referencias a objetos tienen las protecciones Aunque algunos reproductores multimedia como foobar2000 soportan la edicin de los metadatos de las canciones, hay programas especializados que facilitan mucho las cosas a la hora de etiquetar grandes cantidades de archivos:

En Windows destaca MP3TAG, que a pesar de su nombre soporta muchos otros formatos de audio y va cargado con todas las opciones imaginables a la hora de trabajar con los metadatos. En Linux existe una aplicacin similar aunque algo menos potente llamada EasyTAG, fcilmente instalable desde los repositorios oficiales de las principales distribuciones. Conclusin

III.

Este artculo a presentado de manera breve y concisa la importancia de los metadatos en nuestros archivos y los mecanismos de seguridad apoyados en herramientas gratuitas a tomarse en cuenta para el resguardo de nuestra informacion. Como recomendacin se sugieres antes de enviar o publicar un archivo, considerar el impacto de ste si contiene metadatos. Esto es especialmente importante al publicar archivos, como fotografas o videos, en sitios de redes sociales como Flickr, Twitter o Facebook.

REFERENCIAS BIBLIOGRAFICAS [1] Adobe Help, http://help.adobe.com/es_ES/acrobat/pro/usin g/WS58a04a822e3e50102bd615109794195ff7c63.w.html [2] Codeplex Project con algoritmos de codificacin para HTML XML CSS JavaScript. [3] Edit openoffice, pdf imagenes http://www.hackxcrack.es/forum/index.php?to pic=10729.0 [4] http://www.hackxcrack.es/forum/index.php?P HPSESSID=10ailjp57dcit3or1nnt37hpl5&topic =8027.0 [5] http://www.daltonico.net/2010/04/metadatosen-los-archivos-de-audio.html

Potrebbero piacerti anche