Sei sulla pagina 1di 3

INSTITUTO TECNOLGICO SUPERIOR DE LERDO

Ensayo Formato de archivos de secuencias

ALUMNO Mara del Rosario Jimnez Arguijo Grupo: Carrera: Materia: Titular de la materia:

10231021 4B Ingeniera en Informtica Organizacin de Datos Ricardo Bustamante Gonzlez

Cd. Lerdo, Durango. 9 de Febrero 2012

[FORMATO DE ARCHIVOS DE SECUENCIAS] 9 de Febrero de 2012

Existen bsicamente dos tipos de archivos los ASCII y los BINARIOS los primeros son aquellos a los que se les asigna un valor numrico a cada carcter con los que se pueden representar los documentos los binarios suelen ser los que comnmente hemos utizado como imgenes, procesadores de palabras, videos comprimidos o empaquetados entre otros. El archivo BINARIO permite guardar una imagen directamente sin necesidad de utilizar texto adems es muy fcil de entender mientras que en el ASCII los datos que se tienen guardados en esa estructura que forzosamente tienen que ser fijos aqu es donde el ASCII delimita los campos de dichos datos; en otras palabras este archivo permite el formato de la longitud del archivo hacindola variable fija. Sin embargo su mayor complicacin seria que existen diversos tipos de datos numricos sea el tipo de lenguajes que se ha desarrollado para crearlos.

Cabe mencionar que algunos de los archivos de secuencias son los siguientes

Formato PHYLIP: es un formato de secuencias de nucletidos y de residuos de aminocidos que se utiliza frecuentemente como formato de entrada de diferentes programas paquetes de anlisis tales como: PHYLIP.

GenBank: Este formato principalmente se caracteriza por proporcionar al usuario una informacin bastante completa sobre la secuencia.

EMBL: los archivos en este son reportados generados por la base de datos se secuencias de nucletidos y de protenas respaldada por el EMBL al igual que en archivos en formato GenBank.

FASTA: es uno de los formatos mas empleados en la actualidad. Puede incluir uno mas secuencias lineales de nucletidos no alineadas.

Instituto Tecnolgico Superior de Lerdo | Ricardo Bustamante Gonzlez

[FORMATO DE ARCHIVOS DE SECUENCIAS] 9 de Febrero de 2012

CLUSTAL: es uno de los muchos formatos para archivos de secuencias alineadas mas utilizados por los programas de anlisis de secuencias. Sus principales caractersticas es que son representados por el cdigo de una letra, los gaps son indicados con un guion - y al final de las secuencias alineadas, puede aparecer una especia de secuencia consenso con signo como: : y .

Como conclusin los archivos secuenciales tienen diversa caractersticas a su vez que ventajas y desventajas estos son complejos pero no difcil de implementar son primordiales para tener bases fundamentales de estos al momento de aplicarlos no son muy complejos.

BIBLIOGRAFIA: Guzmn Vega Miguel/ Apuntes complementarios de computacin/ Tipos de archivos de secuencias/ www.hipertext.info/documentos/archivos.htm

Instituto Tecnolgico Superior de Lerdo | Ricardo Bustamante Gonzlez

Potrebbero piacerti anche