Codigo ASCII y UNICODE

CDIGO ASCII
ASCII, acrnimo de American Standard Code for Information Interchange (Cdigo Normalizado Americano para el Intercambio de Informacin). Es un cdigo alfanumrico universalmente aceptado, que asigna valores numricos a las letras, nmeros, signos de puntuacin y algunos otros caracteres. Al normalizar los valores utilizados para dichos caracteres, ASCII permite que los ordenadores, equipos electrnicos y programas informticos intercambien informacin. ASCII incluye 256 cdigos divididos en dos conjuntos, estndar y extendido, de 128 cada uno. Estos conjuntos representan todas las combinaciones posibles de 7 u 8 bits, siendo esta ltima el nmero de bits en un byte. El conjunto ASCII bsico, o estndar, utiliza 7 bits para cada cdigo, lo que da como resultado 128 cdigos de caracteres desde 0 hasta 127 (00H hasta 7FH hexadecimal). El conjunto ASCII extendido utiliza 8 bits para cada cdigo, dando como resultado 128 cdigos adicionales, numerados desde el 128 hasta el 255 (80H hasta FFH extendido). En el conjunto de caracteres ASCII bsico, los primeros 32 valores estn asignados a los cdigos de control de comunicaciones y de impresora caracteres no imprimibles, como retroceso, retorno de carro y tabulacin empleados para controlar la forma en que la informacin es transferida desde una computadora a otra o desde una computadora a una impresora. Los 96 cdigos restantes se asignan a los signos de puntuacin corrientes, a los dgitos del 0 al 9 y a las letras maysculas y minsculas del alfabeto latino. Los cdigos de ASCII extendido, del 128 al 255, se asignan a conjuntos de caracteres que varan segn los fabricantes de computadoras y programadores de software. Estos cdigos no son intercambiables entre los diferentes programas y computadoras como los caracteres ASCII estndar. Por ejemplo, IBM utiliza un grupo de caracteres ASCII extendido que suele denominarse conjunto de caracteres IBM extendido para sus computadoras personales. Apple Computer utiliza un grupo similar, aunque diferente, de caracteres ASCII extendido para su lnea de computadoras Macintosh. Por ello, mientras que el conjunto de caracteres ASCII estndar es universal en el hardware y el software de los microordenadores, los caracteres ASCII extendido pueden interpretarse correctamente slo si un programa, computadora o impresora han sido diseados para ello. Historia del Cdigo ASCII : El cdigo ASCII (siglas en ingls para American Standard Code for Information Interchange, es decir Cdigo Americano (estadounidense) Estndar para el intercambio de Informacin )(se pronuncia Aski). Fue creado en 1963 por el Comit Estadounidense de Estndares o "ASA", este organismo cambio su nombre en 1969 por "Instituto Estadounidense de Estndares Nacionales" o "ANSI" como se lo conoce desde entonces.
Este cdigo naci a partir de reordenar y expandir el conjunto de smbolos y caracteres ya utilizados por ese entonces en telegrafa por la compaa Bell. En un primer momento solo inclua las letras maysculas, pero en 1967 se agregaron las letras minsculas y algunos caracteres de control, formando as lo que se conoce como US-ASCII, es decir los cdigos del 0 al 127. As con este conjunto de solo 128 caracteres fue publicado en 1967 como estndar, conteniendo todos lo necesario para escribir en idioma ingls. En 1981, la empresa IBM desarroll una extensin de 8 bits del cdigo ASCII, llamada "pgina de cdigo 437", en esta versin se reemplazaron algunos caracteres de control obsoletos, por caracteres grficos. En 1986, se modific el estndar para agregar nuevos caracteres latinos, necesarios para la escrituras de textos en otros idiomas, como por ejemplo el espaol, as fue como se agregaron los caracteres que van del ASCII 128 al 255. Casi todos los sistemas informticos de la actualidad utilizan el cdigo ASCII para representar caracteres y textos
CDIGO UNICODE
Superconjunto de caracteres, basado en el conjunto ASCII, pero que utiliza una definicin de dos bytes por carcter, en vez de uno; esto permite definir cdigos de caracteres (o conjuntos de caracteres) con ms de las 256 entradas posibles del estndar ASCII, dado que un solo byte puede definir 256 valores distintos, mientras que una palabra de dos bytes puede definir 65.536. Su definicin es mantenida por el denominado Unicode Consortium, del que forman parte empresas como Adobe, Apple, IBM, Microsoft, HewlettPackard, Oracle, Nokia, NCR, Sun Microsystems y otras, lderes del mundo de la informtica y las telecomunicaciones. El estndar ISO, ms amplio, utiliza palabras de 4 bytes, pero tiene en cuenta el cdigo Unicode como un subconjunto (se trata de los 65.536 primeros caracteres del cdigo ISO10646). Los caracteres de Unicode abarcan toda clase de tipografas y smbolos, desde los latinos hasta los asiticos (pasando por smbolos matemticos, de moneda y sistema Braille, entre otros), con un nico valor identificativo, lo que evita tener que instalar conjuntos de caracteres especficos para cada alfabeto. Historia del Cdigo UNICODE Antes de Unicode, haba diferentes sistemas de codificacin de caracteres para cada idioma, cada uno usando los mismos nmeros (0-255) para representar los caracteres de ese lenguaje. Algunos (como el ruso) tienen varios estndares incompatibles que representan los mismos caracteres; otros idiomas (como el japons) tienen tantos caracteres que precisan ms de un byte. Intercambiar documentos entre estos sistemas era difcil porque no haba manera de que un computador supiera con certeza qu esquema de codificacin de caracteres haba usado el autor del documento; el computador slo vea nmeros, y los nmeros pueden significar muchas cosas. Para resolver estos problemas se dise Unicode. El proyecto Unicode se inici a finales de 1987, tras conversaciones entre los ingenieros de Apple y Xerox: Joe Becker, Lee Collins y Mark Davis. Como resultado de su colaboracin, en agosto de 1988 se public el primer borrador de Unicode bajo el nombre de Unicode88. Esta primera versin, con cdigos de 16 bits, se public asumiendo que solo se codificaran los caracteres necesarios para el uso moderno. Durante el ao 1989 el trabajo continu con la adicin de colaboradores de otras compaas como Microsoft o Sun Microsystems. El Consorcio Unicode se form el 3 de febrero de 1991 y en octubre de 1991 se public la primera versin del estndar. La segunda versin, incluyendo escritura ideogrfica Han se public en junio de 1992.
Unicode Character Ranges:

0020 007F 00A0 00FF 0100 017F 0180 024F 02B0 02FF 0300 036F 0370 03FF 0400 04FF 0500 052F 0530 058F 0590 05FF 0600 06FF 0700 074F 0900 097F 0980 09FF Basic Latin Latin-1 Supplement Latin Extended-A Latin Extended-B Spacing Modifier Letters Combining Diacritical Marks Greek and Coptic Cyrillic Cyrillic Supplementary Armenian Hebrew Arabic Syriac Devanagari Bengali 2580 259F 25A0 25FF 2600 26FF 2700 27BF 27C0 27EF 27F0 27FF 2800 28FF 2900 297F 2980 29FF 2A00 2AFF 2B00 2BFF 2E80 2EFF 2F00 2FDF 2FF0 2FFF 3000 303F 3040 309F 30A0 30FF 3100 312F 3130 318F 3190 319F 31A0 31BF 31F0 31FF 3200 32FF 3300 33FF 3400 4DBF 4DC0 4DFF 4E00 9FFF A000 A48F A490 A4CF AC00 D7AF D800 DB7F DB80 DBFF DC00 DFFF E000 F8FF F900 FAFF FB00 FB4F FB50 FDFF FE00 FE0F FE20 FE2F FE30 FE4F FE50 FE6F FE70 FEFF FF00 FFEF FFF0 FFFF 10000 1007F 10080 100FF 10100 1013F 10300 1032F Block Elements Geometric Shapes Miscellaneous Symbols Dingbats Miscellaneous Mathematical Symbols-A Supplemental Arrows-A Braille Patterns Supplemental Arrows-B Miscellaneous Mathematical Symbols-B Supplemental Mathematical Operators Miscellaneous Symbols and Arrows CJK Radicals Supplement Kangxi Radicals Ideographic Description Characters CJK Symbols and Punctuation Hiragana Katakana Bopomofo Hangul Compatibility Jamo Kanbun Bopomofo Extended Katakana Phonetic Extensions Enclosed CJK Letters and Months CJK Compatibility CJK Unified Ideographs Extension A Yijing Hexagram Symbols CJK Unified Ideographs Yi Syllables Yi Radicals Hangul Syllables High Surrogates High Private Use Surrogates Low Surrogates Private Use Area CJK Compatibility Ideographs Alphabetic Presentation Forms Arabic Presentation Forms-A Variation Selectors Combining Half Marks CJK Compatibility Forms Small Form Variants Arabic Presentation Forms-B Halfwidth and Fullwidth Forms Specials Linear B Syllabary Linear B Ideograms Aegean Numbers Old Italic
0250 02AF IPA Extensions
0780 07BF Thaana
0A00 0A7F Gurmukhi 0A80 0AFF Gujarati 0B00 0B7F Oriya 0B80 0BFF 0C80 0CFF Tamil Kannada 0C00 0C7F Telugu 0D00 0D7F Malayalam 0D80 0DFF Sinhala 0E00 0E7F 0E80 0EFF 0F00 0FFF 1000 109F 10A0 10FF 1100 11FF 1200 137F 13A0 13FF 1400 167F 1680 169F 16A0 16FF 1700 171F 1720 173F 1740 175F 1760 177F 1780 17FF 1900 194F 1950 197F 19E0 19FF 1E00 1EFF 1F00 1FFF Thai Lao Tibetan Myanmar Georgian Hangul Jamo Ethiopic Cherokee Unified Canadian Aboriginal Syllabics Ogham Runic Tagalog Hanunoo Buhid Tagbanwa Khmer Limbu Tai Le Khmer Symbols Latin Extended Additional Greek Extended
1800 18AF Mongolian
1D00 1D7F Phonetic Extensions
2000 206F 2070 209F
General Punctuation Superscripts and Subscripts
10330 1034F 10380 1039F 10400 1044F
Gothic Ugaritic Deseret Shavian Cypriot Syllabary
20A0 20CF Currency Symbols 2100 214F 2150 218F 2190 21FF 2200 22FF 2300 23FF 2400 243F 2440 245F 2460 24FF 2500 257F Letterlike Symbols Number Forms Arrows Mathematical Operators Miscellaneous Technical Control Pictures Optical Character Recognition Enclosed Alphanumerics Box Drawing
20D0 20FF Combining Diacritical Marks for Symbols 10450 1047F 10800 1083F
10480 104AF Osmanya 1D000 1D0FF Byzantine Musical Symbols 1D100 1D1FF Musical Symbols 1D300 1D35F Tai Xuan Jing Symbols 1D400 1D7FF Mathematical Alphanumeric Symbols 20000 2A6DF CJK Unified Ideographs Extension B 2F800 2FA1F E0000 E007F CJK Compatibility Ideographs Supplement Tags
Debido a que es una gran cantidad de caracteres, solamente se presentaran los:

0020 007F Basic Latin 00A0 00FF Latin-1 Supplement 0100 017F Latin Extended-A 0180 024F Latin Extended-B
Referencias bibliogrficas:
[1] [2] [3] [4] [5] Microsoft Student con Encarta Premium 2009 DVD http://informatica.dgenp.unam.mx/recomendaciones/codigo-ascii http://juanmancilla.wordpress.com/tag/codigo-ascii/ http://www.ecured.cu/index.php/Lenguaje_Unicode http://jrgraphix.net/research/unicode_blocks.php

Codigo ASCII y UNICODE

Caricato da

Informazioni sul documento

Descrizione originale:

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Codigo ASCII y UNICODE

Caricato da

Copyright:

Formati disponibili

CDIGO ASCII

Unicode Character Ranges:

0250 02AF IPA Extensions

0780 07BF Thaana

1800 18AF Mongolian

1D00 1D7F Phonetic Extensions

2000 206F 2070 209F

General Punctuation Superscripts and Subscripts

10330 1034F 10380 1039F 10400 1044F

Gothic Ugaritic Deseret Shavian Cypriot Syllabary

Debido a que es una gran cantidad de caracteres, solamente se presentaran los:

Potrebbero piacerti anche