Sei sulla pagina 1di 2

01/03/2011 Editoria Elettronica http://www.di.unipi.it/~gervasi/ Ricevimento dopo la lezione del mercoled.

La creazione dell'informazione adesso quasi tutta in digitale, come la trasmissione della stessa eccezione: per fruire del prodotto, come un film o un libro, dobbiamo avere uno schermo e della carta. Gestione dell'informazione: -trasformazione (passaggio da un'informazione a un'altra); -presentazione (come compongo); -diffusione. Informazione: strutturata o non strutturata rappresentabile graficamente.

Codifica dei testi: testo diverso da documento ha una sua serie di caratteristiche, come la formattazione della pagina, il testo solo il testo contenuto. Il testo pu essere lo stesso su pagine con impaginazioni diverse. Simboli: dipendono da ci che vogliamo comunicare di solito sono caratteri come quelli dell'alfabeto predeterminato che ha una rappresentazione grafica. Codici di controllo: provengono da un insieme predeterminato, non sono grafici ma hanno degli effetti che sono visibili es.: a capo. Metalinguaggio serve a distinguere i caratteri di cui parliamo da quelli attraverso il quale parliamo. Simbolo: carattere o codice di controllo: cos' un carattere? Carattere lettera dell'alfabeto, segno astratto che rappresenta la lettera (A, a,) sono la stessa cosa o diversa a seconda di come li interpretiamo, forma che il carattere assume con un font diverso, l'informazione che porta questo carattere. Glifo segno inciso, idea di permanenza, una volta che l'ho inciso quello, un qualunque segno grafico rappresentazione concreta di un grafema (una lettera, un ideogramma cinese), o di una parte di grafema (accento), o di pi grafemi (legatura). Grafema segno elementare del linguaggio scritto, non ulteriormente divisibile coincide con una lettera dell'alfabeto unit di testo. Fonema unit elementare del linguaggio parlato. Caratteri: grafemi nella codifica di testi caratteri non lettera, caratteri che non corrispondo a fonemi, pi caratteri della stessa lettera (a, A). Codificare un testo: se riusciamo a codificare un carattere possiamo codificare un testo. I calcolatori possono trattare solo i simboli 0 e 1 sequenze di 0 e 1 costituiscono numeri binari assegniamo un codice numerico a ogni unit testuale. Devo stabilire quante cifre guardare pone un limite a quanti caratteri posso codificare. ASCII (esiste da 40 anni, quasi universale), EBCDIC 7 bit potevo farci stare 128 caratteri. ASCII: American Standard Code for Information Interchange creato nel 1967, basato sull'alfabeto inglese problema di rappresentare altri caratteri stato ignorato, per simboli di uso commerciale. 33 codici di controllo (molti in disuso), 95 caratteri 128 codici, che possono essere memorizzati in 7 bit di informazione quasi tutti i computer usano 8 bit, di cui 1 lasciato libero per altro. Primi 32 simboli caratteri-simboli e numeri, blocco di 32 simboli di caratteri maiuscoli, ultimi 32 per rappresentare i caratteri minuscoli 32 + 32 + 32 = 95. Il calcolatore vede solo i codici numerici questa codifica non autodescrittiva, dobbiamo saperlo dall'esterno che una codifica ASCII su Windows indicato dall'estensione. Altre volte l'encoding si specifica in cima del testo (XML). Se a ogni fine riga c' un a capo, la formattazione si dice preformattato, se solo a fine paragrafo, si 1

dice che non formattato. UNIX usa il codice LF (13) per indicare a capo; Macintosh usa il codice CR (10); Windows e MS-DOS usano entrambi i codici (10+13). Codice EBCDIC codificato diversamente, l'alfabeto non contiguo scomodo per scrivere programmi, principale causa dell'abbandono di questo, anche se ha pi simboli. Non era standardizzato, quindi il codice poteva variare da macchina a macchina (carattere letto diversamente). Per generalizzare ASCII per un uso pi esteso stato portato a essere da 7 a 8 bit (255 codici) non sufficienti per tutti, va bene solo per affrontare una lingua alla volta (codifica per ogni lingua) file italiano lo mandi in Cina e poi da altre parti questo sistema non regge. ISO-8859-1 sostitutivo de facto dell'ASCII contiene anche l'italiano. ISO-8859-15 uguale al precedente ma aggiunge (prima l'euro non c'era). CodePage non standardizzata, e spesso incompatibile tra loro: intordotta da IBM e Microsoft. Ne esistono tante versioni. CP1252 codifica delle lingue dell'europa occidentale incluso l'italiano. Volont di vendere gli stessi computer a prezzi diversi in paesi diversi, e quindi necessario che siano incompatibili.