Libri digitali. Come costruirli
Di Mario Canton
()
Info su questo ebook
Leggi altro di Mario Canton
Correlato a Libri digitali. Come costruirli
Titoli di questa serie (7)
E così vuoi scrivere un ebook ... e magari pubblicarlo. Rassegna dei molti problemi che dovrai affrontare e delle soluzioni che dovrai trovare Valutazione: 0 su 5 stelle0 valutazioniE così vuoi scrivere un ebook ... 2: ... e magari pubblicarlo. Rassegna dei molti problemi che dovrai affrontare e delle soluzioni che dovrai trovare. Valutazione: 0 su 5 stelle0 valutazioniLibri digitali. Come costruirli Valutazione: 0 su 5 stelle0 valutazioniSuggerimenti per la formattazione dei libri digitali Valutazione: 0 su 5 stelle0 valutazioniScrivere semplice: Usare Markdown per creare testi digitali Valutazione: 0 su 5 stelle0 valutazioniePub. Lo standard più diffuso al mondo per la creazione di e-Book. Stato dell'arte e tecniche redazionali. Valutazione: 0 su 5 stelle0 valutazioniL'usignolo delle 4 e 20. Una avventura nel graphic design. Valutazione: 0 su 5 stelle0 valutazioni
Ebook correlati
E così vuoi scrivere un ebook ... 2: ... e magari pubblicarlo. Rassegna dei molti problemi che dovrai affrontare e delle soluzioni che dovrai trovare. Valutazione: 0 su 5 stelle0 valutazioniRegEx per autori, scrittori e redattori. Guida operativa all'utilizzo delle espressioni regolari nel trattamento di testi digitali. Valutazione: 0 su 5 stelle0 valutazioniE così vuoi scrivere un ebook ... e magari pubblicarlo. Rassegna dei molti problemi che dovrai affrontare e delle soluzioni che dovrai trovare Valutazione: 0 su 5 stelle0 valutazioniRegEx3: L'uso delle espressioni regolari nelle applicazioni e nei linguaggi Valutazione: 1 su 5 stelle1/5Introduzione pratica alla programmazione in C++ - Parte Prima Valutazione: 0 su 5 stelle0 valutazioniIl Principe (capitoli scelti) (Audio-eBook) Valutazione: 0 su 5 stelle0 valutazioniProgrammare in C: Introduzione pratica Valutazione: 0 su 5 stelle0 valutazioniDa InDesign 6 all’Epub e Mobi Valutazione: 0 su 5 stelle0 valutazioniElaborazione del linguaggio naturale con Python Valutazione: 0 su 5 stelle0 valutazioniPython | Programmazione passo dopo passo: La guida per i principianti per un'introduzione alla programmazione con Python Valutazione: 0 su 5 stelle0 valutazioniStartEbook: impara a utilizzare l'ebook Valutazione: 0 su 5 stelle0 valutazioniGuida al CSS per ebook Valutazione: 0 su 5 stelle0 valutazioniTraduzione e nuove tecnologie: Informatica e internet per traduttori. Seconda edizione Valutazione: 0 su 5 stelle0 valutazioniPubblica il tuo eBook Valutazione: 0 su 5 stelle0 valutazioniLa Macchina del Tempo (Audio-eBook) Valutazione: 0 su 5 stelle0 valutazioniHTML5 canvas in tempo reale Valutazione: 0 su 5 stelle0 valutazioniRobinson Crusoe (Audio-eBook) Valutazione: 0 su 5 stelle0 valutazioniAmicissimi e altre novelle (Audio-eBook) Valutazione: 0 su 5 stelle0 valutazioniIl diario di un uomo di cinquant'anni (Audio-eBook) Valutazione: 0 su 5 stelle0 valutazioniI viaggi di Gulliver (Audio-eBook) Valutazione: 5 su 5 stelle5/5Il Cantico dei Cantici (Audio-eBook) Valutazione: 0 su 5 stelle0 valutazioniTecnologia e Progettazione per il mondo digitale e per il web III Valutazione: 0 su 5 stelle0 valutazioniReparto N. 6 (Audio-eBook) Valutazione: 0 su 5 stelle0 valutazioniRegEx 2: Il trattamento testi con le espressioni regolari Valutazione: 0 su 5 stelle0 valutazioniLe memorie di un pazzo (Audio-eBook) Valutazione: 0 su 5 stelle0 valutazioniPoemi epici del Rinascimento – Ariosto e Tasso (selezione) (Audio-eBook) Valutazione: 0 su 5 stelle0 valutazioniDecameron (novelle scelte) (Audio-eBook) Valutazione: 0 su 5 stelle0 valutazioniPoesie (selezione) (Audio-eBook) Valutazione: 0 su 5 stelle0 valutazioniGoogle Drive e la didattica Valutazione: 0 su 5 stelle0 valutazioniTecnologia e Progettazione per il mondo digitale e per il web I Valutazione: 5 su 5 stelle5/5
Recensioni su Libri digitali. Come costruirli
0 valutazioni0 recensioni
Anteprima del libro
Libri digitali. Come costruirli - Mario Canton
>
Capitolo I
ePub
Argomenti
Conoscere lo standard ePub 2 e gli e-reader specifici per opere prevalentemente testuali
Esaminare come costruire i file all'interno dell'ePub
Imparare alcune basi di XML
Capire quali file sono necessari per un ePub
Scoprire quali tag HTML sono utilizzabili in un ePub
Essere in grado di visualizzare il contenuto di un ePub
Il mondo della lettura è mutato radicalmente. I libri di carta, le riviste e altro materiale a stampa sono letti sempre più di frequente in un formato digitale. Questo riguarda non solo i lettori, ma anche gli scrittori. I dispositivi di lettura elettronica sono ormai popolari e con loro i libri elettronici (e-book), detti anche libri digitali per distinguerli – in base alla loro fondazione su elementi «discreti» anziché «continui» – dai libri analogici a stampa.
Come lettore, si vuole essere in grado di godere di un libro visivamente. Piccoli miglioramenti possono rendere un e-book più piacevole. Cambiare i caratteri, aggiungere immagini, regolare il layout di testo possono essere alcuni trucchi possibili da utilizzare per «sistemare» un e-book. Come scrittore, si vuole rendere l'esperienza del lettore più piacevole. Un vantaggio caratteristico del formato digitale può essere quello di poter mantenere l'attenzione del lettore che vuole saperne di più sulla vostra produzione, mediante collegamenti, esempi scaricabili, accesso ad altre fonti e regolazione personalizzata della visualizzazione del testo.
In questo capitolo, verrà illustrato lo standard ePub versione 2.0.1, denominato «ePub 2». Capiremo in cosa consista lo standard ePub attualmente e come stia progredendo. Alcuni standard sono principalmente per gli e-reader in bianco e nero, mentre altri sono per e-reader a colori. Ad esempio, alcuni standard sono finalizzati specificatamente agli e-reader a colori, che consentono anche l'utilizzo contemporaneo di video, testo e audio. Altri e-reader sono concepiti soltanto per il testo. ePub 2 è principalmente per e-reader in bianco e nero (scala di grigi), ma può essere visualizzato anche su dispositivi a colori.
ePub Versione 2 (ePub 2)
Lo standard ePub 2 comprende tre parti base, come mostrato nella Fig. 1-1.
Fig 1-1. Le tre parti base di un ePub
Le tre parti sono descritte di seguito.
• OEBPS Container Format (OCF) Contenitore che comprende tutti i file che compongono la pubblicazione. Raccolta dei singoli file all'interno di un file .zip, rinominato in .epub.
• Open Packaging Format (OPF) Descrive e fa riferimento ai componenti all'interno della pubblicazione. Include informazioni sul contenuto, l'elenco dei contenuti, l'ordine di lettura dei contenuti e delle parti del documento.
• Open Publication Structure (OPS) Contenuti della pubblicazione. Costituiti da file XHTML/HTML, CSS, font e immagini.
Ogni parte ha requisiti specifici di cui si dovrebbe essere consapevoli quando si lavora con i file ePub. Bisogna assicurarsi di aver compreso i fondamenti di ciascuna sezione. Di seguito i dettagli per ogni sezione, con alcune parti discusse con maggiore approfondimento nei capitoli successivi.
✵
Open Container Format
Da quello che si è visto nella Fig. 1-1, ci si potrebbe chiedere come mai tutte queste informazioni siano sistemate in un unico file. In realtà la soluzione è molto semplice, ma, naturalmente, accompagnata da molti dettagli e molte specifiche. Non c'è da preoccuparsi perché la maggior parte delle informazioni non viene quasi mai utilizzata nella stragrande maggioranza dei file ePub.
La risposta a questa domanda è un file .zip. Un file .zip è un singolo file che contiene uno o più file memorizzati o compressi. Ciascun file memorizzato all'interno dello .zip è «come è» (as-is) senza che siano modificate le dimensione dei file, mentre i file compressi sono scritti in modo tale da avere una dimensione dei file più piccola.
L'IDPF (International Digital Publishing Forum) stabilisce che OCF sia una raccolta logica di file, ovvero un «contenitore logico», che è una raccolta di vari file e cartelle. Questo contenitore logico si trova all'interno di un file .zip, che è il «contenitore fisico».
Il contenitore logico presenta i requisiti esposti di seguito:
• Il file system all'interno dell'archivio deve avere una singola directory principale.
• Tutti i file incorporati diversi da quelli richiesti devono essere in una directory al di fuori della radice.
• I file speciali richiesti dall'OCF devono essere nella directory \META-INF (discussa più avanti in questo capitolo).
Utilizzo delle parole chiave
Molti degli standard, impiegati dall'IDPF e altre organizzazioni, utilizzano parole come «richiesto», «dovuto», «dovrebbe», etc. A volte questi significati possono essere un po' opprimenti quando si incontrano in continuazione. La seguente tabella indica i loro significati.
Il contenitore fisico deve avere il seguente requisito:
• La struttura del file system deve essere mappata «uno-a-uno» proprio come su un disco rigido o altri supporti di archiviazione.
Requisiti dell'archvio .zip
Immaginiamo che un file .zip sia un disco rigido fisico. Quando si copiano e visualizzano i file nella struttura di una directory, si vede la directory principale, i file e le cartelle. Questo elenco è il nostro contenitore logico. Il file .zip sul supporto di archiviazione è invece il nostro contenitore fisico.
Dal momento che il nostro file .zip è simile a un disco rigido, ha una singola directory principale. C'è una directory obbligatoria nella root chiamata META-INF. Altri file in ePub necessari per la visualizzazione sono in un'altra directory dalla root. Proprio come un disco rigido, tutti i file e le directory sono mappati uno a uno. Questo significa che c'è solo una directory META-INF. Ogni nome di file è usato da un solo archivio all'interno della stessa cartella.
I programmi che producono file .zip consentono di suddividere il file .zip su vari supporti. Per esempio, se si desidera salvare un file .zip in un DVD e la dimensione totale del file richiede più di un DVD, è possibile dividere il .zip in più parti che riempirebbero un DVD, con il resto sul disco successivo. I file ePub non possono essere divisi in questo modo e devono essere un file .zip completo rinominato con un'estensione .epub.
I file ePub devono essere «appiattiti» (flate compressed) o «immagazzinati» (stored). La compressione «piatta» è analoga a uno «sgonfiamento» ed è un metodo di compressione «lossless». Compressione «lossless» significa che nessuna informazione viene persa dal file originale e tutti i dati esistono ancora. Il metodo «flate/sgonfia» funziona meglio per i file di testo e le immagini in bianco e nero o scala di grigi. I dati «immagazzinati» invece si ritrovano quando i file non possono essere o non vengono compressi e sono solo inseriti nel file con estensione .zip nello stato originale. I file «immagazzinati» (stored) non vengono ridotti in dimensione, anche se altri file all'interno di .zip possono essere compressi. Altri metodi di compressione dovrebbero generare un errore da parte del dispositivo di lettura.
Se il dispositivo di lettura o il sistema supporta le estensioni .zip64, è possibile utilizzare il formato di compressione «Zip64». L'estensione rimuove i limiti dei file .zip regolari sulle dimensioni e il numero di file all'interno dell'archivio, come mostrato in Tav. 1-1. Questo può aumentare drasticamente il numero di file in uno .zip, così come le dimensioni dei file compressi.
Tav. 1-1. Differenze tra i formati Standard e Zip64
[ (*) EB = Exabyte ]
I file .zip possono essere criptati dal programma di archiviazione, richiedendo una password per accedere al contenuto. ePub non consente che la crittografia sia gestita dal file .zip. Per utilizzare la crittografia, vedere la sezione più avanti intitolata «encryption.xml».
Un file con estensione .zip deve codificare i nomi in archivio utilizzando UTF-8. UTF (Unicode Transformation Format) è un modo di utilizzare da 1 a 4 byte per rappresentare i caratteri Unicode. Il set di caratteri Unicode designa diversi caratteri di testo e script. Unicode non supporta solo testo e script, ma anche punteggiatura, simboli matematici, numeri e così via. Ogni carattere UTF rappresenta un valore che corrisponde a un simbolo Unicode. I valori Unicode rappresentano i caratteri delle varie lingue scritte del mondo. I valori Unicode possono rappresentare lettere latine, lettere greche, script in ebraico, cirillico e molti altri simboli. Per un elenco più completo delle lingue, si vada a Unicode.org.
Lo standard ePub richiede che il campo «Version Needed To Extract» nell'intestazione dello .zip sia 10, 20 o 45. La posizione del campo a 2 byte è nell'intestazione locale (local header) all'offset 04 nell'intestazione dello .zip. I valori sono mostrati in Tav. 1-2. L'esempio di file ePub mostrato in Fig. 1-2. è un file «sgonfiato» (deflate).
Tav. 1-2. Versione del campo necessario per l'estrazione
Fig. 1-2. Valore dll'intestazione dello .zip
visto su un editor esadecimale
Il metodo di compressione deve essere 0 o 8. Qualsiasi altro valore fa sì che la lettura di un ePub restituisca un errore. Come si può vedere in Fig. 1-3, il file ePub di esempio ha il metodo di compressione 08 all'offset 8. Il valore 0 indica che i file sono stati «immagazzinati» (stored) nell'archivio, mentre 8 significa che i file sono stati «sgonfiati» (deflated). Per scopi di riferimento, altri valori di compressione sono indicati in Tav. 1-3. Ricordare che sono validi solo i valori 00 e 08.
Tav. 1-3. Metodi di compressione e loro valori
Fig. 1-3. Editor esadecimale di un ePub
che mostra un metodo di compressione piatto
(deflated)
Un ePub con un'intestazione di decriptazione dell'archivio o un record di dati extra archivio non è valido. Come indicato in precedenza, il file .zip non deve controllare la crittografia. Quando un .zip gestisce la crittografia, l'intestazione di decriptazione dell'archivio e l'archivio dei dati aggiuntivi contengono appunto le informazioni sulla crittografia.
Il primo file inserito nella radice dello .zip deve essere il file «mimetype», senza spaziatura o modifiche aggiuntive apportate al contenuto. Il file «mimetype» non deve essere compresso o crittografato e non deve essere presente un campo aggiuntivo nell'intestazione dello .zip. Il campo aggiuntivo viene utilizzato per archiviare informazioni aggiuntive per applicazioni speciali o requisiti di piattaforma. Se questi elementi non sono presenti, allora le informazioni di Tav. 1-4. appariranno nella posizione specifica dell'ePub, che viene mostrata in Fig. 1-4. In questo caso appare il «numero magico» definito nella RFC 2048 (sequenza di byte che sono sempre presenti e quindi possono essere utilizzati per identificare le entità di un determinato tipo di supporto). Naturalmente, questo non accade sempre, dal momento che non tutti i file ePub producono il «numero magico», come si può vedere osservando le Figg. 1-2 e 1-3. Tutti i file .zip dovrebbero iniziare con «PK», non importa quali altre impostazioni siano state modificate.
Tav. 1-4. Valore e posizione del «numero magico»
Fig. 1-4. Il «numero magico» in ePub
Ora che abbiamo esaminato il file .zip nel suo complesso, diamo un'occhiata alle regole per l'interno dell'archivio, vale a dire, le directory e i file. Le directory sono come cartelle e i file possono essere considerati come i documenti all'interno di queste. Naturalmente, il file .zip è il contenitore in cui vengono posizionate le cartelle e i documenti.
La radice inizia con una barra rovesciata (\) e anche tutte le cartelle sono separate con un backslash (barra retroversa). Anche i nomi dei file sono separati dai nominativi delle directory da una barra rovesciata. Ad esempio, se dovessimo annotare il percorso a partire dalla radice al file container.xml, lo scriveremmo così:
\META-INF\container.xml
Tutti i file nell'archivio devono essere codificati in UTF-8 e non superare le dimensioni di 255 byte o caratteri. I percorsi non devono superare le dimensioni di 65.535 byte o caratteri.
La directory e i nomi dei file non devono includere uno dei seguenti elementi:
/, ", *, :, >, <, ?, \
Inoltre, il nome dei file non può terminare con un punto.
Alcuni programmi .zip possono supportare la distinzione tra maiuscole e minuscole sui nomi dei file. Ciò significa che il file «container.xml» è un file diverso da «Container.xml». Tutti i file all'interno di una singola cartella non devono avere lo stesso nome dopo che i nomi siano stati tutti trasformati in minuscolo o maiuscolo (questo include anche nomi delle directory).
A seconda della lingua utilizzata (se dive