Sei sulla pagina 1di 13

Prctica

Documentaci audiovisual

Rediart

Jaume Reig Carrascosa, desembre de 2014

ndex
1. Gesti documental. Rediart.

2. Descipci del cas destudi

3. Exposici del cas i objectius

4. Elements i eines documentals utilitzades

El gestor de continguts web (CMS)

Arquitectura de la informaci

Perfils de publicacdors i administradors CMS

5. Metodologia

Estimaci temps i fases treball

Metodologia del treball i optimitzaci del temps

Ordre i noms darxius i directoris

Espai disc dur documents

Backups en el procs de treball

10

6. Punts forts i punts dbils

11

Anlisis extern

11

Anlisis intern

12

Definici objectius a partir de DAFO

12

7. Conclusions

13

8. Bibliografia

13

1.Gesti documental. Rediart

2.Descripci del cas destudi


Rediart s una associaci sense afany de lucre encarregada de la gesti, preservaci i
difusi de la histria escrita dArts (poblaci del Bages duns 5500 habitants). Lassociaci
actualment publica i ns portaveu de la revista trimestral LArtesenc, del qual actualment
es va pel nmero 222. Tamb s lencarregada de la conservaci daltres revistes que
han existit al poble en temps passats. Lassociaci compte amb un local social cedit per
lajuntament del poble on coordina totes les seves activitats i on guarda exemplars tant
de la revista actual com de la majoria de revistes antigues. Al mateix temps guarda tant
en format digital com en analgic un ampli fons fotogrfic. A partir del nmero 198 de
la revista LArtesenc, aquesta s maquetada totalment en format digital, i sen tenen
cpies en digital, per no de les revistes anteriors al nmero 198, ni lgicament de les
altres revistes ms antigues que han existit al poble on tan sols existeixen en format paper.

3.Exposici del cas i objectius


Lassociaci vol catalogar, indexar i fer accessible a tothom que ho vulgui el fons documental
de revistes que gestiona, com a part dels mateixos propsits recollits en els estatuts de
lassociaci. Pesem per exemple en estudiants, historiadors, periodistes, escriptors,
economistes,.. que facin treballs de recerca o daltre mena i que estiguin interessats a
consultar aquest fons documental lliurement.
Aix doncs el treball consistiria a catalogar i indexar les 222 revistes LArtesenc publicades
actualment en format paper, aix com les que es vagin publicant trimestralment. (La
revista en curs no sortiria publicada, per no desmotivar la compra de la mateixa). A ms
a ms, tamb sindexarien i es catalogarien entre 152 i 200 publicacions ms (no saben el
nombre exacte de moment) daltres revistes que han existit en temps passats al poble (El
dos de Janer, Ptria nova, Gavarresa, Vincit, Veremall i Tot daqu). Al mateix temps de
catalogar, indexar i centralitzar tots aquests continguts en un sol espai, lobjectiu tamb

s digitalitzar aquestes publicacions per assegurar-ne la preservaci del seu contingut,


com tamb per permetren laccs ms cmode i rpid en els nous formats i plataformes
de visualitzaci digitals actuals. Aix doncs resumint els objectius serien:
Catalogar i indexar les 222 publicacions de LArtesenc i les que es publicaran
posteriorment.
Catalogar i indexar unes 200 publicacions ms daltres revistes que han existit al
poble.
Digitalitzar aquestes publicacions per assegurar-ne el contingut.
Publicar aquests documents i fer-los accessibles per tothom en un sol punt
centralitzat.

4.Elements i eines documentals utilitzades


Leina principal utilitzada seria la publicaci daquests continguts en la pgina web creada
i publicada recentment de la revista LArtesenc. www.lartesenc.cat.
Per una part tenim des de la revista 197 fins a la 222 on el disseny i maquetaci han estat
fets totalment amb programari dedici digital, on sen tenen cpies digitals dels originals
i on no hi ha problema per a fer-ne una exportaci en PDF amb una bona relaci qualitatpes per tal de poder-los publicar a la web. A ms a ms, i encara ms important sen pot fer
una exportaci en XML i mitjanant algun script poder maquetar els continguts en HTML,
CSS cmodament, sobretot de la portada i el sumari per aix tenir una fcil indexaci dels
continguts en la web, com per poder fer cerques pel cercador intern de la web o incorporar
algun tipus de filtre que facis recerques a partir daquest text si es creu convenient en el
futur. Aix doncs entre el nmero 197 al 222 no hi ha problema i de fet a lhora de publicar
la web ja es van poder inserir aquests continguts tamb, amb la imatge de la portada, a
ms a ms dels ttols i subttols textuals de la portada i el contingut del sumari que inclou:
secci, ttol article, autor i nmero de plana.
Pels altres nmeros (o sigui del nmero 1 al 197) el pla s digitalitzar (escanejar) els
documents per a poder muntar les revistes en PDF i introduir a m les informacions
dels titulars i subtitulars de les portades i digual manera les informacions dels sumaris
amb el mateix format que les que ja shan introdut a la web. O sigui: Secci (si existeix),
ttol article, autor i nmero de plana, aix com la data de publicaci de la revista. Cal
destacar que tota aquesta informaci de digitalitzaci manual, tamb shaur de realitzar
amb les revistes anteriors a LArtesenc. Posteriorment a aquesta primera digitalitzaci
necessria, es realitzar una feina de OCR (Reconeixement ptic de Carcters) per tal que
les revistes digitalitzades tamb tinguin un format on els carcters siguin reconeguts per
programari i per tant es puguin realitzar cerques pels documents.

El gestor de continguts web (CMS)


Pel que fa a la web sha optat per un dels gestors de continguts open source, que ens ofereix
la suficient flexibilitat i potncia, i que al mateix temps ofereix garanties de manteniment
de core del CMS per part de la comunitat a llarg termini. Aquest s Joomla.

Arquitectura de la informaci
Larquitectura de la informaci i esquema funcional de la web en aquest apartat seria molt
senzilla per efectiva.

Nmeros
anteriors

Categoria
(nmeros
anteriors)

Revista
(fitxa)

Llistat
nmeros
Cerdador
Link
descrrega
Dropbox
(Nvol)

Nmeros anteriors: Seria la pestanya que al fer clic anirem a la categoria de nmeros
anteriors.
Categoria Nmeros anteriors: Mostraria les portades dels nmeros anteriors a 3
columnes, amb paginaci, data publicaci, autor i clics. A ms a ms el link de lenlla,
Llegir-ne ms que ens portaria al nmero en qesti.
Revista nmero: Mostra la portada ms gran, data de publicaci, autor, resum titulars i
continguts del sumari, ms el link de descrrega de la revista en PDF.
*Aquest esquema funcional ser el mateix per la resta de revistes. Sha optat per penjar els
PDFs al nvol per qesti doptimitzaci despai i per tema de pressupost. De totes maneres sen
tindran cpies en local als ordinadors de lassociaci.

Perfils de publicadors i administradors del CMS


En principi la web tindr 2 perfils diferenciats en tasques i responsabilitats. Ladministrador
o superadministrador, que ser lencarregat de manteniment web, modificaci templates,
i backups de seguretat, i el perfil de publicador que ser lencarregat danar publicant
paulatinament i regularment els continguts a la web, previ entrenament de com sha de
fer per part del superadministrador.

5. Metodologia
De forma resumida i esquemtica la metodologia a aplicar seria:

Revistes LArtesenc
del 1 al 196 i les altres
revistes histriques
dArts.

Escanejar planes
revistes (imatges
Tiff )

Maquetar les revistes a


partir de les imatges (amb
Indesign)

Publicaci web en
format
PDF
Feina OCR + revisi
de continguts +
maqueatr revistes

Dropbox
(Nvol)
Guardar
cpes seguretst el
local

Pel que fa a les informacions i continguts de les revistes, no hi ha ms remei que introduirlos a m, si no es vol esperar a tindre tota la feina de OCR feta (que comportar fora
temps si la feina noms la fan voluntaris), on llavors si es podria agafar aquest contingut
duna forma ms automatitzada. Per tant la feina a fer de forma resumida i esquemtica
seria:

Transcriure els titulars


i subtitulars de les
portades.
(en document de text
Word o Openoffice)

Transformar aquest text


en HTML (en una llista de
definici amb estil)

Publicar
al web

Transcriure els ttols


articles, autor i plana dels
ndex o sumari.
(en document Word o
Openoffice) Transcriure
els ttols articles, autor i
plana dels ndex o sumari.
(en document Word o
Openoffice)

Transformar aquest text


en HTML (en una llista
desordenada inbricada
amb estil)

Publicar
al web

*Per crear el HTML es pot crear un script que mitjanant la introducci del text en camps de
formulari en transformi aquest en tags HTML amb estil automticament.

Estimaci temps i fases del treball


A mode aproximat shan de digitalitzar unes 400 revistes. Si tamb de mode aproximat
calculem que cada revista t de mitjana unes 24 pgines (en algunes seran menys per en
la majoria ms) tenim que:
400 revistes x 24 pgines mitjana cada revista = 9600 planes a escanejar aproximadament
(segurament ms)
- Si compten que en 1 hora podrem escanejar 40 planes (a ra de 1 min 30 per plana,
tenint en compte que lassociaci no t escners professionals que vagin molt rpids i que
shan descanejar a alta resoluci). En 1 dia poden escanejar 320 planes, en 1 setmana
1600 planes i per tant poden estimar que en 6 setmanes, podem escanejar totes les
revistes amb una dedicaci de 40 hores setmanals.
- Pel que fa a la transcripci dels texts de les portades (titulars i subtitulars) i els texts
dels ndexs i sumaris, un clcul aproximat geners de 15 min/revista. Per tant en 1 hora
4 revistes, en 1 dia 32 revistes, en una setmana 160 revistes. Per tant duns 20 a 30 dies
a completar les 400 revistes.
- Pel que fa a la maquetaci de les revistes en PDF, a partir de les imatges escanejades,
compten que en 15 min tindrem muntada una revista amb Indesign i per tant amb el

mateix clcul que en la transcripci dels texts necessitarem uns 30 dies per la maquetaci
de les 400 revistes.
Si a ms a ms volem convertir en text les imatges escanejades (amb programari OCR)
podrien aplicar els mateixos clculs aproximats que en el cas de lescaneig, per tenint en
compte que haurem de repassar els texts dun a un, ja que en molts casos sn tipografies
manuscrites de baixa qualitat i al programari li costar reconixer els carcters i hi hauran
errors que shauran de corregir a m comparant amb la imatge original de lescaneig. Aix
doncs compten uns 4 min per plana, unes 15 planes per hora, unes 120 planes per dia,
600 planes per setmana o sigui en total unes 16 setmanes, uns 4 mesos.
En total podem comptar amb uns 7 mesos de feina.
*Tots els clculs sn aproximats i comptant 8 h/dia 5 dies setmana de dedicaci.

Metodologia del treball i optimitzaci del temps


Per tal doptimitzar el temps dels treballs es proposa la segent metodologia i fases del
treball:
1. Escanejar planes
Seria el primer treball a realitzar i es faria seguit fins a finalitzar totalment.
2. Muntar PDFs amb les imatges
Fer la maquetaci dels PDFs amb les imatges escanejades (amb aquests PDFs no es
podrien fer recerques per ja es podrien penjar a la web i serien iguals en aparena que
els originals).
3. Publicar els PDFs a la web
Amb els PDFs ja muntats es podrien publicar a la web. Caldria tamb crear una imatge
de la portada optimitzada de 375px amb compressi jpeg. (en aquest punt encara ho hi
haur cap informaci textual a la web per fer recerques, per ja estarien tots els nmeros
publicats amb la seva portada corresponent).
4. Transcripci text portades i sumari
Caldria fer la transcripci de tots els texts de portada i sumari i transformar-los a
HTML.
5. Publicar text al web
Amb tot el text ja transcrit, ja noms caldria inclourel al nmero que correspongui,
perqu cada fitxa de cada nmero tingui text i per tant es puguin fer recerques
efectivament.
6. Transformar imatges en text (OCR)
Finalment a partir de les imatges i PDFs, transformar aquests (intentant mantenir
estructura i disseny dels originals) en PDFs amb text inserit i que es pugui realitzar
recerques per ell. (aquest seria un PDF complementari al que ja hi ha publicat a la web).

Ordre i noms darxius i directoris


Es proposa la segent estructura de directoris i noms darxius (exemple):
Revista
Artesenc 01

scans

artesenc01-plana1.tiff
artesenc02-plana2.tiff
Etc..

PDF

Texts

OCR

artesenc01.indd
artesenc01.pdf

artesenc01-portada.odt
artesenc01-sumari.odt

planes

artesenc01-plana1.odt
artesenc01-plana2.odt
Etc..

web

artesenc01-ocr.indd
artesenc01-ocr.pdf

artesenc01-portada.jpeg

* A partir dels texts corregits i de les imatges s munta el PDF amb els texts editables, respectant
lestructura i el disseny de loriginal tant com es pugui. (tenint en compte que en revistes antigues
hi haur fons tipogrfiques manuscrites).(soptar per una font tipogrfica genrica, per
respectant estructura de columnes, ordre, disseny, grfics, etc..de loriginal).
*Tamb shaur de guardar una imatge optimitzada en jpeg a 72ppp amb una mida reduda (a
la mida optimitzada per la web, uns 375px dample) amb el fi dutilitzar-les per a publicar a la
web com imatges de les portades. (aquest treball es pot realitzar per lots amb el Photoshop pel
que amb 2 dies pot estar fet)

Recursos necessaris
Pel que fa als recursos fsics necessaris, podem comptar amb els 3 ordinadors de lassociaci,
2 discos durs externs de 1Tb cadasc, lescner i les impressores a ms a ms de les taules
de treball i de totes les revistes fsiques que estan all catalogades en les estanteries.

Espai disc dur documents


Tenint en compte que totes les revistes sn en format A4 i que sescanejaran a tot color
(tot i que una part de revistes sn en blan i negre) a 300ppp, tindrem que cada imatge
escanejada pesar uns 24Mb. Per tant si multipliquem per 9600 documents a escanejar
tindrem 230400 Mb despai necessari pels escners. Uns 225GB.
Pel que fa als PDFs en baixa resoluci per penjar a la web, uns 10Mb x 400 revistes =
4000 Mb uns 3,9 GB
Pel que fa als documents de text seria molt poc, aproximadament uns 9Kb per document
x 800 documents = 7200 Kb uns 7Mb
I els documents de text per OCR 9Kb x 9600 = 86400 Kb = uns 84 Mb
I els documents Indesign uns 30Mb/ revista x 400 = 12000 Mb = uns 11 Gb al igual que
els documents Indesign amb els PDF amb OCR uns 11 Gb tamb.
Per tant podem concloure que en tindrem prou amb uns 300 GB despai en disc.

Backups en el procs de treball


A la fi dassegurar el treball en el procs daquest, es proposa a part de guardar les dades
en lordinador on es treballi, fer una cpia incremental en un disc dur extern cada dia al
finalitzar el treball.
Pel que fa a la web els backups de seguretat ja se nencarrega el superadministrador i les
guarda al nvol. A part el mateix servei de hosting guarda cpies de seguretat cada dia.

10

6.Punts forts i punts dbils


Anlisis extern
Quines sn les oportunitats que ofereix lentorn i com es poden
aprofitar?
Actualment en el poble existeix molta documentaci escrita i fotogrfica que est escampada
per diferents locals i localitzacions i que no est digitalitzada, i per tant lnica manera de
consultar-la s fsicament (a part del perill de deteriorament o destrucci). Per tant es creu
una bona oportunitat oferir digitalitzar aquests continguts i possiblement daltres en el
futur com: larxiu fotogrfic Amadeu Quintana, programes de la fira i de la festa major, etc..
perqu tothom pugui consultar-los a travs de les noves tecnologies com a servei al b com
i per tant sembla lgic pensar en possibles ajudes pbliques per a tirar el projecte a bon port.
Per altra part la revista t un bon nombre danunciants i subscriptors que financien
els costos daquesta, per amb la nova web de la revista guanyaria notorietat al poble i
segurament ms anunciants i ms subscriptors. Tamb es poden crear noves frmules de
publicitat mitjanant la web.

Quin tipus damenaces exteriors hi ha i com es poden enviar o


eliminar?
Una de les amenaces pot ser laparici en el futur de noves tecnologies que facin obsolescent
el format digital PDF (aix noms s una hiptesi). No obstant el fet de digitalitzar els
continguts fa que lgicament laparici de les noves tecnologies vindran acompanyades
tamb lgicament duna forma de migrar aquests continguts si sn digitals duna manera
senzilla, pel que no resulta un problema gaire important.
Un altre problema que es detecta s la problemtica dels drets dautor. Est clar que totes
les publicacions que parlen sn una propietat collectiva (de lassociaci, de lajuntament
i en ltima instncia del poble). A lassociaci, no preocupa gaire que la gent faci servir
aquests materials, i de fet s la motivaci del projecte, per que passaria per exemple si un
tercer fes servir algun daquests materials per algun projecte comercial i aquest tingus
xit i alg altre en reclams drets dautor?.
Aquest s un tema complex, i el que es proposa s acollir-se a alguna llicncia Creative
Commons (per la seva senzillesa) on simpeds de forma clara utilitzar els materials per
a projectes comercials i atribuir-sen lautoria i citar-ne la font (o sigui lassociaci) per a
protegir-nos una mica.

11

Anlisis intern
Quines sn les fortaleses del projecte i com es poden potenciar?
El projecte oferir un servei real dinformaci de lpoca contempornia de la vila dArts,
mitjanant la histria escrita a travs de diferents publicacions. Ser un espai centralitzat
i accessible a tothom que ho vulgui consultar. A ms a ms permetr a lassociaci i a la
revista actual ser un referent en la informaci local i dels pobles del voltant. Pesem que no
hi ha cap daltre mitj de comunicaci local desprs de la desaparici de TV Arts i de la
rdio, ni a la vila ni als pobles del costat ms petits.
En laspecte intern tamb ser un bon mitj per organitzar i catalogar les informacions.
Pesem per exemple, que els redactors moltes vegades tenen problemes per trobar articles
que shan escrit en el passat o fotos concretes que es reaprofiten per a altres articles.
La web en si, tamb pot ser un bon mitj per a potenciar les comunicacions internes com:
reunions, coordinaci dels continguts, coordinaci dels correctors, etc..

Definici objectius a partir de DAFO


Oportunitats
Possible suport de lajuntament,
diputaci, en subvencions o pla
docupaci..
Ser referent al poble i tota la comarca
en la difusi de revistes histriques.
Ms notorietat de la revista que
la faci ms atractiva de cara als
anunciants.

Externs

Amenaces

12

Falta de suport de les institucions per


manca de pressupost.
Obsolescncia dalgunes tecnologies
per laparici de noves.
Apropiaci de continguts per part de
tercers o modificaci daquests
Prdues dinformaci per fallades
informtiques o errada humana.

Interns
Fortaleses
Desig de lassociaci de millorar i
modernitzar la seva imatge.
Continguts interns ms ben
catalogats.
Digitalitzaci de continguts

Opcions de fortaleses i
oportunitats
Demanar ms subvenci a
lajuntament
Possibilitat dacollir-se a pla
docupaci per la contractaci de
treballador.
Difondre la web perqu ms
anunciants estiguin interessats a
anunciar-se.

Debilitats
Molta feina alhora de digitalitzar
que no poden assumir tan sols els
voluntaris.
Voluntaris poc formats en les noves
tecnologies.
Bastant dependents dajuda pblica
perqu el projecte no sallargui massa.

Opcions de debilitats i
oportunitats
Formar alguns voluntaris per la
inserci de continguts al web.
Intentar convncer lajuntament
de la necessitat de tenir tot aquest
material digitalitzat (treballs de recerca
alumnes institut, etc..)
Intentar seduir nous anunciants per
incrementar els ingressos.

Opcions fortaleses i amenaces

Opcions debilitats amenaces

Estar preparats per nous formats


digitals que puguin sorgir.
Declaraci de llicncia Creative
Commons a les publicacions de la web.
Poltica de backups. de la web i dels
arxius digitals en diferents plataformes
i suports (Cloud, disc dur, DVD)

Intentar ser realistes i si no hi ha


un pla docupaci anar introduint els
continguts antics paulatinament.
Anar formant a la gent de lassociaci
i voluntaris en ls de les noves
tecnologies i sobretot en ls del CMS

7. Conclusions
Les conclusions que poden arribar en lmbit documental, s que ser senzill de gestionar
per part dels publicadors la inserci dels continguts, tenint en compte que la revista s
trimestral i per tant i per tan sols es necessita actualitzar els continguts cada 3 mesos pel
que fa la revista actual (recordem que la revista en curs tan sols es mostrar la portada i
ndex de continguts, no la descarrega, que no estar disponible fins a la prxima edici).
En lmbit dindexaci de continguts tampoc ser complicat, ja que els mateixos
maquetadors de la revista impresa exportaran tamb el PDF per ledici online per
descarregar i lndex de continguts que es generar automticament amb larxiu font de
maquetaci.
Per altra banda per introduir tot el contingut dedicions anteriors i de revistes antigues,
es veu molt difcil tindrel a punt en poc temps, si no es contracta ning per fer-ho en un
temps determinat.

8. Bibliografia
Mases, Blanch Noem. Duran i de Haro, Pau. [arxiu pdf] Documentaci audiovisual Documentaci en la creaci, producci i difusi de continguts multimdia.
Duran de Haro, Pau. Camps daplicaci: casos destudi [en lnea]. http://materials.cv.uoc.
edu/continguts/PID_00202576/index.html?ajax=true.
Colaboradores de Wikipedia. Anlisis DAFO [en lnea]. Wikipedia, La enciclopedia libre,
2014 [fecha de consulta: 19 de diciembre del 2014]. Disponible en <http://es.wikipedia.
org/w/index.php?title=An%C3%A1lisis_DAFO&oldid=78658779>.
Licencias Creative Commons [en lnea]. [fecha de consulta: 19 de diciembre del 2014]
http://es.creativecommons.org/blog/licencias/

13

Potrebbero piacerti anche